Извлечение особей с помощью Plink. Ошибка: строка 1 файла --keep содержит меньше токенов, чем ожидалось

У меня есть файлы с 2504 людьми из проекта 1000 геномов, и я хочу отфильтровать по населению. Я сделал следующее для первой популяции (ACB):

plink --file all1000gen --keep indACB.txt --make-bed --out all1000genACB

но это возвращает следующую ошибку:

Error: Line 1 of --keep file has fewer tokens than expected.

мой файл indACB.txt выглядит так:

head indACB.txt 
HG01879
HG01880
HG01882
HG01883
HG01885
HG01886
HG01889
HG01890
HG01894
HG01896

который я сделал (для каждой популяции, используя grep) из файла информации о популяции, который доступен на странице 1000 геномов, который имеет два раза индивидуальный идентификатор (первые два столбца) и один с названием популяции, как показано:

head indpop2.txt
HG00096 HG00096 GBR
HG00097 HG00097 GBR
HG00099 HG00099 GBR
HG00100 HG00100 GBR
HG00101 HG00101 GBR
HG00102 HG00102 GBR
HG00103 HG00103 GBR
HG00105 HG00105 GBR
HG00106 HG00106 GBR
HG00107 HG00107 GBR

Я думаю, что есть проблема с моим файлом --keep, но я не уверен, какова требуемая структура txt файла.

Я также попытался отобрать людей ACB из indpop2.txt, поэтому новый файл indACB.txt выглядит так:

head indACB2.txt 
HG01879 HG01879 ACB
HG01880 HG01880 ACB
HG01882 HG01882 ACB
HG01883 HG01883 ACB
HG01885 HG01885 ACB
HG01886 HG01886 ACB
HG01889 HG01889 ACB
HG01890 HG01890 ACB
HG01894 HG01894 ACB
HG01896 HG01896 ACB

Но это приводит к следующей ошибке:

plink --file allconcat39 --keep indACB2.txt --make-bed --out allconcat43ACB

Error: No people remaining after --keep.

1 ответ

Первые два столбца - это семейные и индивидуальные идентификаторы; третий столбец, как ожидается, будет числовым значением (хотя файл может иметь более 3 столбцов), и только отдельные лица, для которых это значение равно 1, будут включены в любой последующий анализ или процедуру создания файла.

Другие вопросы по тегам