как получить rsID SNP по номеру и положению хромосомы

Чтобы обновить идентификатор SNP моего файла сводной статистики, у меня есть несколько вопросов: Во-первых, я создал текстовый файл из файла сводной статистики со следующей информацией: 1 1118275 vh_1_1108138 GA 1 1120431 vh_1_1110294 AG1 1135242 rs9729550 CA 1 1140435 rs1815606 AC 1 1163804 rs7515488 AG 1 1165310 rs11260562 AG 1 1173611 rs6697886 AG1 1186502 rs6603785 TA 1 1194804 rs11804831 GA 1 1218086 rs6603788 AG

Мне нужно обновить rsID, чтобы иметь согласованный формат (как вы видите, у некоторых есть формат vh_..). Затем я загрузил dbsnp vcf и выбрал следующие столбцы

1 10019 rs775809821 TA T 1 10039 rs978760828 AC1 10043 rs1008829651 TA 1 10051 rs1052373574 AG 1 10051 rs1326880612 A AC 1 10055 rs768019142 T TA 1 10055 rs892501864 TATA 1 10063 rs1010989343 ACCCCAC51003 Rs892501864 TATA 1 10063 rs1010989343 CC

Мне было интересно, как я могу объединить столбцы для обновления rsID в первом текстовом файле? 2) Я заметил, что второй столбец имеет другой формат (положение хромосомы). Я не знаю, вызывает ли это проблему. Если да, то как я могу его тоже обновить. Я ценю любую помощь

0 ответов

Другие вопросы по тегам