Как преобразовать данные SeattleSNP в формат ввода fastPHASR?
все. Я студент четвертого курса статистики, который очень увлечен и интересуется статистической генетикой и геномикой. Я сам пробую выполнить небольшой проект по вменению, но столкнулся с проблемой. Я хочу оценить точность вменения FastPhase с небольшим количеством SNP. Но я не очень хорошо знаком с форматом набора данных.
Я загрузил SNP для хромосомы 6 (текстовый файл с разделителями табуляцией): Ниже приведены первые 6 строк:
137505903-IL22RA2-6 D001 CC 137505903-IL22RA2-6 D002 CC 137505903-IL22RA2-6 D003 CC 137505903-IL22RA2-6 D004 CC 137505903-IL22RA2-6 D005 CC 137505903-IL22RA2-6 D006 CC
На сайте написано: Формат строки:
Но тогда я не понимаю, как я могу преобразовать его в формат ввода быстрой фазы. Как я мог узнать, какой из них 0, а какой 1, я знаю, что гомозиготный: 0, гетерозиготный, 1 гомозиготный по менее частому аллелю, 2. Но я не уверен, как определить здесь, и меня смущает, что есть только Allele1 и Allele2, но не что-то вроде 0,1,0,1,1,1,0, .. (строка). Потому что я помню, что формат ввода обычно представляет собой длинную строку формата.
Большое спасибо.