Как преобразовать отфильтрованные полиморфные сайты (в формате fasta) в двоичную матрицу в R?
Заранее спасибо за вашу помощь...
Я хочу создать двоичную матрицу из отфильтрованных полиморфных сайтов. У меня есть сборки WGS в формате fasta, по одному файлу на каждую секвенированную последовательность (всего 131 файл fasta).
Например, файл fasta содержит x количество элементов, каждый из которых имеет разную длину. Используя пакет seqinr, файл читается, как показано ниже, с количеством узлов, соответствующих количеству элементов в каждом файле;
fasta1 $ Node_1_length_179262_cov_53.4208_ID_3720: класс 'SeqFastadna' a a t c...
fasta1$Node_2_length_151612_cov_41.7317_ID_3726: класс 'SeqFastadna' по...
У меня также есть документ Excel, содержащий отфильтрованные_полиморфные_сайты (полиморфные локусы, найденные в анализе wgMLST со всеми локусами, подлежащими рекомбинации, отфильтрованы)(выполненный Губбинсом). например, изолят 1: CGTGAGCCGCGG-AGCCAATAGGGTCAGTGCGGTCGCTGCGGGGTGAACGGCGCAAGCTTTGTCACGCCGGATGGAAGTATGGCCCAGAATTGTTTTTTTATGCGGGCGGGGCTGGCACGAGAAAGGGC
Изолировать 2: CGTGAGCCGCGG-AGCCAATAGGGTCAGTGCGGTCGCTGCGGGGTGAACGGCGCAAGCTTTGTCACACCGGATGGAAGTATGGCCCAGAATTGTTTTTTTATTCGGGCGGGGCTGGCACAAGAAGCGGC
Я бы предпочел сделать это в R, так что если бы вы могли предложить R-пакет, это было бы замечательно, однако все предложения приветствуются.
Большое спасибо!!