Как построить искусственную нейронную сеть, используя высокомерный набор геномных данных, используя python и базы данных?
Я новичок в глубоких и машинных исследованиях и у меня есть вопрос о моем наборе данных. В настоящее время я работаю с Искусственной нейронной сетью (ANN), чтобы предсказать гены, регулируемые конкретными явлениями в геноме человека. Я хотел бы обучить ANN распознавать эти области в геноме, используя множественные наборы данных.
Итак, у меня есть таблица со следующими функциями в каждом столбце: Столбец 1 - имя_генера Столбец 2 - Элемент 1 Столбец 3 - Элемент 2 Столбец 4 - Элемент 3 Столбец 5 - Элемент 4 Столбец 6 - Элемент 5 Столбец 7 - Элемент 6 .. Столбец n - Элемент n
Тем не менее, каждая особенность соответствует новой таблице в каждом гене. Например, давайте предположим, что первый ген имеет длину 100 п.н. (пары оснований), для первого гена в признаках 1, 2, 3 и т. Д. У меня есть 100 экземпляров этого признака по одному в каждой позиции гена. Если второй генный газ 220 бп, у меня будет 220 точек информации для каждой колонки Feature и так далее.
Это означает, что каждый ген имеет информацию для всех признаков столбца, тем не менее, учитывая, что гены имеют разную длину, количество информации для каждой строки различно.
Поэтому первая таблица - это просто некая "база данных", которая дает доступ к информации о каждом гене.
Я хотел бы знать, как я могу применить и обучить ANN в этой структуре таблицы? Возможно ли это или я должен преобразовать эту структуру в другую? Как я могу это сделать?
С наилучшими пожеланиями,