Какой статистический тест я должен использовать, чтобы определить точку мутации на хромосомах?
Я пытаюсь определить точки мутации в раковых геномах. Один из подходов, который я выбрал, состоял в том, чтобы использовать скользящее окно (окно 2 КБ, перемещаться по хромосоме со скоростью 200 б.п. за шаг, поэтому окно 1 и окно 2 перекрываются на 90%) для подсчета количества мутаций в полной когорте (например, 100 пациентов). Затем я использую пороговое значение (>10-кратное среднее значение мутаций в окне), чтобы подобрать эти потенциальные точки доступа. Мой вопрос - как я могу назначить значение ap для каждой потенциальной точки доступа. какой тест я должен использовать?
я думаю, может быть, я мог бы просто предположить, что мутации случайно распределены по хромосоме. таким образом, ожидаемое количество - это среднее число мутаций в интервале 2 КБ, например, окно 10 мутаций /2 КБ.
теперь у меня есть 10 потенциальных областей горячих точек, какой тест даст мне значение ap для каждой горячей точки, которое указывает вероятность того, что каждая область будет горячей точкой. данные будут выглядеть следующим образом: точка доступа, хромосома, start_end, seen_mutation_count, ожидаемое_счетное число hotspot1, chr1, 2000-4000, 50, 30 hotspot2, chr1, 12000-14000, 70, 30 hotspot3, chr5, 222000-224000, 100, 30 .....