В файл ткацкого станка, созданный с помощью velocyto.py, не включены митохондриальные гены.
Я передаю файл 10X BAM в файл ткацкого станка с помощью velocyto.py и использую Scanpy для кластеризации ячеек. Однако при обработке данных с помощью Scanpy я обнаружил, что в файле ткацкого станка нет генов мито, см. Ниже. введите описание изображения здесь
При запуске velocyto.py он показывает: «ПРЕДУПРЕЖДЕНИЕ - файл .bam относится к хромосоме« MT+ », отсутствующей в файле аннотации (.gtf)» «ПРЕДУПРЕЖДЕНИЕ - файл .bam относится к хромосоме« MT- », но не присутствует в файле аннотации (.gtf) "
Файл BAM взят из 10X, созданного Cell Ranger v3.1. Эталонный геном - refdata-gex-mm10-2020-A.tar.gz от 10X. Повторяющийся файл аннотации - mm10_rmsk.gtf от UCSC.
Это потому, что Cell ranger v3.1 слишком стар и не имеет того же имени хромосомы, что и refdata-gex-mm10-2020-A.tar.gz и mm10_rmsk.gtf? Но когда я проверял имена хромосом в BAM, я обнаружил, что это ChrM, то же самое, что refdata-gex-mm10-2020-A.tar.gz и mm10_rmsk.gtf? Тогда почему подсказка показывает, что файл .bam относится к хромосоме «MT-»?
Вот код для проверки имен хромосом в bam.$ samtools view /home/hyjforesight/mybam.bam | вырезать -f3 | perl -ne 'печатать, если $ не видно {$_}++' - chr1 chr10 chr11 chr12chr13chr14chr15chr16chr17chr18chr19chr2chr3chr4chr5chr6chr7chr8chr9chrMchrXchrY