Описание тега hail

Вопросы с тегом

Hail - это универсальная библиотека анализа данных на основе Python с открытым исходным кодом, содержащая дополнительные типы данных и методы для работы с геномными данными.

2 ответа

Проблемы с Hail0.2 при работе с Azure DataBrick

Здравствуйте? Кто-нибудь может помочь для Hail 0.2 в Azure DataBrick? После установки pip возникло много проблем.... не могу найти пакет Java, импортировать hail.plot, hl.init() Согласно документу https://docs.azuredatabricks.net/applications/genomi…

15 окт '19 в 06:35

1 ответ

Использование ipython в другой учетной записи Linux: команда застревает

Я установил miniconda3 на одной учетной записи Linux, затем я создал среду py37, установил все необходимые пакеты и смог запустить ipython из второй учетной записи и импортируйте пакет, который я хотел импортировать: hail. Для этого я изменил все ра…

linux apache-spark permissions miniconda hail

19 ноя '19 в 01:13

1 ответ

Запустить задачу Луиджи, которая зависит от другой задачи

У меня одна задача SeqrMTToESTask это зависит от другого по имени SeqrVCFToMTTask. Вы можете увидеть полный код здесь: https://github.com/macarthur-lab/hail-elasticsearch-pipelines/blob/master/luigi_pipeline/seqr_loading.py Теперь я запустил первую …

apache-spark luigi hail

28 ноя '19 в 02:19

1 ответ

Доступ к другому типу предустановленного целевого местоположения в Луиджи

У меня есть luigiтрубопровод. Есть файл, гдеGoogle Cloud устанавливается как целевое местоположение: https://github.com/macarthur-lab/hail-elasticsearch-pipelines/blob/d6e9dedbce929c04c294c54095663ba94a4de3f0/luigi_pipeline/lib/hail_tasks.py Теперь …

apache-spark luigi hail

26 ноя '19 в 19:08

0 ответов

java.io.IOException: поток закрыт! Ошибка в HDInsight с ADLS Gen 2

Изначально я разместил это в системе вопросов и ответов Microsoft по этой ссылке.но, похоже, его не признают или не рассматривают, и подумал, что здесь может быть лучшая обратная связь по SO. В настоящее время я использую Hail для библиотеки pyspark…

java hadoop azure-hdinsight azure-data-lake-gen2 hail

30 июн '20 в 15:56

0 ответов

Используйте Hail в Python IDE, например PyCharm

Я пытался использовать hail в pycharm для выполнения GWAS. Я установил hail, и он работает в терминале, но в pycharm он показывает "нет модуля с именем hail". Есть ли способ использовать град в пичарме? Может ли кто-нибудь помочь с этим? Спасибо.

python hail

12 июл '20 в 04:02

1 ответ

hail.utils.java.FatalError: IllegalStateException: данные непрочитанного блока

Я пытаюсь запустить базовый скрипт на искровом кластере, который принимает файл, преобразует его и выводит в другом формате. В настоящий момент искровой кластер состоит из 1 ведущего и 1 ведомого, работающих на одном узле. Полная команда: nohup spar…

java apache-spark master-slave hail

21 ноя '19 в 01:45

0 ответов

Без использования pandas отключите научную нотацию в python

Я использую пакет Python под названием hail который используется для анализа геномных данных. анализ геномных данных с использованием файлов VCF, которые содержат данные в нескольких столбцах, как показано ниже AF MAF R2 0.0024 0.0024 0.00038 0.0024…

python python-3.x vcftools hail

04 сен '20 в 09:26

2 ответа

Ошибка spark-submit: недопустимый максимальный размер кучи: -Xmx4g--jars, но в системе достаточно памяти

Я запускаю искровую работу: spark-submit --master spark://ai-grisnodedev1:7077 --verbose --conf spark.driver.port=40065 --driver-memory 4g --jars /opt/seqr/.conda/envs/py37/lib/python3.7/site-packages/hail/hail-all-spark.jar --conf spark.driver.extr…

java apache-spark hail

11 фев '20 в 03:42

1 ответ

Объедините несколько файлов VCF в один большой файл VCF

У меня есть список файлов VCF определенной национальности, например американских индейцев, китайцев, европейцев и т. Д. Для каждой национальности у меня есть около 100+ файлов. В настоящее время я вычислил VARIANT QC такие показатели, как call_rate,…

bioinformatics bcftools vcftools hail

08 сен '20 в 16:53

2 ответа

Анализируйте файлы .bgen с помощью HAIL без загрузки данных на одном узле

Я пытаюсь проанализировать геномные данные, которые доставляются в формате.bgen в Spark DF с помощью HAIL. Размер файла составляет 150 ГБ, и он не поместится в один узел моего кластера. Мне интересно, есть ли потоковые команды / способы для анализа …

spark-streaming genetics genome hail

10 сен '20 в 13:28

0 ответов

Не удалось найти класс внутреннего ведения журнала: java.lang.NoClassDefFoundError: org/apache/spark/internal/Logging$class

Я пытаюсь создать искровой кластер на платформе DNAnexus . Я попытался создать искровой контекст из блокнота jupyterlab. import pyspark sc = pyspark.SparkContext() spark = pyspark.sql.SparkSession(sc) Я получаю следующую трассировку стека ошибок. Py…

apache-spark pyspark gwas hail

16 мар '22 в 11:44