Описание тега hail
Hail - это универсальная библиотека анализа данных на основе Python с открытым исходным кодом, содержащая дополнительные типы данных и методы для работы с геномными данными.
2
ответа
Проблемы с Hail0.2 при работе с Azure DataBrick
Здравствуйте? Кто-нибудь может помочь для Hail 0.2 в Azure DataBrick? После установки pip возникло много проблем.... не могу найти пакет Java, импортировать hail.plot, hl.init() Согласно документу https://docs.azuredatabricks.net/applications/genomi…
15 окт '19 в 06:35
1
ответ
Использование ipython в другой учетной записи Linux: команда застревает
Я установил miniconda3 на одной учетной записи Linux, затем я создал среду py37, установил все необходимые пакеты и смог запустить ipython из второй учетной записи и импортируйте пакет, который я хотел импортировать: hail. Для этого я изменил все ра…
19 ноя '19 в 01:13
1
ответ
Запустить задачу Луиджи, которая зависит от другой задачи
У меня одна задача SeqrMTToESTask это зависит от другого по имени SeqrVCFToMTTask. Вы можете увидеть полный код здесь: https://github.com/macarthur-lab/hail-elasticsearch-pipelines/blob/master/luigi_pipeline/seqr_loading.py Теперь я запустил первую …
28 ноя '19 в 02:19
1
ответ
Доступ к другому типу предустановленного целевого местоположения в Луиджи
У меня есть luigiтрубопровод. Есть файл, гдеGoogle Cloud устанавливается как целевое местоположение: https://github.com/macarthur-lab/hail-elasticsearch-pipelines/blob/d6e9dedbce929c04c294c54095663ba94a4de3f0/luigi_pipeline/lib/hail_tasks.py Теперь …
26 ноя '19 в 19:08
0
ответов
java.io.IOException: поток закрыт! Ошибка в HDInsight с ADLS Gen 2
Изначально я разместил это в системе вопросов и ответов Microsoft по этой ссылке.но, похоже, его не признают или не рассматривают, и подумал, что здесь может быть лучшая обратная связь по SO. В настоящее время я использую Hail для библиотеки pyspark…
30 июн '20 в 15:56
0
ответов
Используйте Hail в Python IDE, например PyCharm
Я пытался использовать hail в pycharm для выполнения GWAS. Я установил hail, и он работает в терминале, но в pycharm он показывает "нет модуля с именем hail". Есть ли способ использовать град в пичарме? Может ли кто-нибудь помочь с этим? Спасибо.
12 июл '20 в 04:02
1
ответ
hail.utils.java.FatalError: IllegalStateException: данные непрочитанного блока
Я пытаюсь запустить базовый скрипт на искровом кластере, который принимает файл, преобразует его и выводит в другом формате. В настоящий момент искровой кластер состоит из 1 ведущего и 1 ведомого, работающих на одном узле. Полная команда: nohup spar…
21 ноя '19 в 01:45
0
ответов
Без использования pandas отключите научную нотацию в python
Я использую пакет Python под названием hail который используется для анализа геномных данных. анализ геномных данных с использованием файлов VCF, которые содержат данные в нескольких столбцах, как показано ниже AF MAF R2 0.0024 0.0024 0.00038 0.0024…
04 сен '20 в 09:26
2
ответа
Ошибка spark-submit: недопустимый максимальный размер кучи: -Xmx4g--jars, но в системе достаточно памяти
Я запускаю искровую работу: spark-submit --master spark://ai-grisnodedev1:7077 --verbose --conf spark.driver.port=40065 --driver-memory 4g --jars /opt/seqr/.conda/envs/py37/lib/python3.7/site-packages/hail/hail-all-spark.jar --conf spark.driver.extr…
11 фев '20 в 03:42
1
ответ
Объедините несколько файлов VCF в один большой файл VCF
У меня есть список файлов VCF определенной национальности, например американских индейцев, китайцев, европейцев и т. Д. Для каждой национальности у меня есть около 100+ файлов. В настоящее время я вычислил VARIANT QC такие показатели, как call_rate,…
08 сен '20 в 16:53
2
ответа
Анализируйте файлы .bgen с помощью HAIL без загрузки данных на одном узле
Я пытаюсь проанализировать геномные данные, которые доставляются в формате.bgen в Spark DF с помощью HAIL. Размер файла составляет 150 ГБ, и он не поместится в один узел моего кластера. Мне интересно, есть ли потоковые команды / способы для анализа …
10 сен '20 в 13:28
0
ответов
Не удалось найти класс внутреннего ведения журнала: java.lang.NoClassDefFoundError: org/apache/spark/internal/Logging$class
Я пытаюсь создать искровой кластер на платформе DNAnexus . Я попытался создать искровой контекст из блокнота jupyterlab. import pyspark sc = pyspark.SparkContext() spark = pyspark.sql.SparkSession(sc) Я получаю следующую трассировку стека ошибок. Py…
16 мар '22 в 11:44