For issues relating to bz2 which is the file extension of compressed files by bzip2.
0 ответов

Anaconda терпит неудачу после зависания при установке Spyder в новую среду

У меня большие проблемы с (Ana)conda после попытки установить Spyder в новой среде! Я создал новую среду с conda create -n py37 -c anaconda python=3.7Анаконда зависла, когда я попытался установить Spyder в этой среде. Согласно " Как запустить Spyder…
10 янв '19 в 11:01
0 ответов

Прочитать простой /bz2-сжатый файл (строка за строкой), обнаружив, сжат он или нет (размер файла большой)

Я написал код для чтения simple-text/bz2-сжатых файлов. Я использовал магические символы файла bz2, чтобы определить, сжат файл или нет ПРИМЕЧАНИЕ. "Пользователь может или не может предоставить файл с соответствующим расширением" мой код #include &l…
08 мар '18 в 20:59
1 ответ

Скрытая семантическая индексация с помощью gensim

Чтобы использовать метод скрытой семантической индексации от gensim, я хочу начать с небольшого "классического" примера, такого как: import logging, gensim, bz2 id2word = gensim.corpora.Dictionary.load_from_text('wiki_en_wordids.txt') mm = gensim.co…
1 ответ

Извлечение.ppm.bz2 из пользовательского пути в пользовательский путь

Как видно из названия, у меня есть несколько папок, несколько файлов.ppm.bz2, и я хочу извлечь их именно там, где они используют Python. Структура каталогов изображения Я перехожу в папки, как это: import tarfile import os path = '/Users/ankitkumar/…
24 июл '18 в 17:42
2 ответа

Python3: записать строку в файл.txt.bz2

Я хочу записать результат объединения двумя списками в файл txt.bz2 (имя файла названо кодом, а не существует в начале). как следующая форма в текстовом файле. 1 a,b,c 0 d,f,g ....... Но есть ошибка. Мой код следующий, пожалуйста, дайте мне советы, …
27 фев '17 в 11:37
0 ответов

Python3 просит скачать bz2 сжатый файл json

Я пытаюсь использовать запросы в Python3 для загрузки сжатого файла BSON JSON. Я попытался записать response.content в файл, а также попытался получить response.raw и response.raw.read(). Я также пытался писать, используя shutil и bz2. Тем не менее,…
03 авг '18 в 18:53
1 ответ

Извлечение файла bz2 с одним файлом в памяти

У меня есть файл CSV, сжатый в файл BZ2, который я пытаюсь загрузить с веб-сайта, распаковать и записать в локальный файл CSV с помощью # Get zip file from website archive = StringIO() url_data = urllib2.urlopen(url) archive.write(url_data.read()) #…
20 ноя '15 в 00:02
1 ответ

Как распаковать.tar.bz2 в памяти с питоном

Как распаковать файл *.bz2 в память с помощью python? Файл bz2 происходит из файла csv. Я использую код ниже, чтобы распаковать его в памяти, он работает, но он приносит некоторые грязные данные, такие как имя файла csv и имя автора, есть ли другой …
19 сен '17 в 03:55
1 ответ

Последовательный компрессор Python bz2 создает недопустимый поток данных на низких уровнях сжатия

У меня есть ряд строк в списке под названием "линии", и я сжимаю их следующим образом: import bz2 compressor = bz2.BZ2Compressor(compressionLevel) for l in lines: compressor.compress(l) compressedData = compressor.flush() decompressedData = bz2.deco…
13 янв '17 в 21:29
1 ответ

Получение ошибки при шифровании пароля с использованием Python

Я получаю следующую ошибку при шифровании пароля с помощью bz2 модуль с использованием Python. Здесь я сохраняю это зашифрованное значение внутри БД. Ошибка: ProgrammingError at /signsave/ You must not use 8-bit bytestrings unless you use a text_fac…
10 июл '17 в 12:21
1 ответ

Распаковка файла bz2 завершается с ошибкой

До сих пор я пытался распаковать с помощью инструмента командной строки Mac bzip2 -dc, он выдает эту ошибку: "ошибка целостности данных mtf (CRC) в данных", я даже пытался восстановить файлы, используя bzip2recover Команда преобразует мой файл 4 МБ …
0 ответов

API-интерфейс Xcode, возвращающий bz2. Не удалось преобразовать в JSON с помощью распаковки

Сервер xcode возвращает покрытие в zz-файле bz2, который необходимо распаковать, чтобы выявить json. Я попытался с помощью плагина декомпрессии. Но не могу распаковать и получить JSON. ниже мой код попробовать. $http.get("my_coverage_link") .then(fu…
14 сен '17 в 10:19
0 ответов

Google Dataflow создает только один рабочий для большого файла.bz2

Я пытаюсь обработать дамп JSON из Викиданных, используя Cloud Dataflow. Я скачал файл с https://dumps.wikimedia.org/wikidatawiki/entities/latest-all.json.bz2 и поместил его в корзину GS. Это большой (50G) файл.bz2, содержащий список кодов json (по о…
11 окт '18 в 08:16
2 ответа

TypeError: open() получил неожиданный аргумент ключевого слова 'buffering'

Я пишу программу чата с python, и когда я запускаю свой код, я получаю следующую ошибку. Traceback (most recent call last): File "C:/Users/stephen/AppData/Local/Programs/Python/Python35/chatbot.py", line 97, in <module> with bz2.open("C:/RC_{}…
01 дек '17 в 03:08
3 ответа

Как получить время, необходимое для распаковки больших файлов bz2?

Мне нужно обрабатывать большие файлы bz2 (~6G), используя Python, распаковывая его построчно, используя BZ2File.readline(), Проблема в том, что я хочу знать, сколько времени нужно для обработки всего файла. Я провел много поисков, попытался определи…
08 фев '19 в 16:50
0 ответов

Эффективное потребление больших файлов bz2 в Spark

Есть ли способ эффективно загружать большие (например, 50 ГБ) файлы bz2 в Spark? Я использую Spark 1.6.1, 8 исполнителей с 30 ГБ оперативной памяти каждый. Изначально у каждого исполнителя было 4 ядра. Однако открытие файлов bz2 с помощью textFile()…
24 июн '16 в 19:00
1 ответ

Java Wget Bz2 file

Я пытаюсь сделать несколько файлов bz2 из Википедии, мне все равно, сохраняются ли они как bz2 или распакованы, так как я могу разархивировать их локально. Когда я звоню: public static void getZip(String theUrl, String filename) throws IOException {…
15 авг '15 в 11:32
1 ответ

Python BZ2 сжатие строки

>>> import bz2 >>> bz2.compress('hi') Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/Users/ryan/anaconda/lib/python3.4/bz2.py", line 498, in compress return comp.compress(data) + comp.flus…
23 дек '15 в 05:23
1 ответ

Распаковка всех.bz2 архивов в каталог

У меня есть каталог под названием "вход", полный подкаталогов, которые содержат несколько архивов bz2. Вот так: -input --folder1 ---archive1.bz2 ----archive1.content ---archive2.bz2 ----archive2.content ---archive3.bz2 ----archive3.content --folder2…
10 мар '18 в 07:08
2 ответа

Как я могу получить 10 первых строк всех моих сжатых файлов?

У меня есть куча M файлы, из которых я хочу извлечь первый N линии (от каждой). Мои файлы сжаты в BZ2. В противном случае, делая head -10 * было бы достаточно. Пример: Предположим, я хочу извлечь 2 первые строки из всех моих файлов (A.txt, B.txt, C.…
10 ноя '17 в 15:19