Данные в Mbox в JSON или CSV?

Я только что загрузил всю свою почту Gmail с новой функцией загрузки из Google, и она дает мне большой файл.mbox. Какой будет основная оболочка скрипта для начала извлечения и обработки отдельных писем из файла?

2 ответа

Книга Мэтью Рассела "О разработке социальной сети" (О'Рейли, 2-е изд.) Дает некоторый код для этого на Python. Его код на github. Вам понадобятся файлы с префиксом "mailbox". https://github.com/ptwobrussell/Mining-the-Social-Web/tree/master/python_code

Ознакомьтесь с этим репозиторием GitHub — https://github.com/PS1607/mbox-to-json.

Также извлекает вложения для вас.

Если вы хотите вместо этого преобразовать его в CSV, измените строку 55 в src/main.py сdf.to_jsonкdf.to_csv

Другие вопросы по тегам