Данные в Mbox в JSON или CSV?
Я только что загрузил всю свою почту Gmail с новой функцией загрузки из Google, и она дает мне большой файл.mbox. Какой будет основная оболочка скрипта для начала извлечения и обработки отдельных писем из файла?
2 ответа
Книга Мэтью Рассела "О разработке социальной сети" (О'Рейли, 2-е изд.) Дает некоторый код для этого на Python. Его код на github. Вам понадобятся файлы с префиксом "mailbox". https://github.com/ptwobrussell/Mining-the-Social-Web/tree/master/python_code
Ознакомьтесь с этим репозиторием GitHub — https://github.com/PS1607/mbox-to-json.
Также извлекает вложения для вас.
Если вы хотите вместо этого преобразовать его в CSV, измените строку 55 в src/main.py сdf.to_json
кdf.to_csv