Как загрузить вложение формата файла outlook item (.msg) в таблицу кустов?

Прежде всего, я использую Microsoft Azure HDinsight Hadoop.

У меня есть вложения MSG-файлов (формат почтовых сообщений для Outlook). Я уже загружаю их в хранилище больших двоичных объектов, но не могу загрузить их в созданную мной таблицу. Есть ли способ, которым я могу загрузить их в существующую таблицу? Любой совет поможет. Огромное спасибо заранее.

1 ответ

Hive не понимает формат MSG, поэтому вам нужно будет прочитать его как строку, а затем написать запрос для чтения из хранилища BLOB-объектов, а затем вставить его в таблицу. Вы можете использовать пробел в качестве разделителя и / или написать свой собственный экстрактор, используя Java или Python, чтобы вставить его в таблицу.

Другие вопросы по тегам