Как загрузить вложение формата файла outlook item (.msg) в таблицу кустов?
Прежде всего, я использую Microsoft Azure HDinsight Hadoop.
У меня есть вложения MSG-файлов (формат почтовых сообщений для Outlook). Я уже загружаю их в хранилище больших двоичных объектов, но не могу загрузить их в созданную мной таблицу. Есть ли способ, которым я могу загрузить их в существующую таблицу? Любой совет поможет. Огромное спасибо заранее.
1 ответ
Hive не понимает формат MSG, поэтому вам нужно будет прочитать его как строку, а затем написать запрос для чтения из хранилища BLOB-объектов, а затем вставить его в таблицу. Вы можете использовать пробел в качестве разделителя и / или написать свой собственный экстрактор, используя Java или Python, чтобы вставить его в таблицу.