Python: определить конкретный тип файла MS WORD
Чем я могу отличаться, с Python (2.7) для данного файла между doc
, docx
, docm
и в принципе любое другое расширение слова?
Я пытался с помощью magic
модуль, но то, что я получаю Microsoft Word 2007+
для обоих .doc
а также .docx
файлы (например).
Код:
import magic
res1 = magic.from_file("DOC_FILE")
res2 = magic.from_file("DOCX_FILE")
print res1 # prints "Microsoft Word 2007+"
print res2 # prints the same, "Microsoft Word 2007+"
Спасибо