Читать файлы WordPerfect с помощью Python?

Мне действительно нужно работать с информацией, содержащейся в файлах WordPerfect 12, без использования медленного визуального интерфейса WordPerfect, но я не могу найти подробную документацию о формате файлов или какие-либо модули Python для чтения / записи файлов. Я нашел сообщение в Интернете, в котором объясняется, как конвертировать WordPerfect в текст, но я не очень понимал, как это работает.

http://mail.python.org/pipermail/python-list/2000-February/023093.html

Как мне это сделать?

3 ответа

Решение

Хорошо, вот что я сделал Я прочитал файл в двоичном режиме, преобразовал данные в строковое представление шестнадцатеричных значений и использовал неофициальную документацию WordPerfect для создания регулярных выражений, чтобы поменять все шестнадцатеричные строки, представляющие нетекстовые коды форматирования и метаданные, а затем преобразовал все вернуться в текст.

Грязный кусок взлома, но он сделал свою работу.

Соответствующая часть вашей ссылки это:

os.system( "%s %s %s" % ( WPD_TO_TEXT_CMD, "/tmp/tmpfile", "/tmp/tmpfile.txt" ) )

Который делает системный вызов внешней программы под названием "wp2txt". Поиск в Google для этой программы дает активные хиты.

Я думаю, OpenOffice.org должен читать файлы WordPerfect.

И вы можете написать скрипт OpenOffice с помощью Python.

Другие вопросы по тегам