Как получить HTML-код из PDF, DOCX, DOC с помощью PHP
Я хочу конвертировать любой файл PDF, DOCX, DOC в HTML-код с помощью PHP. с тем же стилем, что и в PDF. Я не получаю правильное решение.
Config::set('pdftohtml.bin', 'C:/poppler-0.37/bin/pdftohtml.exe');
// change pdfinfo bin location
Config::set('pdfinfo.bin', 'C:/poppler-0.37/bin/pdfinfo.exe');
// initiate
$pdf = new Gufy\PdfToHtml\Pdf($item);
// convert to html and return it as [Dom Object](https://github.com/paquettg/php-html-parser)
$html = $pdf->html();
Не работает для меня
3 ответа
Я думаю, что этот пост может помочь вам в первый раз. С этим вы сможете конвертировать любой PDF в HTML-код, используя PHP.
После этого вы можете использовать помощь, предоставленную в этом посте, для конвертации .doc и .docx в PDF с использованием PHP.
Я думаю, что теперь вы можете создать функцию для каждого расширения документа, которое вы хотите конвертировать в HTML.
Удачи.
У меня была похожая проблема, и я нашел github, который я использовал со словом docs. Это работало довольно хорошо тогда, но я не проверял это в последнее время. попытайся.
Я наткнулся на веб-сервис, который представляет API для конвертации документов. Я не очень тщательно его протестировал, но, похоже, он дает неплохие результаты при конвертации Word в HTML: