Создать HTML с изображениями из PDF с помощью Linux -poppler-utils-pdftohtml
В настоящее время я работаю с pdftohtml, под CentOS, poppler-utils. Концепция проста - пользователь загружает файл PDF и видит HTML-версию этого файла. Я использую простую команду -
$> pdftohtml source.pdf target.html
но это не работает! Позже я пытаюсь создать HTML, используя сложный переключатель без фреймов:
$> pdftohtml -c - noframes source.pdf target.html
Все еще нет Удачи! Проблема в том, что изображение pdf-файла (изображения находятся внутри этого pdf-файла) не может появиться в html, иногда изображение перекрывается! Есть идеи?
Вот код PHP -
add.php
<!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml"><head>
<meta http-equiv="content-type" content="text/html; charset=UTF-8">
<link href="css/style.css" rel="stylesheet" type="text/css"/>
<title>CompleteView</title>
</head>
<body>
<form method="post" action="save.php" enctype="multipart/form-data">
<input type="hidden" name="action" value="add">
<tr class="dark_bgcolor text-content">
<td align="left" width="20%">Upload</td>
<td align="left" width="1%">:</td>
<td align="left">
<input type="file" name="img_full" class="look" size="50">
(Only .pdf)
</td>
</tr>
<tr class="bottom_bgcolor">
<td align="center" colspan="3"><input type="submit" name="" value="Upload" class="look"></td>
</tr>
</form>
</body>
</html>
Save.php
<?php
$myNewFolderPath=rand();
mkdir($myNewFolderPath);
$fname="full_".uniqid("");
$filename=$fname.'.pdf';
//$uploadpath=SPL_IMG_UPLOADPATH.$filename;
move_uploaded_file($_FILES['img_full']['tmp_name'], $myNewFolderPath.'/'.$filename);
chmod($myNewFolderPath.'/'.$filename, 0777);
echo ('/usr/local/bin/pdftohtml '.$myNewFolderPath.'/'.$filename);
exec('/usr/local/bin/pdftohtml -c -noframes'.$myNewFolderPath.'/'.$filename);
header('Location:'.$fname.'.html');
//exec('/usr/local/bin/pdftohtml 2098602105/EssentialC.pdf');
?>
Еще одна вещь - версия pdftohtml -0,36
Вот скриншоты -
Результат -
1 ответ
$ pdftohtml -c source.pdf target.html
Это выведет в сложном режиме. Вы не можете использовать -noframes со сложным флагом.
$ man pdftohtml
-noframes generate no frames. Not supported in complex output mode.