Описание тега docsplit

Docsplit - это утилита командной строки и библиотека Ruby, которая преобразует документы в PDF-файлы и разбивает их на изображения и текст.
4 ответа

Эффективный способ конвертировать документ в формат PDF

Я пытался найти эффективный способ конвертировать документ, например, DOC, DOCX, PPT, PPTX в PDF. До сих пор я пробовал доксплит и oowriter, но оба заняли> 10 секунд, чтобы завершить работу над файлом pptx размером 1,7 МБ. Может кто-нибудь предложит…
02 янв '14 в 21:00
1 ответ

Конвертировать PPT в изображения в Rails

Я использую Docsplit Gem для преобразования PPT в изображения Docsplit.extract_images(uploaded.path.to_s, :size => '550x', :format => [:jpg],:output=>"#{Rails.root}/public/images") он успешно конвертируется, но мне потребуется больше времен…
06 мар '14 в 06:27
0 ответов

Нет такого файла или каталога @ rb_sysopen (Errno::ENOENT) - DOCSPLIT

Я пытаюсь извлечь изображения из документа Microsoft Office Word с помощью Docsplit и возвращает эту ошибку: /home/deploy/.rvm/gems/ruby-2.1.2/gems/docsplit-0.7.5/lib/docsplit/transparent_pdfs.rb:22:in `initialize': No such file or directory @ rb_sy…
29 авг '14 в 10:10
2 ответа

Docsplit Ruby on Rails

Я пытаюсь заставить docsplit работать с моим приложением rails. Сейчас я просто пытаюсь заставить его работать локально. Я установил драгоценный камень и все зависимости. Все основные примеры работают в командной строке, и я смог получить Docsplit.e…
21 ноя '11 в 19:06
0 ответов

Читать документ (.doc) с изображениями

Мне нужно прочитать тексты документов с помощью ruby, а затем выполнить некоторые операции с их содержимым. Некоторые из этих документов содержат изображения, которые мне нужно загрузить на сервер, а затем отобразить данные с изображениями. Есть иде…
15 дек '15 в 18:35
0 ответов

NoMethodError в CollectionsController# создать неопределенный метод `file'для nil:NilClass

Я пытаюсь загрузить PDF-файл в Dropbox через рельсы и преобразовать страницы в PDF в изображения JPEG и сохранить эти изображения в той же папке Dropbox. Я пытался использовать Docsplit Gem, но я не знаю, как обратиться к файлу в выпадающем списке в…
1 ответ

Ошибка удаления remove_entry_secure при использовании приложения ruby

Я пытаюсь разделить PDF-файлы на изображения с помощью docsplit. Но, похоже, у меня проблемы с моей установкой ruby. Я продолжаю получать следующую ошибку каждый раз: /usr/lib/ruby/1.8/fileutils.rb:694:in `remove_entry_secure': parent directory is w…
07 фев '13 в 13:25
1 ответ

Ошибка Ghoshscript: Ошибка: / Rangecheck в -. Dicttomark--

Я пытаюсь использовать ghoshscript для преобразования PDF в изображение. PDF-файл: http://www.coppernet.zm/MPLS.pdf $ sudo docsplit images -o /tmp/previews -p 1-5 -s 150,750,1000 -f png MPLS.pdf While reading gs_cidfm.ps: Error: /rangecheck in --.di…
11 дек '12 в 11:57
1 ответ

docsplit преобразование в PDF изменяет не-ASCII символы в docx на Linux

Мое приложение для управления документацией включает в себя преобразование файла.docx, содержащего символы не-ASCII Unicode (японский), в PDF с помощью docsplit (через гем Ruby, если это имеет значение). Он отлично работает на моем Mac. На моем комп…
17 окт '13 в 13:54
2 ответа

Plone и просмотрщик документов

Я работаю над Plone. Я успешно установил просмотрщик документов : теперь у меня есть очень хороший предварительный просмотр загруженных PDF-файлов. Проблема заключается в предварительном просмотре файлов world и excel. Как говорится в требованиях, я…
1 ответ

Как настроить шрифты CID для docsplit (ghostscript)?

У меня есть ссылка на руководство в URL ниже. http://www.ghostscript.com/doc/9.06/Use.htm Но я думаю, что я не следую этому правильно. Я пытаюсь конвертировать файлы Office в изображения с помощью Docsplit. Но некоторые символы (корейский и китайски…
1 ответ

Как загрузить многостраничный PDF и преобразовать его в JPEG с помощью Paperclip?

Кто-нибудь знает, как загрузить многостраничный PDF-файл с помощью Paperclip и конвертировать каждую страницу в формате JPEG? Пока что каждый раз, когда я загружаю PDF, он позволяет мне видеть только первую страницу PDF в формате JPEG. Но я хотел бы…
22 июл '12 в 03:39
1 ответ

Docsplit работает с консоли, а не с самого Rails

Я пытаюсь выяснить странную проблему с Docsplit. У меня есть приложение Rails 2.3.14, где пользователи могут загружать файлы PPT /PDF, и система должна извлекать изображения обложек с помощью Docsplit. У меня есть обратный вызов after_save в модель …
05 сен '13 в 08:56
2 ответа

Невозможно конвертировать документы openoffice с использованием docsplit, что приводит к java.lang.NoClassDefFoundError

Я установил драгоценный камень docsplit и смог конвертировать PDF документы. Однако, когда дело доходит до разделения документов openoffice, таких как файлы PowerPoint и Word, я получаю следующую ошибку: Exception: Command /usr/local/bin/docsplit pd…
16 апр '13 в 14:18
1 ответ

docsplit gem pdf to text

Ну, в основном у меня есть те же проблемы, что и здесь: http://blog.joshsoftware.com/2014/08/13/pdf-to-plain-text-processing-using-docsplit/ Но решение, которое они предлагают в docsplit, не не работает Docsplit.extract_text(filepath, {:pdf_opts =&g…
28 апр '15 в 16:09
2 ответа

Извлечение текста из документа в память с помощью docsplit

С помощью docsplit gem я могу извлечь текст из PDF или любого другого типа файла. Например, со строкой: Docsplit.extract_pages('doc.pdf') Я могу иметь текстовое содержимое файла PDF. В настоящее время я использую Rails, и PDF отправляется через запр…
29 апр '13 в 18:54
0 ответов

Разбирать галочки из pdf в рельсах

Мне нужно разобрать флажки из PDF. Я использую гем dobyplit для ruby. Проблема в том, что при разборе pdf анализируется только его текст, и нет никаких признаков существования флажка. Вот снимок экрана с моим флажком в формате PDF (флажок, помеченны…
21 авг '13 в 09:41
0 ответов

Как загрузить многостраничный PDF и преобразовать каждую страницу в JPEG с помощью Paperclip?

Кто-нибудь знает, как загрузить многостраничный PDF-файл с помощью Paperclip и конвертировать каждую страницу в формате JPEG? Пока что каждый раз, когда я загружаю PDF, он позволяет мне видеть только первую страницу PDF в формате JPEG. Но я хотел бы…
18 дек '14 в 18:07
0 ответов

Что заставило бы RSpec распечатать неправильный размер массива до to_yaml?

Кажется, что RSpec не выводит правильный размер массива, почти как если бы он не обрабатывал все, пока его не попросили что-то вывести. Что может быть причиной этого? Вот часть кода спецификации: puts project.documents[0].tables[0].digits[5].relatio…
12 апр '16 в 21:39
1 ответ

Подсчет PDF страниц в ROR с помощью Docsplit

Мне нужно получить количество страниц в PDF-файлах, хранящихся в Ruby on Rails 5.2.3 ActiveStorage с использованием Docsplit. Я загружаю PDF-документы, используя Ruby on Rails ActiveStorage. Я понимаю, что эти документы хранятся в виде блобов. Я над…
10 июл '19 в 00:46