Зритель PDF для командной строки в Linux [закрыт]


Эй, уже довольно давно я ищу средство просмотра pdf для командной строки.

поскольку мне нравится работать без X на Linux и часто работать на удаленной машине, я хотел бы иметь инструмент для чтения PDF-файлов. Есть довольно много действительно хороших графических программ (evince, okular, acroread,...) чтобы выполнить эту работу, поэтому я решил, что должен быть хотя бы один приличный инструмент текстового режима. Но я даже не знаю ни одного дерьмового!

В настоящее время я либо запускаю X только для чтения PDF-файлов, либо используйте pdftohtml+lynx. Однако последний не дает очень хорошего результата, и большинство документов просто нечитабельны, особенно если они содержат математическую формулу.

Google полон людей, которые говорят, что это невозможно или предлагают версию pdftohtml.

Я понимаю, что это не совсем вопрос программирования, но в настоящее время я рассматриваю возможность запуска проекта для реализации такой программы, если там уже нет хорошего.

спасибо для любых предложений.

7   51   2010-08-26 02:03:47

7 ответов:

Привет я думаю, что вам не нужно писать программу для вашей цели я имею в виду чтение pdf-файла в режиме консоли, потому что команда "меньше" уже делает это за вас. Так что используйте его и просто наслаждайтесь.

меньше "имя файла pdf"

хорошо, вы просили знать даже "дерьмовые". Вот два (решите сами об их соответствующей дерьмовости):

первый: Ghostscripttxtwrite выход устройства

 gs \
   -dBATCH \
   -dNOPAUSE \
   -sDEVICE=txtwrite \
   -sOutputFile=- \
   /path/to/your/pdf

второй: XPDFpdftotext утилита CLI (лучше, чем Ghostscript):

 pdftotext \
   -f 13 \
   -l 17 \
   -layout \
   -opw supersecret \
   -upw secret \
   -eol unix \
   -nopgbrk \
   /path/to/your/pdf
   - |less

это будет отображаться на странице серии 13 (fпервая страница) до 17 (lAST страница), сохранить макет a защищенный двойным паролем именованный PDF-файл (с использованием паролей пользователя и владельца секрет и суперсекретные), с соглашением EOL Unix, но без вставки разрывов страниц между страницами PDF, пропускается меньше...

pdftotext -h отображает все доступные параметры командной строки.

конечно, оба инструмента работают только для текстовых частей PDF-файлов (если они есть). О, и математическая формула также не будет работать слишком хорошо... ; -)


Edit: я неправильно набрал команду выше (первоначально используя pdftops вместо pdftotext).

кстати, я всегда в одной и той же ситуации, и я использую mc (midnight commander), который очень хорошо обрабатывает текстовые pdf-файлы... Просто просмотрите файл (F3) в mc

есть еще зеленое средство просмотра PDF-файлов. Есть демо на YouTube.

fbpdf - это просмотрщик pdf-буфера кадров.

есть еще и вилка,jfbpdf, но на данный момент я не могу заставить его работать.

Это будет работать только если ваш PDF-документ структурирован, т. е. это помеченный PDF документ.

Это необходимо для получения правильного порядка чтения текстовых объектов в документе.

помеченные PDF-документы также позволяют повторно пропускать документ, хотя я не знаю ни одного инструмента, делающего это с выводом командной строки.