pdf

Mar. 19th, 2009 08:10 pm
osting: (Default)
[personal profile] osting
Вот, допустим, есть у меня много маленьких pdf-ов. Я их хочу собрать в один файл, неважно - pdf или djvu. Не подскажете, как и чем это можно сделать?

Date: 2009-03-19 05:38 pm (UTC)
ext_613079: Default userpic (Default)
From: [identity profile] shaplov.livejournal.com
Ну если это именно djvu (то есть по сути отканированные картинки), то я бы извлек бы из в тифы, при помощи ddjvu.exe
из http://djvu.sourceforge.net/

а потом воспользовался бы утилитой tiff2pdf из http://gnuwin32.sourceforge.net/packages/tiff.htm для их обратного соединения...

В случае если это честный pdf, а не картинки внутри, то тогда сложнее...

Date: 2009-03-19 05:54 pm (UTC)
From: [identity profile] osting.livejournal.com
На входе у меня pdf (не знаю, честный или нет - как их вообще различать?). На выходе может быть pdf или djvu. В принципе, я могу их фотошопом по листочку перегнать в gif'ы, а оттуда собрать, но это долго. Я просто думала - может, есть какой-то быстрый и безболезненный способ это сделать?

Date: 2009-03-19 06:11 pm (UTC)
ext_613079: Default userpic (Default)
From: [identity profile] shaplov.livejournal.com
Ну тогда есть еще pdf2djvu
http://code.google.com/p/pdf2djvu/

Вообще еще есть pdf2tiff http://python.net/~gherman/pdf2tiff.html
Но это скрипт на питоне, для него еще питон надо будет ставить, что под виндовсом -- дополнительное действие...

не знаю, честный или нет - как их вообще различать
Ну открыть ридером, и посмотреть удается ли текст скопировать в буфер... если да, то честный, если нет, то значит картинка...

Еще у меня смутное воспоминание о том, что третий Опен Офис кажется умел pdf'ы импортировать... Но я честно не помню... И не знаю насколько хорошо он умеет это делать... А ноут в котором он есть я оставил в машине, и спускаться пока лень...

Если умеет и хорошо, то можно их просто все импортировать, собрать в один файл, а затем снова экспортировать...

Date: 2009-03-19 06:45 pm (UTC)
From: [identity profile] osting.livejournal.com
Остановлюсь на штуке, которую Витус ниже советует, как на самом простом варианте.

Date: 2009-03-19 06:54 pm (UTC)

Date: 2009-03-20 07:58 am (UTC)
From: [identity profile] eldom.livejournal.com
PDF с защитой вроде тоже не даст копировать текст в буфер, при том что он там текстом а не картинкой.

Date: 2009-03-19 06:07 pm (UTC)
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
Я бы LaTeX-ом делал. Сгенерировал файлик в котором на каждой странице includegraphics{something} где something - имя соответствующего pdf без расширения, а потом pdflatex его.

Date: 2009-03-19 06:12 pm (UTC)
ext_613079: Default userpic (Default)
From: [identity profile] shaplov.livejournal.com
Что-то тут какой-то клуб линуксоидов извращенцев собрался ;-)

Date: 2009-03-19 06:14 pm (UTC)
From: [identity profile] osting.livejournal.com
Я не в клубе!!! ;)

Date: 2009-03-19 06:15 pm (UTC)

Date: 2009-03-19 06:14 pm (UTC)
From: [identity profile] osting.livejournal.com
Ясно, LaTeXа у меня нет, но если заведется - буду иметь в виду.

Еще вот такая штука есть

Date: 2009-03-19 06:20 pm (UTC)
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
Package: pdftk
Priority: optional
Section: text
Installed-Size: 2960

Description-ru: утилита для работы с PDF
Если рассматривать формат PDF как электронную бумагу, тогда pdftk -- это
одновременно электронный расшиватель, дырокол, переплётчик, дешифратор и
аппарат для просвечивания рентгеновскими лучами. pdftk -- простое средство
для выполнения ежедневных операций с документами в формате PDF.
Оно может быть использовано для следующих целей:
- соединение PDF-документов;
- выделение отдельных страниц PDF-документа в новый документ;
- декодирование зашифрованного PDF-файла (при наличии пароля);
- кодирование, при желании, результирующего PDF-файла;
- заполнение полей файла PDF данными и/или шаблонами;
- создание фоновых
Homepage: http://www.pdfhacks.com/pdftk/

По-моему, то что доктор прописал.

Re: Еще вот такая штука есть

Date: 2009-03-19 06:33 pm (UTC)
From: [identity profile] osting.livejournal.com
Ура! Именно то, что надо. Спасибо!

Date: 2009-03-19 08:54 pm (UTC)
From: [identity profile] snufk1n.livejournal.com
О-о! Сколько полезной информации! Присоединяюсь к благодарностям.

А еще вопрос не очень по теме: хочу напечатать книжку, сделанную в djvu. Я понимаю, что если в формате А4, то проще всего разбить на картинки и печатать с двух сторон страницы. А если книга в другом формате (например, А5), то как тогда?

Date: 2009-03-19 09:04 pm (UTC)
From: [identity profile] osting.livejournal.com
Вроде бы с djvu все так же, как и с другими форматами. :) Это есть где-то в настройках печати и называется, кажется, буклет. Тогда страницы печатаются в таком порядке, что, если взять потом распечатанное и сложить пополам, то все страницы оказываются на своих местах. Но я сама этот способ так и не освоила, печатаю обычно просто 2 страницы на лист, так что могу сейчас напутать.

Date: 2009-03-20 10:06 am (UTC)
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
Ну, я это делаю так:
1. Конвертирую dvju в postscript c помощью djvups
2. Задача сводится к предыдущей - то есть печати в брошюру любого другого формата, из которого можно получить Postscript. - psbook |psnup -2 | psset --duplex |lp

Если речь идет о windows, где штатно работа с Postscript не очень предумотрена, но имеется более-менее приличный принтер, к примеру HP LJ 1200, то все что я делаю в Postscript, по-моему можно сделать средствами драйвера этого принтера.

Впрочем, psutils для windows есть на CTAN, а напечатать постскрипт на любом недопринтере можно с помощью ghostscript.

Date: 2009-03-20 04:38 pm (UTC)
From: [identity profile] snufk1n.livejournal.com
Спасибо, попробую.
У меня windows, поэтому, видимо, надо будет изгаляться.

Date: 2009-03-19 10:20 pm (UTC)
From: [identity profile] kotos.livejournal.com
А адоб акробат что уже не в моде? Или все только свободным софтом пользуются?

Date: 2009-03-19 10:26 pm (UTC)
From: [identity profile] osting.livejournal.com
Мой не умеет - старый, наверное.

Date: 2009-03-19 10:35 pm (UTC)
From: [identity profile] kotos.livejournal.com
Если это именно акробат, а не ридер, то должен уметь. 7-й точно умеет.

Date: 2009-03-20 10:08 am (UTC)
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
Это был большой маркетинговый просчет adobe - обозвать одним словом полнофункциональную программу работы с PDF и читалку. Теперь пользователь и не понимает разницы.

Date: 2009-03-20 10:07 am (UTC)
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
Акробат, насколько я помню, софт интерактивный. Если файлов, которые надо обработать - сотни, то замаешься их по одному туда втыкать.

Date: 2009-03-26 06:33 am (UTC)
From: (Anonymous)
это умеют Файнридер - открываешь в нем все маленькие pdf, потом пересохраняешь как один большой, и Акробат Профешнл - не помню, честно, как там, но примерно также

Date: 2009-04-23 03:47 pm (UTC)
From: [identity profile] elenire.livejournal.com
любой Acrobat (не Acrobat Reader!) это умеет. Начиная с 6ой версии.
Через опцию "Merge documents..." или через "Combine multiple files to Adobe PDF..."

August 2024

S M T W T F S
    123
45678910
11121314151617
18192021222324
2526272829 3031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Aug. 10th, 2025 04:47 am
Powered by Dreamwidth Studios