osting: (Default)
osting ([personal profile] osting) wrote2009-03-19 08:10 pm
Entry tags:

pdf

Вот, допустим, есть у меня много маленьких pdf-ов. Я их хочу собрать в один файл, неважно - pdf или djvu. Не подскажете, как и чем это можно сделать?
ext_613079: Default userpic (Default)

[identity profile] shaplov.livejournal.com 2009-03-19 05:38 pm (UTC)(link)
Ну если это именно djvu (то есть по сути отканированные картинки), то я бы извлек бы из в тифы, при помощи ddjvu.exe
из http://djvu.sourceforge.net/

а потом воспользовался бы утилитой tiff2pdf из http://gnuwin32.sourceforge.net/packages/tiff.htm для их обратного соединения...

В случае если это честный pdf, а не картинки внутри, то тогда сложнее...

[identity profile] osting.livejournal.com 2009-03-19 05:54 pm (UTC)(link)
На входе у меня pdf (не знаю, честный или нет - как их вообще различать?). На выходе может быть pdf или djvu. В принципе, я могу их фотошопом по листочку перегнать в gif'ы, а оттуда собрать, но это долго. Я просто думала - может, есть какой-то быстрый и безболезненный способ это сделать?
ext_613079: Default userpic (Default)

[identity profile] shaplov.livejournal.com 2009-03-19 06:11 pm (UTC)(link)
Ну тогда есть еще pdf2djvu
http://code.google.com/p/pdf2djvu/

Вообще еще есть pdf2tiff http://python.net/~gherman/pdf2tiff.html
Но это скрипт на питоне, для него еще питон надо будет ставить, что под виндовсом -- дополнительное действие...

не знаю, честный или нет - как их вообще различать
Ну открыть ридером, и посмотреть удается ли текст скопировать в буфер... если да, то честный, если нет, то значит картинка...

Еще у меня смутное воспоминание о том, что третий Опен Офис кажется умел pdf'ы импортировать... Но я честно не помню... И не знаю насколько хорошо он умеет это делать... А ноут в котором он есть я оставил в машине, и спускаться пока лень...

Если умеет и хорошо, то можно их просто все импортировать, собрать в один файл, а затем снова экспортировать...

[identity profile] osting.livejournal.com 2009-03-19 06:45 pm (UTC)(link)
Остановлюсь на штуке, которую Витус ниже советует, как на самом простом варианте.
ext_613079: Default userpic (Default)

[identity profile] shaplov.livejournal.com 2009-03-19 06:54 pm (UTC)(link)
+1

[identity profile] eldom.livejournal.com 2009-03-20 07:58 am (UTC)(link)
PDF с защитой вроде тоже не даст копировать текст в буфер, при том что он там текстом а не картинкой.