Strona 1 z 2

[+] Konwertowanie plików postscript do pdf

: 28 maja 2009, 22:14
autor: Katiusha
Mam pytanie czy ktoś konwertował ok. 1 GB plik Postscript do pdf systemowym ps2pdf i ile czasu to trwało?

O co chodzi? Konwertuje sobie taki plik jak wyżej opisałam i trwa to już 3,5 godziny.
Plik .ps ma dokładnie 972 MB i przez ten czas pojawiło się 5,6 MB pliku pdf.
Cały czas rośnie powoli, tylko ile jeszcze będzie konwertował? Całą noc?
Procesor to Intel C2D 2.4 GHz i jeden rdzeń jest wykorzystywany na tą operacje w 100%, a drugi obsługuje resztę systemu.


Tak

: 28 maja 2009, 22:32
autor: beel
Tak dużych zdecydowanie nie. Przykładowo jeśli konwertuję plik *.ps o wielkości 6MB to jako *.pdf zajmuje 750kb (~8 razy mniej) i trwa to chwilkę (~1,2s). No ale wszystko zależy co tam masz w tak ogromnym pliku. Zresztą na sztywno to łatwo wyliczyć.. I pytanie czy nie możesz od razu zapisać jako *.pdf?

: 28 maja 2009, 22:56
autor: fnmirk
Coś Ty encyklopedię zeskanowała i wszystkie strony masz w postaci obrazka.

Mogłaś podzielić plik postscriptowy na mniejsze części i później połączyć w jeden plik wyjściowy uzyskane pdfy. Zależnie od jakości jaką chcesz uzyskać to plik pdf wcale nie musi być mniejszy.
beel pisze:I pytanie czy nie możesz od razu zapisać jako *.pdf?
Zależy to od pliku źródłowego, nie zawsze można wykonać pdf. Czasami należy posłużyć się takim sposobem.

Generowałem wyjściowy plik pdf w Latex-u o objętości 12MB i miałem do dyspozycji tylko komputer z procesorem PII. Trwało to 25 minut.

Jednak nie polecam zabawy z bardzo dużymi plikami. Można się pogubić i trudno wyłapać błędy. Zdarzają się opuszczenia stron. Wspomniany wcześniej plik wygenerowałem poprawnie dopiero za trzecim razem. Wyłączone wszystko co się dało (jeszcze to był Debian Sarge lub początkowy Etch).

: 28 maja 2009, 23:03
autor: Katiusha
No to tak, to jest książka adresowa Breslau (Wrocław) z 1935 z tej strony:

http://www.sbc.org.pl/dlibra/doccontent ... 4&dirids=1

Oryginalnie jest w formacie djvu, ale mimo opcji ściągnięcia jej w tym formacie nie mogłam tego zrobić.
No to zaczęłam ją "drukować" po 200 stron do postscriptu aby mieć ją na dysku w ogóle.
Książka ma 1400 stron.
200 stron na dysku w .ps zajmuje ok. 1 GB. Teraz 200x7=1400
Czyli cała książka zajmuje w Postscripcie 7 GB!
Trochę za dużo dlatego chcę ją konwertować do pdfa aby "schudła" trochę.

Po 4 godzinach przerwałam proces, bo wychodzi na to, że chyba tydzień ją będę konwertować :-P

Spróbuje np. po 50 stron co zajmuje około 250 MB, może to przełknie ps2pdf i skonwertuję to do pdfa.

: 28 maja 2009, 23:18
autor: fnmirk
Pliki djvu można oglądać i swobodnie narzędziami dostępnymi w Debianie.

Kod: Zaznacz cały

apt-cache search djvu
djview3 - Viewer for the DjVu image format
djview4 - Viewer for the DjVu image format
djvulibre-bin - Utilities for the DjVu image format
djvulibre-dbg - Debug symbols for the DjVu image format
djvulibre-desktop - Desktop support for the DjVu image format
djvulibre-plugin - Browser plugin for the DjVu image format
djvuserve - CGI program for unbundling DjVu files on the fly
evince-dbg - Document (postscript, pdf) viewer - debugging symbols
evince-gtk - Document (postscript, pdf) viewer (GTK+ version)
evince-gtk-dbg - Document (postscript, pdf) viewer (GTK+ version) - debugging symbols
gscan2pdf - A GUI to produce PDFs from scanned documents
libdjvulibre-dev - Development files for the DjVu image format
libdjvulibre-text - Linguistic support files for libdjvulibre
libdjvulibre21 - Runtime support for the DjVu image format
okular-extra-backends - additional document format support for Okular
pct-scanner-scripts - scan and create merged DjVu and PDF documents for archiving
pdf2djvu - PDF to DjVu converter
evince - Przeglądarka dokumentów (postscript, pdf)
Drukując plik djvu przez wysyłanie go na drukarkę postscriptową dołożyłaś sobie roboty. Djvu jest formatem już sporo odchudzonym w stosunku do pdf i robiąc z djvu plik postscriptowy zwiększasz jego objętość.

Edycja:
Wydaje mi się, że wykonujesz niepotrzebną robotę. Formatu djvu używa się do zmniejszenia objętości obrazków przy jak najlepszej jakości. Plik pdf o takiej samej jakości będzie większy objętościowo od pliku djvu. Format djvu powstał do łatwego tworzenia elektronicznych wersji swoich papierowych odpowiedników. I obecnie nic lepszego nie znajdziesz do prezentacji w formie elektronicznej skanowanych dokumentów. Djvu jest jeszcze mało popularny ale skanowane książki tylko w takim formacie.
http://pl.wikipedia.org/wiki/DjVu

: 28 maja 2009, 23:33
autor: Katiusha
fnmirk, mam paczki z djview3, djview4, wtyczki do przeglądarek itd.
Na dysku jak mam plik w formacie djvu to go otwieram i tak samo w przeglądarce.
Chodzi o to, że na tamtej stronie (sam zobacz) mimo, że jest opcja ściągnięcia tej książki w formacie djvu, to nie działa.
Albo książka jest za duża, albo jest jakiś błąd na stronie który nie pozwala na to.
Dlatego zrobiłam tak jak zrobiłam aby w ogóle mieć ją na dysku.

Na razie konwertuje 20 minut i z 230 MB w .ps konwertowało się 1.8 MB w pdf i dalej mieli.
Jak nie da rady po 50 stron to spróbuje po 10. ;-)

: 28 maja 2009, 23:42
autor: fnmirk
Jak znajdę czas to sprawdzę ten plik. Zerknij na to co dopisałem wcześniej.

: 29 maja 2009, 00:17
autor: beel
¦ciąganie odbywa się bez problemu, albo ja tutaj czegoś nie rozumiem, albo co?

: 29 maja 2009, 00:53
autor: ArnVaker
No cóż, chyba zwyczajnie miałaś pecha i były to tylko chwilowe problemy z serwerem.

Plik ściągnął się normalnie, jest to archiwum "zip", rozpakowuje się bez problemu, każda strona jest w osobnym pliku "djvu". Całość zajmuje 170MB.

: 29 maja 2009, 01:25
autor: fnmirk
Katiusha, przekombinowałaś coś. Pobrałem archiwum zip. Rozpakowałem i mam 1405 obrazków. Na każdym jedna strona.

Uruchamiam plik ,,!adresbuch.djvu'' i mam fajny dostęp do wszystkich obrazków stron.

Dlaczego próbujesz otwierać pliki w przeglądarce www. Musisz mieć jakiś program czytający dobrze djvu z wykorzystaniem wtyczek. Zainstaluj sobie przeglądarkę ,,okular'' jest domyślne pod KDE4 ale niewiele pobiera zależności, a fajnie działa z fluboxem u mnie. Dobrze współpracuje z różnymi wtyczkami. Djvu czyta wyśmienicie (oczywiście z dysku). Tak dużych plików nie ma sensu przeglądać w internecie.