PDF

Inhaltsverzeichnis

PDF-Dateien anzeigen
PDF-Dateien erstellen
PDF-Dateien bearbeiten
Hilfsprogramme
Problembehebung
Links

Wiki/Icons/Oxygen/pdf.png Das Portable Document Format (PDF) wurde vor mehr als 20 Jahren von der Firma Adobe Systems entwickelt. PDF-Dateien haben sich rasch zum Standard für den Dokumentenaustausch entwickelt. PDF weist mehrere Vorteile gegenüber anderen Formaten auf:

Offenes Format: PDF ist als de-facto-Standard für den sicheren und zuverlässigen Austausch elektronischer Daten von Regierungseinrichtungen und Wirtschaftsunternehmen weltweit anerkannt und mit Branchenstandards wie PDF/A, PDF/X und PDF/E kompatibel.
Plattformunabhängigkeit: PDF-Dateien lassen sich auf sehr vielen Plattformen anzeigen und ausdrucken, z. B. unter Macintosh, Microsoft Windows und UNIX sowie auf vielen mobilen Geräten.
Wahrung der Datenintegrität: PDF-Dateien behalten das Erscheinungsbild der Originaldokumente bei und bewahren alle Informationen des Ausgangsdokuments – so Text, Zeichnungen, 3D- und Farbgrafiken, Fotos und sogar die Business-Logik –, unabhängig davon, welche Anwendung bei der Erstellung eingesetzt wurde.
Leistungsstarke Suchfunktionen: PDF-Dokumente können nach Wörtern, Lesezeichen und Datenfeldern durchsucht werden.
Barrierefreiheit: PDF-Dokumente unterstützen technische Hilfsmittel, die Anwendern mit Behinderungen den problemlosen Zugriff ermöglichen.

Die mit Acrobat 8 eingeführte PDF-Version 1.7 wurde – neben speziellen älteren Versionen – zudem zum ISO-Standard erhoben {de} . Mit Linux lassen sich PDF-Dateien anzeigen, erstellen und auch bearbeiten. Dazu gibt es eine ganze Reihe von unterschiedlichen Programmen, von denen einige im Folgenden vorgestellt werden.

Ein alternatives, kompakteres, z.T. qualitativ besseres und freies Format zu PDF ist DjVu.

Hinweis:

PDF ist ein Seitenbeschreibungsformat und damit in erster Linie ein Exportformat. Daher sollte man nach Möglichkeit das Originaldokument (z.B. .odt, .lyx, .tex etc.) aufheben, um auch später noch Änderungen mit dem Ursprungsprogramm durchführen zu können (Ausnahme: Nicht nötig bei in PDF eingebetteten Quelldaten, z.B .odt).

PDF-Dateien anzeigen¶

Unter Linux ist das Anzeigen von PDF-Dokumenten problemlos möglich, es gibt dafür viele verschiedene Programme. Hier sollen nur die wichtigsten aus dem Umfeld von Ubuntu vorgestellt werden. Mit allen vorgestellten Programmen lassen sich Texte markieren und kopieren sowie der Inhalt drehen.

Fast alle basieren auf den Funktionen der Bibliothek libpoppler, die auf größtmögliche Portabilität optimiert ist. MuPDF bietet eine eigene Bibliothek, die bei bestimmten Anwendungsfällen (viele eingebettete Bilder wie beispielsweise bei Ausstellungskatalogen) eine deutlich schnellere und qualitativ bessere Anzeige bietet.

Programme zum Lesen von PDF-Dateien
Name	Kommentare anzeigen	Kommentare erstellen	Formulare ausfüllen	Formulare speichern	Tabs	Präsentations- modus	Lesezeichen
Adobe Reader	Ja	Nein	Ja	?	Ja	Ja	Ja
Evince	Ja	Ja (nur bis Version 3.10.3)	Ja	Nein	Nein	Ja	Ja
Okular	Bedingt	Ja (ab Version 0.15)	Ja	Ja	Ja (ab Version 0.19)	Ja	Ja
ePDFView	Nein	Nein	Nein	?	Nein	Ja	Nein
MuPDF	Nein	Nein	Nein	?	Nein	Ja	Ja
qpdfview	Ja	Ja	Ja	Ja	Ja	Ja	Ja
Xpdf	Nein	Nein	Nein	Nein	Nein	Nein	Ja
zathura	Nein	Nein	Nein	?	Nein	Ja	Ja
Google Docs	Nur von Docs erstellte	Nur mit Docs lesbar	Nein	?	Browser Tabs	Nein	Nein
Google Chrome	?	Nein	?	?	Browser Tabs	Ja	Ja

Animationen und Videos in PDFs, die z.B. mit dem Latex-Paket Animate {en} erstellt worden sind, können nur mit dem Adobe Reader korrekt angezeigt werden. In Okular und Evince fehlt diese Funktionalität.

PDF-Dateien erstellen¶

Unter Linux lassen sich PDF-Dateien mit einigen Programmen direkt erstellen (siehe Tabelle). Bei allen anderen Programmen greift man entweder auf die in den Dialog "Datei -> Drucken" integrierte Möglichkeit "In Datei drucken" oder einen PDF-Drucker wie CUPS-PDF zurück.

Programme zum Erstellen von PDF-Dateien
Name	Hinweis
Apache OpenOffice/LibreOffice	"Datei -> Exportieren als PDF"
Abiword	Im "Speichern unter"-Dialog kann das Format PDF direkt ausgewählt werden.
Calligra / KOffice	"Datei -> Export as PDF..."
Inkscape	"Datei -> Speichern unter..."
Scribus	"Datei -> Exportieren -> Als PDF speichern..."
CUPS-PDF	Virtueller PDF Drucker
gscan2pdf	PDF-Dokumenten aus gescannten Dokumenten erstellen
ImageMagick	Sammlung von Werkzeugen für die Kommandozeile
Paperwork	Digitale Dokumentenverwaltung, Export als PDF möglich
ReportLab Toolkit	Python-Modul, mit dem man aus Python-Skripten heraus PDF-Dateien erstellen kann
rst2pdf	Konvertiert Textdateien mit Auszeichnungssprache ReStructuredText über das ReportLab Toolkit in PDF-Dokumente, auch eine einfachere Alternative zu LaTeX
tesseract-ocr	Mit dem Konfigurationsskript pdf kann tesseract direkt PDF-Dateien mit durchsuchbarer Textlage erstellen
TeX	siehe LaTeX und XeTeX
TeXmacs	TeX-ähnlich
XSane	Aus dem Scanprogramm können Scans als PDF gespeichert werden, xsane2sandwich erstellt zugleich eine durchsuchbare Texterkennung dazu
`convert`	Mit dem Werkzeug `convert` aus ImageMagick können aus Bildvorlagen direkt PDF-Dateien erstellt werden, bietet vielfältige Konfigurationsmöglichkeiten
`econvert`	`econvert` aus ExactImage kann ebenfalls aus fast allen Bildvorlagen PDF-Dateien erstellen

Experten-Info:

Graphische PDF-Dateien, die aus Bilddateien (Scanner-Augaben o.ä.) erstellt wurden (z.B. mit convert, econvert, hocr2pdf, dem pct-scanner-script oder Tesseract mit dem Konfigurations-Skript pdf), können in den Abmessungen sehr groß werden, insbesondere, wenn die Vorlagen mit einer Auflösung von 300 dpi (Standard für Texterkennung) oder mehr erstellt wurden. Die genannten Programme scheinen intern eine Auflösung von 72 dpi vorauszusetzen (zum Lesen völlig ausreichend, für Texterkennung aber nicht), was dazu führt, dass die Ausgabedateien bei 300 dpi um den Faktor 4,1666 (300 geteilt durch 72) vergrößert werden. Das ergibt z.B. bei einer Eingabegröße im DIN-A4-Format (210 mm x 297 mm) eine Ausgabedatei mit den erstaunlichen Maßen von 875 mm x 1238 mm (mehr als DIN-A0). Wenn eine solche Datei dann nochmals weiterverarbeitet werden soll (z.B. mit pdfsandwich, pdfocr o.ä.), entstehen zum einen noch monströsere Ausmaße (mehr als 3,5 x 5 Meter!), zum anderen kommt beim Versuch einer Weiterverarbeitung so gut wie jeder Rechner an seine Speicher- und CPU-Leistungsgrenzen und wird unbedienbar!

Eine solche Riesendatei lässt sich z.B mit Ghostscript wieder reduzieren (hier ein Beispiel für DIN-A4-Format):

gs -sOutputFile="EINGABEa4.pdf" -sDEVICE=pdfwrite -sPAPERSIZE=a4 -dFIXEDMEDIA -dPDFFitPage -dNOPAUSE -dBATCH EINGABE.pdf

Genauer lässt sich die Bild-Datei mit identify ausmessen und dann das PDF mit convert (beide aus ImageMagick) auf exakt den Ausgangswert wieder zurückführen:

SIZE=`identify EINGABE.DATEI | cut -d " " -f 3 `
convert EINGABE.pdf -resize $SIZE -units PixelsPerInch -density 300x300 AUSGABE.pdf

PDF-Dateien bearbeiten¶

Normalerweise ist PDF ein Exportformat. Das bedeutet, dass man eine Originaldatei hat (z.B. eine ODT) und diese als PDF exportiert. Dabei sollte man die Originaldatei immer aufbewahren, falls man später Änderungen an dem Dokument vornehmen möchte. Dennoch ist es oft notwendig, eine vorhandene PDF-Datei zu manipulieren.

Es gibt einige Werkzeuge, mit denen man PDF-Seiten sortieren, löschen oder aufteilen kann. Hier ist es nicht möglich, Texte oder andere Inhalte zu ändern.

Programme zum Bearbeiten von PDF-Dateien
Name	Zusammenfügen	Sortieren	Aufsplitten	Text bearbeiten	Sicherheits- richtlinien	Metadaten bearbeiten
PDF Split and Merge	Ja	Plugin Visual Reorder	Ja	Nein	Nur in enhanced-Version	Nein
PDF Mergy (online)	Ja	Nein	Nein	Nein	Nein	Nein
PDF Mod	Ja	Ja	Ja	Nein	Nein	Ja
PDF-Shuffler	Ja	Ja	Ja	Nein	Nein	Nein
pdftk/PDF Chain	Ja	Ja	Ja	Nein	Teilweise	Ja

Sollen Inhalte geändert oder hinzugefügt werden, kommen folgende Anwendungen in Betracht.

Programme zum Bearbeiten/Hinzufügen von Inhalten in PDF-Dateien
Apache OpenOffice/LibreOffice	Eine PDF-Datei kann mit einer Erweiterung importiert und bearbeitet werden.
Inkscape	Einzelne PDF-Seiten können importiert und bearbeitet werden.
flpsed	Einfügen von Bemerkungen in PostScript- und PDF-Dokumente
Master PDF Editor	Plattformübergreifendes, proprietäres Programm zur Bearbeitung von PDF- und XPS-Dateien
PDFedit	Umfangreiches Werkzeug zum Editieren von PDF-Dateien
PDF Scissors	Ermöglicht das Beschneiden und Teilen von einzelnen PDF-Seiten. Es lassen sich z.B. zweispaltige Dokumente in einem Arbeitsgang in einspaltige umwandeln. Benötigt Java.
PDF-XChange Editor	Windows-Programm, um PDF-Dokumente umfassend zu überarbeiten
PDF-XChange Viewer	Windows-Programm, um bestehenden PDF-Dokumenten Markierungen und Kommentare hinzuzufügen. Vorgänger des PDF-XChange Editors.
Whyteboard	In der PDF-Datei kann gezeichnet werden.
Xournal	Import einer PDF und Bearbeitung wie in einem Bildbearbeitungsprogramm möglich.

Hilfsprogramme¶

Es gibt noch weitere nützliche Werkzeuge, die im Zusammenhang mit PDF-Dateien erwähnt werden sollten.

Hilfsprogramme
Name	Beschreibung
diffpdf	PDF-Dateien vergleichen (graphisch, Buchstabe-für-Buchstabe oder Wort-für-Wort). Die freie Version wird nicht mehr weiterentwickelt, ist aber noch in den Paketquellen (universe) enthalten.
diff-pdf	PDF-Dateien vergleichen. Praktisch ist die Ausgabe als neue PDF-Datei, um die Unterschiede optisch prüfen zu können
ghostscript	Mächtiges Programm zum Darstellen, Konvertieren in andere Formate, Überprüfen, Zusammenführen etc. von PDF- und PS-Dateien
pdfgrep	Text in PDF-Dateien mit Hilfe von regulären Ausdrücken durchsuchen
JPdfBookmarks	Verwaltung von Lesezeichen, die in der PDF gespeichert werden.
pdf zu cbt	Verlustfreie Konvertierung in Comicbuchformat
PDFjam	Sammlung von Programmen und Skripten, mit denen PDF-Dateien manipuliert werden können
poppler-utils	Programme für die Kommandozeile, mit denen man u.a. PDF-Dateien vereinigen, Text und Bilder aus PDF-Dateien extrahieren sowie PDF-Dokumente in Bild-Dateien oder HTML-Seiten umwandeln kann
pdfocr	Ermöglicht es, aus gescannten PDF-Vorlagen durchsuchbare Dokumente zu erstellen
pdfposter	Erstellung großformatige Poster aus PDF-Dateien
pdfsandwich	Kommandozeilenwerkzeug zum Erstellen durchsuchbarer PDF-Dateien
OCRmyPDF	Kommandozeilenwerkzeug zum Erstellen durchsuchbarer Dateien im PDF/A-Standard
pdfsizeopt	Optimierung des Größe einer PDF-Datei.
pdf2djvu	Kommandozeilenwerkzeug zur Konvertierung von PDF-Dateien in das DjVu-Format
Pdf To Djvu GUI	Benutzeroberfläche für pdf2djvu
pdf2svg	Konvertierung in das SVG-Format
DjVuDigital	Kommandozeilen-Programm zum Konvertieren von PDFs, PostScript (.ps), GZipped PostScript (.ps.gz) und Encapsulated PostScript (.eps) in das DjVu-Format
djvu2pdf	Konvertierung von DjVu-Dateien in das PDF-Format, Textlagen können mit übernommen werden
Servicemenu-PDF	Nutzung von gängigen PDF-Werkzeugen (pdf2djvu, Ghostscript, poppler-utils, pdftk und PDFjam) über das Kontextmenü von Dolphin bzw. Konqueror.
BRISS	Zuschneiden von PDF-Dateien
krop	Zuschneiden von PDF-Dateien mit optionaler automatischer Erkennung des Textbereichs. Einfacher und mächtiger als das Beschneide-Werkzeug, welches Adobe in den sehr teuren Bezahlversionen anbietet. Fremdpaket verfügbar, welches einwandfrei unter (K)ubuntu funktioniert.
jPdfTweak	Swiss Army Knife for PDF-files: Java Swing Programm zur Bearbeitung von PDF-Dateien: zusammenfügen, verschlüsseln, Wasserzeichen, Metadaten, etc.
sam2p	Umwandlung von Rastergrafiken mit zahlreichen Optionen. In den offiziellen Paketquellen enthalten: sam2p

Problembehebung¶

PDF-Formulare¶

Mit Adobe Acrobat unter Windows erstellte Formulare sorgen immer wieder für Verdruss. Generell gilt, dass für eine wie vom Ersteller gedachte Funktionsweise der Adobe Reader für Windows in einer möglichst aktuellen Version benötigt wird (der für Linux nicht vorhanden ist).

PDF-Portfolios¶

Mit PDF-Portfolios {de} bietet Adobe die Möglichkeit an, in eine Datei mit der Endung .pdf alle möglichen Fremdformate einzubinden. Eine ähnliche Technik gab es früher schon mal unter dem Namen "Microsoft Office Sammelmappe", um Word-, Excel- und PowerPoint-Dateien in einer Datei abspeichern zu können. Wer experimentieren möchte, kann dies mit folgender Beispieldatei tun: combine-pdf-files-portfolio-sample.pdf {dl} . Ein Indiz für eine solche Datei kann die Versionsangabe "1.7" sein:

file combine-pdf-files-portfolio-sample.pdf

Ausgabe:

combine-pdf-files-portfolio-sample.pdf: PDF document, version 1.7

Zur Anzeige eines PDF-Portfolios wird der Adobe Reader X oder neuer benötigt, der für Linux nicht verfügbar ist. Zumindest die Programme Okular und Master PDF Editor können aber die enthaltenen Dateien (Anhänge) extrahieren.

Links¶

Freie PDF-Betrachter
Postscript/PDF-Tools - vierteilige Serie im Magazin LinuxUser:
- Bild und Druck - 08/2009
- Seiten-Puzzle - 09/2009
- Blattweise - 10/2009
- Bücher, Broschüren und Booklets - Artikel LinuxUser, 11/2009
PDF-Zerteilung nach Maß - Artikel aus freiesMagazin, 07/2009 (komplette Ausgabe als PDF )
PDF-Betrachter im Test - Artikel aus freiesMagazin, 08/2009 (komplette Ausgabe als PDF )
PDF-Dateien splitten und zusammenfügen - Artikel EasyLinux, 01/2007
Mit pdflatex bessere PDF-Dateien erzeugen - Artikel LinuxUser, 04/2005
PDF Tools - u.a. PDF-Dokumente nach verdächtigen Elementen und (Java-)Skriptbefehlen durchsuchen
Lively Alphabet - an open source coloring book - PDF-Beispieldatei für Präsentationen
Liste von PDF-Software – Wikipedia

Diese Revision wurde am 7. Juli 2016 08:46 von michahe erstellt.

ubuntuusers.de

Wiki

PDF