Dieser Artikel wurde archiviert, da er - oder Teile daraus - nur noch unter einer älteren Ubuntu-Version nutzbar ist. Diese Anleitung wird vom Wiki-Team weder auf Richtigkeit überprüft noch anderweitig gepflegt. Zusätzlich wurde der Artikel für weitere Änderungen gesperrt.
Wer gscan2pdf auch mit den OCR-Programmen OCRopus und Cuneiform-Linux verwenden möchte, was erst ab Version 0.9.31 möglich ist, muss derzeit unter Ubuntu vor 11.10 Oneiric Ocelot das Programm aus anderen Quellen beziehen oder den Quellcode selbst kompilieren, sinnvollerweise gleich aus der git-Quelle.
Adresszeile zum Hinzufügen des PPAs:
ppa:jeffreyratcliffe/ppa
Zusätzliche Fremdquellen können das System gefährden.
Ein PPA unterstützt nicht zwangsläufig alle Ubuntu-Versionen. Weitere Informationen sind der PPA-Beschreibung des Eigentümers/Teams jeffreyratcliffe zu entnehmen.
Damit Pakete aus dem PPA genutzt werden können, müssen die Paketquellen neu eingelesen werden.
Installiert[2] werden muss das Paket
gscan2pdf (ppa)
mit apturl
Paketliste zum Kopieren:
sudo apt-get install gscan2pdf
sudo aptitude install gscan2pdf
Alternativ kann nach Installation der gewünschten optionalen Pakete (siehe Sinnvolle Zusätze) ein fertiges .deb-Paket von sourceforge.net heruntergeladen werden, welches auch für Ubuntu geeignet ist. Dieses lässt sich dann von Hand installieren[3].
Fremdpakete können das System gefährden.
Benötigt werden die build-Abhängigkeiten für gcsan2pdf, die z.B. im Terminal[4] installiert werden können:
Befehl zum Installieren der Build-Abhängigkeiten:
sudo apt-get build-dep gscan2pdf
sudo aptitude build-depends gscan2pdf
gscan2pdf benötigt folgende Pakete:
libgtk2-imageview-perl
libgtk2-ex-simple-list-perl
libsane-perl
liblocale-gettext-perl (>= 1.05 )
sane-utils (>= 1.0.17 )
libtiff-tools
libpdf-api2-perl
libconfig-general-perl ( >= 2.40 )
perlmagick
imagemagick
librsvg2-common
libset-intspan-perl (>= 1.10)
libhtml-parser-perl
libgoo-canvas-perl
libproc-processtable-perl
libreadonly-perl
liblog-log4perl-perl
libforks-perl
mit apturl
Paketliste zum Kopieren:
sudo apt-get install libgtk2-imageview-perl libgtk2-ex-simple-list-perl libsane-perl liblocale-gettext-perl sane-utils libtiff-tools libpdf-api2-perl libconfig-general-perl perlmagick imagemagick librsvg2-common libset-intspan-perl libhtml-parser-perl libgoo-canvas-perl libproc-processtable-perl libreadonly-perl liblog-log4perl-perl libforks-perl
sudo aptitude install libgtk2-imageview-perl libgtk2-ex-simple-list-perl libsane-perl liblocale-gettext-perl sane-utils libtiff-tools libpdf-api2-perl libconfig-general-perl perlmagick imagemagick librsvg2-common libset-intspan-perl libhtml-parser-perl libgoo-canvas-perl libproc-processtable-perl libreadonly-perl liblog-log4perl-perl libforks-perl
Um den vollen Funktionsumfang nutzen zu können, sind außerdem folgende Pakete nötig
libgtk2-ex-podviewer-perl (um die Hilfe anzeigen zu können)
sane (um verschiedene Frontends verwenden zu können, siehe SANE)
xdg-utils (um PDFs direkt als E-Mails verschicken zu können)
djvulibre-bin (um DjVu-Dateien erstellen zu können)
unpaper (um die Scans vorzubereiten, siehe unpaper)
gocr (OCR-Programm)
tesseract-ocr (OCR-Programm, dazu entsprechende Sprachdateien, siehe tesseract-ocr)
cuneiform (OCR-Programm, siehe Cuneiform-Linux)
ocropus (OCR-Programm)
mit apturl
Paketliste zum Kopieren:
sudo apt-get install libgtk2-ex-podviewer-perl sane xdg-utils djvulibre-bin unpaper gocr tesseract-ocr cuneiform ocropus
sudo aptitude install libgtk2-ex-podviewer-perl sane xdg-utils djvulibre-bin unpaper gocr tesseract-ocr cuneiform ocropus
Cuneiform-Linux funktioniert allerdings nur in einer mit libmagick++-Support erstellten Version ab 0.8.0 (erst ab Oneiric in den Paketquellen vorhanden!).
Der Quellcode kann auf der Downloadseite bezogen werden, das .tar-gz-Archiv entpacken[5] und kompilieren[6]. Allerdings hat diese Version noch einen Fehler, der die Benutzung von unterschiedlich großen Seiten für die Texterkennung einschränkt. Diese Fehler ist aber in der Git-Version bereits behoben. Diese kann man mit dem Befehl
git clone git://gscan2pdf.git.sourceforge.net/gitroot/gscan2pdf/gscan2pdf gsan2pdf-x.x.x
heruntergeladen werden.
Zunächst wird für beide Fälle mit
perl Makefile.PL make
ein makefile erstellt und das Programm übersetzt. Leider funktioniert die vorgesehene Erstellroutine, die im Downloadverzeichnis für beide Versionen über den Befehl
make debdist
aufgerufen werden soll, momentan nicht, da am Ende der private Schlüssel des Entwicklers verlangt wird, den man natürlich nicht vorhalten kann... Dieses Fehler ist bereits gemeldet, und soll nach Auskunft von Jeffrey Ratcliffe demnächst behoben werden.
Ggf. schlägt die Erzeugung eines einfachen Pakets via checkinstall fehl, wenn in den verwendeten Angaben zu den Abhängigkeiten fehlerhafte bzw. für checkinstall nicht verarbeitbare Einträge benutzt werden. Um dennoch ein Paket erstellen zu können, müssen in den Angaben bei der checkinstall-Installierung zu Punkt 10 die dort aufgeführten Abhängigkeiten
10 - Requires: [ perl( ImageMagick-perl, ImageMagick, djvulibre, sane-backends >= 1.0.17 sane-frontends, xdg-utils, unpaper, gocr, perl(Gtk2 perl(Gtk2 ]
schlicht gelöscht werden (wenn die oben aufgeführten Pakete installiert sind, ansonsten können sie durch die oben angegebene Liste ersetzt werden), danach wird auch ein Paket erstellt und installiert.
Um OCRopus ohne den beschriebenen Export der tesslanguage
-Variable verwenden zu können, muss in der Datei gscan2pdf (das geht auch nach Installation mit einem Editor mit Root-Rechten[7] in /usr/bin/gscan2pdf) die Zeile
"$pre ocroscript $SETTING{ocroscript} --tesslanguage=$SETTING{'ocr language'} $png > $txt.txt$post";
durch
"$pre tesslanguage=$SETTING{'ocr language'} ocroscript $SETTING{ocroscript} $png > $txt.txt$post";
ersetzt werden, dann funktioniert auch für OCRopus die Spracheinstellung wie gewünscht. Diese Änderung ist in die GIT-Version vom 21.09. 2010 bereits eingeflossen. Allerdings funktioniert dies für Version 1.0.x nicht mehr!
Diese Revision wurde am 7. Juni 2013 10:29 von frustschieber erstellt.