Ubuntu 14.04 Trusty Tahr
Ubuntu 12.04 Precise Pangolin
TRE ist eine Bibliothek zur "unscharfen" Suche mit regulären Ausdrücken. Unscharf heißt dabei, dass man nicht - wie bei regulären Ausdrücken üblich - nach exakten Treffen sucht (siehe grep), sondern eine einstellbare Fehleranzahl (=Unschärfe) zulässt. Fehler können dabei z.B. Buchstabendreher, fehlende Buchstaben etc. sein.
Das auf der Bibliothek aufbauende Kommandozeilenprogramm tre-agrep macht diese Fähigkeiten praktisch nutzbar. Es arbeitet bei regulären Ausdrücken POSIX-konform, d.h. weder die GNU-Erweiterungen noch die Perl-Syntax werden unterstützt.
Das Programm ist in den Paketquellen enthalten und kann über das folgende Paket installiert werden[1]:
tre-agrep (universe)
mit apturl
Paketliste zum Kopieren:
sudo apt-get install tre-agrep
sudo aptitude install tre-agrep
Die allgemeine Syntax des Programmaufrufs lautet[2]:
tre-agrep [OPTIONEN] MUSTER DATEI
MUSTER
ist dabei das Suchmuster, mit dem die Datei DATEI
durchsucht werden soll. Wird DATEI
nicht angegeben, liest das Programm von der Standardeingabe.
Das Programm kennt unter anderem die folgenden Optionen:
Optionen von tre-agrep | |
Option | Erklärung |
-e AUSDRUCK , --regexp=AUSDRUCK | sucht nach dem (regulären) Ausdruck AUSDRUCK |
-i , --ignore-case | Groß- / Kleinschreibung wird ignoriert |
-w , --word-regexp | Der AUSDRUCK bei der Option -e muss exakt, also als allein stehendes Wort vorkommen, nicht als Wortteil |
-ANZAHL | Option für die "unscharfe" Suche. ANZAHL bestimmt, wie viele Fehler / Ungenauigkeiten bei den Suchtreffern vorkommen dürfen. |
Eine komplette Übersicht über alle verfügbaren Optionen bietet die Manpage von tre-agrep.
Die folgenden Beispiele beziehen sich alle auf diesen Text, der in der Datei tretest.txt gespeichert ist:
ubuntuusers.de ist Teil der deutschsprachigen Ubuntu-Community. Es gibt bei ubuntusers.de ein Wiki. Das Forum von ubutnuuser.de bietet verschiedene Supportforen. Ikhaya bringt bei uubnutsuers.de News rund um Ubuntu. Außerdem bietet ubbuntuuuserde einen Planet, der Blogbeiträge zu Ubuntu sammelt.
Das Wort "ubuntuusers.de" ist dabei nur in der 1. Zeile korrekt geschrieben. Alle anderen Vorkommen haben ein bis vier Fehler.
Suche nach ubuntuusers.de
:
tre-agrep ubuntuusers.de tretest.txt
ubuntuusers.de ist Teil der deutschsprachigen Ubuntu-Community.
Suche nach ubuntuusers.de
mit maximal drei Fehlern:
tre-agrep -3 ubuntuusers.de tretest.txt
ubuntuusers.de ist Teil der deutschsprachigen Ubuntu-Community. Es gibt bei ubuntusers.de ein Wiki. Das Forum von ubutnuuser.de bietet verschiedene Supportforen.
Suche nach dem Ausdruck ubuntu
:
tre-agrep -e ubuntu tretest.txt
ubuntuusers.de ist Teil der deutschsprachigen Ubuntu-Community. Es gibt bei ubuntusers.de ein Wiki.
Die 2. Zeile gehört zu den Treffern, weil ubuntu
darin korrekt vorkommt.
Suche nach dem Ausdruck ubuntu
mit zwei erlaubten Fehlern / Abweichungen:
tre-agrep -e ubuntu -2 tretest.txt
ubuntuusers.de ist Teil der deutschsprachigen Ubuntu-Community. Es gibt bei ubuntusers.de ein Wiki. Das Forum von ubutnuuser.de bietet verschiedene Supportforen. Ikhaya bringt bei uubnutsuers.de News rund um Ubuntu. Außerdem bietet ubbuntuuuserde einen Planet, der Blogbeiträge zu Ubuntu sammelt.
Diese Revision wurde am 25. Dezember 2014 08:52 von cornix erstellt.