Ein Conditional Random Field (CRF) ist ein Typ von ungerichtetem probabilistischem Modell, der im maschinellen Lernen (einem Teilgebiet der künstlichen Intelligenz) eingesetzt wird. Häufig wird mit dem Begriff auf eine spezielle Form mit linearer Struktur verwiesen, das Linear-Chain Conditional Random Field. Dieses wird typischerweise zur Segmentierung von Sequenzen verwendet. Das bedeutet, das CRF erhält eine Sequenz als Eingabe und gibt eine gleich lange Sequenz aus. Im Unterschied zu Hidden-Markov-Modellen (HMMs; ein anderes, jedoch gerichtetes Modell für sequentielle Daten) kann ein CRF an jeder Stelle auf die komplette Information der Eingabesequenz zugreifen, wohingegen ein HMM nur die aktuelle Eingabe sieht. Hierdurch können komplexe Merkmalsmengen verwendet werden.
Training
Wie alle Modelle des maschinellen Lernens müssen CRFs trainiert werden, d. h., ihre Parameter müssen aus Daten abgeschätzt werden. Hierfür existieren verschiedene Lernverfahren, etwa das Gradientenverfahren oder das Quasi-Newton-Verfahren. Dabei werden einige Sequenzen vorgegeben, von denen sowohl die Eingabe als auch die gewünschte Ausgabe bekannt ist (es handelt sich also um überwachtes Lernen). Das Lernverfahren versucht dann die Parameter im CRF so anzupassen, dass für möglichst viele Sequenzen in den Trainingsdaten die richtige Ausgabesequenz vorhergesagt wird.
Anwendungen
CRFs wurden erfolgreich auf verschiedene Probleme angewandt, wie zum Beispiel:
- Informationsextraktion von natürlichsprachigen Texten
- Morphologische Analyse
- Klassifikation von Proteinen
- Vorhersage der Sekundärstruktur von DNA und Proteinen
- Bilderkennung und Bildrestauration
Siehe auch
Literatur
- J. Lafferty, A. McCallum, F. Pereira: Conditional random fields: Probabilistic models for segmenting and labeling sequence data. In: Proc. 18th International Conf. on Machine Learning. Morgan Kaufmann, San Francisco, CA 2001, S. 282–289.
- A. McCallum: Efficiently inducing features of conditional random fields. In: Proc. 19th Conference on Uncertainty in Artificial Intelligence. 2003.
- F. Sha, F. Pereira,: Shallow parsing with conditional random fields. University of Pennsylvania, 2003 (Technical Report MS-CIS-02-35).
- H. M. Wallach: Conditional random fields: An introduction. University of Pennsylvania, 2004 (Technical Report MS-CIS-04-21).
- C. Sutton, A. McCallum: An Introduction to Conditional Random Fields for Relational Learning. In: Lise Getoor, Ben Taskar (Hrsg.): Introduction to Statistical Relational Learning. MIT Press, 2006.
- R. Klinger, K. Tomanek: Classical Probabilistic Models and Conditional Random Fields. Dortmund University of Technology, Dezember 2007, ISSN 1864-4503 (uni-dortmund.de [PDF] Algorithm Engineering Report TR07-2-013).
- T. Kudo, K. Yamamoto, Y. Matsumoto: Applying Conditional Random Fields to Japanese Morphological Analysis. 2004 (chasen.org [PDF]).