Quantitative Textanalyse ist ein Ansatz, latenten Strukturen und Prozessen in Texten auf die Spur zu kommen. Mit „latent“ sind solche Phänomene gemeint, die nicht unmittelbar an der Oberfläche, an den grammatischen oder lexikalischen Formen eines Textes gewonnen werden können.
Aufgabe der quantitativen Textanalyse
Statistische Auswertungen stützen sich bei ihren Analysen oft auf möglichst große Datenmengen (Textkorpora, Wörterbücher), um auch möglichst triftige Ergebnisse zu erzielen. In der quantitativen Textanalyse wird dagegen die Einheitlichkeit/Geschlossenheit einzelner Texte in den Vordergrund des Interesses gerückt. Große Datenmengen haben womöglich den Vorteil, repräsentativ zu sein; die Individualität eines in sich geschlossenen Textes kommt dabei aber nicht in den Blick.
Bei der quantitativen Textanalyse geht es darum, latente, einem Einzeltext zugrundeliegende Phänomene aufzudecken; das heißt, es geht laut Altmann (1988, 3) um
- die „Charakterisierung von Texten mit Hilfe von Kenngrößen“,
- den „Vergleich von Texten aufgrund ihrer Charakteristiken und darauf folgende Klassifikation der Texte“,
- die „Erforschung von Gesetzen, die die Konstruktion von Texten steuern“, sowie den Aufbau einer darauf aufbauenden „Theorie der Texte“.
Ein Beispiel
Als Beispiel diene die Untersuchung von Wortarten in einem Text: In einem Beitrag von Ziegler, Best & Altmann geht es einerseits um die Erhebung, mit welcher Häufigkeit die einzelnen Wortarten in einem bestimmten Text vorkommen und darum, ob die dadurch gewonnene Häufigkeitsverteilung einem Verteilungsgesetz folgt. Ein weiterer Aspekt besteht in der Frage, wie im Verlauf des Textes die einzelnen Wortarten zunehmen, bis am Ende des Textes die eben erwähnte Häufigkeitsverteilung zustande gekommen ist. Man kann dann feststellen, dass jede Wortart sich in ihrer Zunahme auf eine spezifische, von jeder anderen verschiedene Weise verhält. Ein dritter Aspekt ist die wechselseitige Interaktion der Wortarten untereinander. Es handelt sich damit schon bei den Wortarten um mehrere latente Phänomene eines Textes.
Perspektive
Wortarten sind aber nur ein kleiner Teil der sprachlichen Phänomene eines Textes. Man kann Einheiten und Klassen von Einheiten auf allen sprachlichen Ebenen eines Textes statistisch erheben (Silbentypen, Satztypen, Types, Tokens, erstes Auftreten von Wörtern und vieles andere mehr). Als nächste Untersuchungsebene ist das Problem anzugehen, was die Ergebnisse zu einem Phänomen mit denen eines anderen zu tun haben. Eine Reihe einschlägiger Erfahrungen wurden unter dem Konzept der linguistischen Synergetik bereits gemacht und können auch auf Textebene angewendet werden. Nicht nur Einzelphänomene unterliegen Gesetzmäßigkeiten, sondern auch ihre Interaktionen.
Literatur
- Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. RAM-Verlag, Lüdenscheid 2008. ISBN 978-3-9802659-5-9.
- Reinhard Köhler: Zur linguistischen Synergetik: Struktur und Dynamik der Lexik. Brockmeyer, Bochum 1986. ISBN 3-88339-538-2.
- Ioan-Iovitz Popescu, in co-operation with Gabriel Altmann, Peter Grzybek, Bijapur D. Jayaram, Reinhard Köhler, Viktor Krupa, Regina Pustet, Ludmilla Uhlířová, Matummal N. Vidya: Wort Frequency Studies. Mouton de Gruyter, Berlin/New York 2099, ISBN 978-3-11-021852-7.
- C. George Sandulescu u. a.: Quantifying Joyce’s Finnegans Wake, in: Glottometrics 30, 2015, S. 45–72 (PDF Volltext)
Einzelnachweise
- ↑ Gabriel Altmann: Wiederholungen in Texten. Brockmeyer, Bochum 1988. ISBN 3-88339-663-X. Zitate S. 3.
- ↑ Als Beispiele unter vielen: Otto A. Rottmann: Word length in the Baltic languages – are they of the same type as the word lengths in the Slavic languages? In: Glottometrics 6, 2003, S. 52 – 60. (PDF Volltext.); Otto Rottmann: On Word Length in German and Polish. In: Glottometrics 42, 2018, S. 13 – 20. (PDF Volltext.).
- ↑ Arne Ziegler, Karl-Heinz Best, Gabriel Altmann: A contribution to text spectra, in: Glottometrics 1, 2001, S. 97–108. (PDF: Volltext)
- ↑ Karl-Heinz Best: Zur Interaktion der Wortarten in Texten. In: Papiere zur Linguistik 58, 1998, S. 83–95.