Distant Reading – Textalyzer

«Textalyzer» zählt die Anzahl Sätze, die Anzahl Wörter und die Anzahl verschiedene Wörter in einem (literarischen) Text. Zudem berechnet es, wie auch andere ähnliche Tools, einen sogenannten Flesch-Index. Das ist eine Zahl zwischen eins und hundert, welche die Lesbarkeit und Verständlichkeit des Textes widerspiegeln soll. Ein Wert von 58 (ermittelt für das «Amulett» von C. F. Meyer) ist laut der Skala also auf dem Niveau einer Boulevardzeitung. Das erstaunt. Man müsste sich genauer mit dem Flesch-Index befassen.

Mit dem Tool Textalyser lässt sich z.B. bei einem literarischen Text die «Wortschatz-Dichte» für die einzelnen Kapitel ermitteln. Diese Grösse erhält man, wenn man die Anzahl der verschiedenen Wörter durch die Gesamt-Wörterzahl dividiert.

Im «Amulett» hat Meyer 5´000 verschiedene Wörter verwendet, bei einer Anzahl von insgesamt 18´000 Wörtern. Aus diesen Zahlen kann man eine Wortschatzdichte von 0.27 errechnen. Jedes 4. Wort kommt also nur einmal vor. Subjektiv wird da ein reicher Wortschatz verwendet.

Bei der Novelle «Angela Borgia», welche knapp 20 Jahre nach dem Amulett verfasst worden ist, beträgt die Wortschatzdichte 0.23 (ist also vergleichbar). Die Wortschatzdichte steigt also über die Jahre nicht automatisch, wie man aufgrund der wachsenden Erfahrung des Autors eigentlich erwarten würde.

Man kann mit Textalyzer auch Aussagen zum Wortschatz und damit zur Sprachmächtigkeit des Autors sagen. Goethes literarischer Wortschatz wird als höher als der von Meyer beziffert. Bei Shakespeares Werken hat man gar einen Wortschatz von 30’000 Wörtern ermittelt. Der Wortschatz eines 16-Jährigen beträgt ca. 15’000 Wörter.

Dieser Beitrag entstand unter Mitwirkung der Klasse 5d der KS Reussbühl.