Distant Reading,  Funfacts,  Textanalyse mit R,  Tools

Das Känguru und ich oder ich und das Känguru

„Was an dem Buch hat Ihnen denn gefallen?“, frage ich. „Also, das Känguru fand ich echt witzig“, sagt die Frau, „aber diese andere Figur…“ „Ja?“ „…dieser Kleingärtner…“ „Kleinkünstler.“ „Ja. Der hat irgendwie genervt.“

Aus Marc-Uwe Klings Känguru-Chroniken

Solche und ähnliche Dialoge streut Marc-Uwe Kling gerne einmal selbstironisch in die Fortsetzungsbände seiner Känguru-Chroniken. Doch wenn es den vielen Lesern seiner Bücher tatsächlich so ergehen würde, würden sie sich wohl kaum derartig mitreißen lassen. Eine computergestützte Analyse zeigt, dass die Texte ebenso sehr um „den Kleinkünstler“ kreisen wie um „sein“ Känguru. Es handelt sich also eindeutig um einen Text, in dem Känguru und ich gleich wichtige Wörter sind, oder?

das känguru und ich – eine Analyse auf Wortebene

Vorweg sei kurz gesagt, dass alle Berechnungen hier mit Hilfe von R Studio und Matthew Jockers‘ (ja, der Jockers, der auch Macroanalysis und Der Bestsellercode geschrieben hat) Einleitung Text Analysis with R for Students of Literature gemacht wurden. Dieses Buch kann ich allen empfehlen, die gerne mehr über R lernen möchten. Auch wenn du noch gar nichts über R weißt, ist dies ein guter Einstieg in die statistische Literaturanalyse.

Die erste Analyse, die Aufschluss darüber gibt, worum es im Känguru-Manifest geht, ist eine simple Abfrage der 10 häufigsten Wörter. Diese sind in absteigender Reihenfolge: ich, das, und, känguru, die, der, sagt, es, in, ist. Bemerkenswert ist das vor allem, wenn man diese 10 Wörter mit den 10 häufigsten Wörtern in anderen Romanen vergleicht. Diese enthalten nämlich selten signifikante Begriffe und beschränken sich meist auf Funktionswörter. Vielleicht ist auch mal der Name eines Protagonisten darunter. Hier aber bekommen wir gleich die wichtigsten Phrasen mitserviert, die mit großer Wahrscheinlichkeit lauten: „Ich und das Känguru“ und „sagt das Känguru“ bzw. „sagt es“. Außerdem kann man vermuten, dass viel wörtliche Rede vorkommt, innerhalb derer Selbstaussagen vorkommen und die dann mit „sagt…“ schließen.

Zahlen, Zahlen, Zahlen

Am meisten aber springen Zahlen ins Auge, die ich euch bisher vorenthalten habe. ich kommt mit 1962 Vorkommnissen nämlich fast doppelt so häufig vor wie känguru (1164):

Ich und das Känguru - eine quantitative Analyse von Marc Uwe Klings Romanen auf Wortebene. #Literatur #DigitalHumanities #Germanistik
Schwarz hier der Gebrauch des Wortes ich im Verlauf des Textes.

Die Verteilung für das Wort känguru ist ähnlich, auch wenn die Känguru-Grafik nicht ganz so schwarz aussieht.

Und das obwohl vor allem im hier untersuchten zweiten Teil der Känguru-Chroniken immer stärker betont wird, dass eine Pro- vs. Antagonisten Konstellation angestrebt wird, die das Känguru und seinen Nachbarn den Pinguin ins Zentrum des Geschehens rückt. Ein kurzer Blick auf eine dritte Garfik zeigt, dass Letzterer allerdings für eine solch klassische Konstellation wesentlich zu kurz kommt:

Ist das Känguru mit den Boxhandschuhen nur ein niedlicherer Schweinehund?

Ich stelle mir vor, ich würde den Inhalt des Buches nicht kennen und hätte statt dessen nur dieses Zahlenmaterial vor mir. Ich denke, ich ließe mich wohlmöglich von diesen Ergebnissen schnell dazu hinreißen, eine textimmanente, psychologische bis psychoanalytische Interpretation zu beginnen, nach der das Känguru eine Spiegelfigur des Protagonisten ist. In Wahrheit ginge es hier nicht um das sprechende Tier, sondern vielmehr um dessen manchmal unscheinbar wirkenden Mitbewohner. Weiter würde ich vielleicht vermuten, dass das Känguru wahlweise eine unbewusste oder überbewusste Facette des Ichs des Erzählers sei, die immer das ausspreche, was der eigentliche Protagonist nicht auszusprechen wagt oder aber immer für dessen Scherze mit seinen Mitmenschen verantwortlich gemacht würde.

Was verbirgt sich denn nun hinter den Begriffen Känguru und ich?

All diese aufgrund der reinen Zahlen möglichen Annahmen zeigen vor allem, dass es selbst beim Distant Reading wichtig ist, dem Text näher zu kommen als man es mit rein quantitativen Analysen kann. Ich habe darum das Wort ich abschließend noch in einer Tabelle als Keyword in Context angeschaut. Selbst ohne alle rund 1960 Vorkommnisse durchzusehen, wurde mir schnell klar, dass ich einige Einsichten relativieren musste. Durch die hohe Dialogizität zwischen Erzähler und Känguru, verteilt sich die Verwendung des Wortes ich auf beide Figuren. Somit beschreibt sowohl das Wort Känguru als auch ein guter Teil der Vorkommnisse des Wortes ich das rebellische Beuteltier. Hinzu kommt, dass zusätzlich höchstwahrscheinlich alle Vorkommnisse des Wortes es dem Känguru zugeordnet werden können. Und so werden zwei Dinge aus diesen Fundstücken klar:

  1. Aufgrund einer reinen Prüfung von Wortvorkommnissen kommt man einem Erzähltext nicht besonders nahe. Mit Hilfe von Listen eines einzelnen Keyword in Contexts kann man zwar einige Auffälligkeiten relativieren, kommt aber immer noch nicht an eine genaue Beschreibung heran.
  2. Eine solche statistische Auswertung kann ziemlich klar widerlegen, dass es sich – wie vordergründig behauptet – um eine Protagonisten-Antagonisten Konstellation handelt. Traurig aber wahr, der Pinguin spielt in Wahrheit eine ziemlich kleine Rolle. Dafür gibt es eine recht eindeutige Aufteilung der Protagonistenrolle in diesem Roman. Diese wird allerdings dadurch verschleiert, dass eine Figur als bedeutsamer hervorgehoben wird als die andere. Fans des Pinguin dürfen allerdings auf den nächsten Band hoffen. Denn die dritte Grafik zeigt, dass es am Ende einen kleinen Aufwärtstrend gibt, was die Erwähnung des kühlen Nachbarn angeht.

Distant Reading vs. Close Reading? Am besten ab und zu zoomen!

Das Alles wiederlegt jetzt natürlich nicht die Interpretationsansätze, die ich weiter oben skizziert habe. Es zeigt aber, das eine solche erst verbindlich belegt werden könnte, wenn man näher in den Text hinein geht als man das mit sehr simplen statistischen Auswertungen tun kann. Insgesamt führt mich das also wieder zur Frage einer meiner letzten Artikel zurück, wie viel Distanz man beim Distant Reading zum Text entwickeln sollte, um sowohl einen umfassenden Überblick über einen oder mehrere Text/e zu bekommen als auch belastbare Interpretationen leisten zu können. Eine gewisse Skepsis gegenüber einzelnen Methoden ist durchaus gesund und wenn ich abschließend in die KWIC-Tabelle blicke, erkenne ich, dass die Kombination unterschiedlicher Methoden miteinander der Königsweg sein könnte.

Wer umschreibt, der bleibt – und bekommt die Trophäe für den reichsten Wortschatz

Eine letzte kleine Erkenntnis möchte ich euch nicht vorenthalten, da sie es mir besonders angetan hat. Eine Abfrage der größten Vorkommnisse von Hapax Legomena (nur einmal verwendete Wörter) in den einzelnen Kapiteln lenkt das Augenmerk auf ein kleines aber feines Kapitel mit dem offensichtlich reichsten Wortschatz. Bei einem kurzen Kapitel wie diesem ist es allerdings auch leichter, Wörter nur einmal zu verwenden. Auch hier kommt die Erkenntnis also nicht ohne Relativierung aus.

In diesem Kapitel begeistern die Protagonisten sich darüber, dass Versender von Spam Nachrichten beim Ersinnen ihrer Betreffzeilen immer kreativer werden, um Spamfiltern zu entgehen. Es ist das „wer umschreibt, der bleibt“ genannte Kapitel, in dem Känguru und Mitbewohner immer neue solcher Betreffs erfinden, wie z.B.

Beim Vollzug des Beischlafes die Gemahlin durch gesteigerte Manneskraft betören

oder

Nicht mehr bleibest du umfangen

In der Finsternis Beschattung,

Und dich reißet neu Verlangen

Auf zu höherer Begattung

Und so stehen am Ende des Kapitels mit dem reichsten Wortschatz die Worte Goethes, einem der wortreichsten deutschen Dichter. Herrlich!

Digital Humanities transparent betreiben

Schließen möchte ich diese Ausführungen mit der Einschätzung, dass Digital Humanities Methoden keineswegs die Black Box oder die Magie sein sollten als die sie nicht selten mystifiziert werden. Ich glaube nicht, dass irgendjemand aufgrund der Nutzung von Distant Reading Techniken plötzlich selbst viel weniger liest. Viele mit Digital Humanities Tools generierbare Daten sind schlicht nicht qualitativ und richtig interpretierbar, wenn man nicht zumindest ab und zu in den Text hineingeht oder diesen bereits kennt. Durch dieses Fallbeispiel, auch wenn es eher klein und witzig ist, habe ich erkannt, wie gewinnbringend Mittelwege zwischen Close und Distant Reading sind. Sie helfen uns, die bestmöglichen Ergebnisse aus Digital Humanities Methoden herauszubekommen.

Alle hier angeführten Zitate sind aus:

Kling, Marc-Uwe: Das Känguru-Manifest. Ullstein 2011.

Beim letzten handelt es sich nicht um den Betreff einer Spammail nicht jugendfreien Inhalts, sondern – wie ihr vielleicht bemerkt habt – um die dritte Strophe von Goethes Gedicht „Selige Sehnsucht“ aus dem fernöstlichen Divan.

Eine Antwort schreiben

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert