Ted Underwoods Distant Horizons
Inhalt / Content
Es ist derzeit eine der absoluten Knaller-Veröffentlichungen der Digital HumanitiesAuch als digitale Geisteswissenschaften bezeichnet. Ein Forschungsfeld, in dem vielfältige digitale Methoden eingesetzt werden, um geisteswissenschaftliche Projekte zu bereichern. Das können z.B. Computerprogramme zur Textanalyse sein oder Software, mit der digitale Editionen zugänglich gemacht werden. Zum Feld der digitalen Geisteswissenschaften kann auch die Beschäftigung mit Phänomenen der Digitalisierung und die digitale Wissenschaftskommunikation gezählt werden. More! Eigentlich sollte jeder, der sich auch nur im Entferntesten mit digitalen Methoden in den Geisteswissenschaften beschäftigt es gelesen haben: Ted Underwoods Distant Horizons. Dieses Buch ist nicht nur methodisch interessant. Es bietet auch inhaltlich spannende Erkenntnisse aus dem Bereich der Literaturgeschichte. Man muss nicht immer einverstanden sein mit den Modellen, die Underwood vorschlägt. Trotzdem bieten sie immer einen guten Anknüpfungspunkt für eigene Ideen. Mehr noch, sie inspirieren und lassen die Gedanken so richtig ins Fließen kommen. Etwas schade, dass dieses voller Mehrwert steckende Buch seitens der traditionellen Literaturwissenschaft sofort scharf angegriffen wurde. Warum du dieses Buch trotzdem und gerade deshalb auf jeden Fall lesen solltest, was die Lektüre bewirken kann und warum sie als Beitrag zum „Digital HumanitiesAuch als digitale Geisteswissenschaften bezeichnet. Ein Forschungsfeld, in dem vielfältige digitale Methoden eingesetzt werden, um geisteswissenschaftliche Projekte zu bereichern. Das können z.B. Computerprogramme zur Textanalyse sein oder Software, mit der digitale Editionen zugänglich gemacht werden. Zum Feld der digitalen Geisteswissenschaften kann auch die Beschäftigung mit Phänomenen der Digitalisierung und die digitale Wissenschaftskommunikation gezählt werden. More War” wahrgenommen wurde, erfährst du heute hier.
Underwoods Distant Horizons – Literaturgeschichte digital erforschen
Was Ted Underwood sich in Distant Horizons vorgenommen hat, ist keine kleine Sache. Er betrachtet ganze 300 Jahre Literaturgeschichte anhand von tausenden Prosawerken. Für die Literaturwissenschafts-Cracks unter euch: Ja, er bezieht sich „nur“ auf englischsprachige Literatur. Er nimmt sich unterschiedliche Themen vor, wie z.B. Genre, Prestige und Gender. Dann schaut er immer auf die Entwicklung des Korpus über die Jahre, Jahrzehnte und Jahrhunderte hinweg. Die Masse an Literatur, die Underwood hier betrachtet, kann keiner in einem Menschenleben lesen. Darum ist irgendwie klar, dass er Distant ReadingAls Distant Reading wird im Zusammenhang mit den digitalen Geisteswissenschaften eine Technik des nicht-Lesens verstanden. Bücher werden von einem oder mehreren Computerprogrammen gelesen, die nach bestimmten Kriterien informative Daten aus den Texten bereitstellen. Der Begriff des Distant Readings geht auf Franco Moretti zurück. More Methodik nutzt. Naja und ihr kennt mich inzwischen ja auch schon ganz gut, auch meine Begeisterung für das Werk rührt natürlich zum Teil auch daher, dass er diese Methodik nutzt. Underwoods Untersuchungen basieren auf dem Wortmaterial und Worthäufigkeiten, die mit Hilfe des Computers errechnet und ausgewertet werden. Insgesamt baut er also ein ziemlich typisches Digital-Humanities-Forschungs-Setting auf.
Die Highlights
Was aber macht die besondere Qualität von Underwoods Distant Horizons aus? Irgendwie klar, dass die Methodik, die er nutzt zu den neuesten Techniken der DH gehört. Ebenso ist klar, dass er sie sauber und nachvollziehbar anwendet. Das ist Handwerkszeug und löst für sich genommen noch keine Begeisterungsstürme aus. Nein, was mir besonders gefällt, ist die Vielfalt seiner Analysen. Er wählt mehrere spannende Themen aus und dokumentiert kurz und präzise sein Vorgehen und seine Schlussfolgerungen. Kein Geschwafel, keine Eitelkeiten, nur spannendes Forschungs-Output. Gleichzeitig sind die Themen seiner Wahl hochaktuell und relevant für unterschiedliche Bereiche der Literaturwissenschaft.
Über die Technik digitaler Vorhersage
Aber noch einen kleinen Schritt zurück. Ich weiß zwar, dass die meisten von uns eher für Inhalte als für Methoden brennen, aber ein bisschen was zum Vorgehen muss ich hier sagen. Ich kann euch aber auch gleich wieder beruhigen, denn Underwood selbst macht in seinem Buch überraschend wenig Aufhebens um seine Tools und Methoden. Wahre Technik-Nerds bekommen eigentlich erst im Anhang, wonach sie während der Lektüre vergeblich suchen. Die Antwort auf die Frage, wie Underwood das alles genau gemacht hat, bleibt lange unbeantwortet. Hier löse ich sie dagegen sofort auf: Mit der Technik der digitalen Vorhersage.
Algorithmisch liegt dahinter ein komplexes System aus statistischen Auswertungen des Wortmaterials von Texten. Genaueres erspare ich dir hier, du kannst es ja in Underwoods Distant Horizons nachlesen. Wichtig zum Verständnis ist, dass der Computer mit einem Teil der Texte lernt, deren statistische Daten auszuwerten und Muster zu erkennen. Anhand solcher Modelle kann er dann andere Texte nach bestimmten Kriterien klassifizieren. Am Ende kann er also quasi vorhersagen, in welche Kategorien ein Text (oder eine Figur, eine Passage etc.) gehört. Das an sich ist schon toll, aber für den Forscher ist jetzt natürlich besonders eine Frage spannend: Warum klassifiziert der Computer so, wie er es eben tut. Und genau dieser Frage geht Underwood in seinem Buch nach.
Über Genre und literarisches Prestige
Underwood betrachtet z.B. Texte, die als literarisch wertvoll gelten und testet, ob sie vom Computer als solche erkannt werden können. Literarisch wertvoll bedeutet hier übrigens in kleinen Feuilletons gelobt worden zu sein. Erinnert dich an etwas? Ja, richtig, etwas ganz ähnliches hatte Matthew Jockers in Der Bestsellercode auch gemacht und zwar mit Büchern, die Preise gewonnen haben. Underwood nimmt sich auch den Genres an und probiert aus, ob der Computer erkennen kann, ob ein Buch z.B. ein Krimi ist oder ein Science Fiction Roman. Das funktioniert überraschend gut. Warum? Das kann Distant Horizons euch besser beantworten als ich. Und ich möchte auch einfach nicht zu viel spoilern.
Gender digital modelliert
Für mich war mit Abstand das spannendste Kapitel das über Genderzuschreibungen. Und zwar interessiert Underwood sich nicht für Autorengender (das durchaus schon in anderen Untersuchungen betrachtet worden ist u. A. auch von Jockers), sondern für Figurengender. Jetzt denkst du vielleicht „WAS Figurengender? Nichts leichter als das, da stehen doch immer Personalpronomen dabei.“ Aber das ist es natürlich nicht, was in dieser Untersuchung von Bedeutung ist. Ja, Personalpronomen werden sogar von der Untersuchung ausgeschlossen. Und trotzdem kann der Computer ziemlich genau erkennen, was eine weibliche und eine männliche Figur ist.
Naja, um genau zu sein kann er das in bestimmten Phasen der Literaturgeschichte ziemlich genau erkennen, in anderen schlechter (nämlich in älteren Phasen besser in neueren schlechter). Und natürlich bleibt die Untersuchung hier nicht stehen. Statt dessen schaut Underwood auch, welche Wörter besonders häufig im Zusammenhang mit weiblichen und welche eher bei männlichen Figuren stehen. Zum Beispiel wurde in einer bestimmten literaturwissenschaftlichen Phase das Wort „grin“ also grinsen hauptsächlich für männliche Figuren benutzt. Weibliche Figuren lächelten dagegen häufiger („smile“). Es gibt natürlich noch andere für Figurengender bedeutsame Wörter. Und natürlich variieren sie nach Phasen. Underwoods digitales Modell von Gender ergibt sich also fast wie beim Reverse-Engineering daraus, was dem Computer erlaubt, möglichst exakte Vorhersagen zu treffen. Das ist in meinen Augen ein höchst interessanter Ansatz. Obwohl es sicher nicht der einzige Ansatz ist, mit dem man Figurengender digital modellieren kann.
Der Digital Humanities Krieg
Ich finde es ziemlich schade, das ausgerechnet das Kapitel über Figurengender wohl am heftigsten von der traditionellen Literaturwissenschaft kritisiert wurde. Und doch war es irgendwie klar und zeigt auch, wie produktiv gerade dieses Kapitel ist. Nein, ich selbst möchte mich nicht in die Debatte einmischen, die inzwischen schon als „The Digital HumanitiesAuch als digitale Geisteswissenschaften bezeichnet. Ein Forschungsfeld, in dem vielfältige digitale Methoden eingesetzt werden, um geisteswissenschaftliche Projekte zu bereichern. Das können z.B. Computerprogramme zur Textanalyse sein oder Software, mit der digitale Editionen zugänglich gemacht werden. Zum Feld der digitalen Geisteswissenschaften kann auch die Beschäftigung mit Phänomenen der Digitalisierung und die digitale Wissenschaftskommunikation gezählt werden. More Wars“ bezeichnet wird und die ich dir gerne hier verlinke, falls du sie noch nicht kennst. Aber so viel sei doch dazu gesagt: Hätte Underwood nicht gezeigt, dass Digital HumanitiesAuch als digitale Geisteswissenschaften bezeichnet. Ein Forschungsfeld, in dem vielfältige digitale Methoden eingesetzt werden, um geisteswissenschaftliche Projekte zu bereichern. Das können z.B. Computerprogramme zur Textanalyse sein oder Software, mit der digitale Editionen zugänglich gemacht werden. Zum Feld der digitalen Geisteswissenschaften kann auch die Beschäftigung mit Phänomenen der Digitalisierung und die digitale Wissenschaftskommunikation gezählt werden. More langsam aber sicher in die Kernbereiche der traditionellen Geisteswissenschaften vordringen, so wäre sein Buch nicht einer solch heftigen und ziemlich emotionalen Kritik „würdig“ gewesen.
Vor allem das Gender- Kapitel zeigt nämlich, dass Digital HumanitiesAuch als digitale Geisteswissenschaften bezeichnet. Ein Forschungsfeld, in dem vielfältige digitale Methoden eingesetzt werden, um geisteswissenschaftliche Projekte zu bereichern. Das können z.B. Computerprogramme zur Textanalyse sein oder Software, mit der digitale Editionen zugänglich gemacht werden. Zum Feld der digitalen Geisteswissenschaften kann auch die Beschäftigung mit Phänomenen der Digitalisierung und die digitale Wissenschaftskommunikation gezählt werden. More mehr kann als „nur“ quantitative Daten generieren. Es zeigt, dass die digitale Methode ein guter Einstieg in die qualitative Interpretationsarbeit bietet. Damit meine ich nicht nur Interpretation von Daten, sondern von literaturgeschichtlichen Phänomenen. Underwoods Ansatz, Gender zu modellieren ist nur eine von vielen interpretativen Möglichkeiten, die die Digital HumanitiesAuch als digitale Geisteswissenschaften bezeichnet. Ein Forschungsfeld, in dem vielfältige digitale Methoden eingesetzt werden, um geisteswissenschaftliche Projekte zu bereichern. Das können z.B. Computerprogramme zur Textanalyse sein oder Software, mit der digitale Editionen zugänglich gemacht werden. Zum Feld der digitalen Geisteswissenschaften kann auch die Beschäftigung mit Phänomenen der Digitalisierung und die digitale Wissenschaftskommunikation gezählt werden. More leisten können. Es werden garantiert viele Anschlussuntersuchungen folgen und diese werden immer tiefer in die Literatur eintauchen. So viel ist für mich völlig klar. Und ohne zu viel verraten zu wollen, kann ich hier schon sagen, dass auch mich das Thema digitales Modellieren von Gender weiter beschäftigen wird.
Du möchtest mehr über Ted Underwoods „Distant Horizons“ lesen? Auf Weltliteratur.net hat Frank Fischer eine Übersicht von Reviews und Diskussionen zu diesem Buch zusammengestellt.
3 Kommentare
Fotis Jannidis
Bin ebenfalls begeistert von Ted Underwoods Buch. Glaube aber, dass man das nicht mit falschen Erwartungen lesen sollte: „Irgendwie klar, dass die Methodik, die er nutzt zu den neuesten Techniken der DH gehört.“ Aktuelle Methoden wären Deep Learning-Verfahren zur Klassifikation oder wenigstens so etwas wie XGBoost. Aber er verwendet ganz programmatisch noch nicht einmal Support Vector Machines (1963/1992), sondern Logistische Regression (lt. Wikipedia nach Vorläufern im 19. Jh. ca. 1920), weil ihm die Interpretierbarkeit der Resultate und die Transparenz des Verfahrens besonders wichtig sind. Seine Argumente dafür und dagegen im Methodenkapitel sind – wie das ganze Buch – sehr lesenswert. Ich denke, es gibt zur Zeit keinen Forschenden im Bereich Computational Literary Studies, der auf diesem Niveau technisches Wissen und methodische Reflexion verbindet. Aber sein Buch ist, anders als es etwa Jockers Buch 2013 sein wollte, keine Einführung in das, was zur Zeit technisch machbar wäre.
MKSchumacher
Lieber Herr Jannidis,
vielen Dank für Ihren Kommentar, der mich sehr zum Nachdenken angeregt hat. Es ist wahr, „Distant Horizons“ ist definitiv kein einführendes Werk. Und abgesehen von der bewusst sehr lachsen Formulierung, die ich hier genutzt habe, um das Methodische etwas auszuklammern, ist mir aufgefallen, dass ich tatsächlich beim Lesen von Underwoods Buch die Methodik und den Gegenstand sehr stark (vielleicht etwas zu stark) miteinander verwoben habe. Ich fand es so schlüssig, dass er, ausgehend von seinen Fragestellungen eben diese Methodik verwendet hat, die vielleicht nicht das Innovativste ist, was derzeit in den DH erprobt wird, die ihn aber erstaunlich weit bringt, was die literaturwissenschaftlichen Erkenntnisse angeht. Dieses Vordringen zu wirklich interessanten literarhistorischen Beobachtungen fand ich wirklich bemerkenswert. Also ist es wahrscheinlich eher die Einheit von Methode und Erkenntnisinteresse, die mir beim Lesen als so herausragend erschienen ist, dass ich den Eindruck hatte, dass dies tatsächlich eine der wenigen DH-Monografien der letzten Jahre ist, die so weit vordringt. Aber beim Nachdenken ist mir eben auch aufgefallen, dass ich die Technik beim Lesen dieses Buches, aber wahrscheinlich auch generell, eher als Teil des gesamten methodischen Vorgehens betrachte; eine Einheit aus Erkenntnisinteresse, Operationalisierung und technischer Umsetzung. Nun, da mir dies aufgefallen ist, werde ich versuchen an dieser Stelle in Zukunft stärker zu differenzieren.
Nun bin ich etwas am Überlegen, ob ich den Artikel noch einmal überarbeite, um ihn als solchen einfach besser zu machen, oder es so stehen zu lassen, um dieser Diskussion nicht die Grundlage zu entziehen. Wahrscheinlich werde ich mich aber für Letzteres entscheiden.
Eine letzte Anmerkung noch zum Buch: Ich denke, dass gerade die Tatsache, dass wir es hier nicht mit einer Einführung zu tun haben, das Buch durchaus das Potential hat, nicht DH-Geisteswissenschaftler*innen zumindest neugierig zu machen. Denn im Gegensatz zu technisch ausgerichteten Einführungen wie der von Jockers, macht es einfach Lust darauf, zu ähnlichen Einsichten zu kommen. Die inhaltliche Ausrichtung könnte für Viele sehr anziehend wirken. Wahrscheinlich anziehender als eine Anleitung, in der man sich mühsam ins Scripten in R einarbeitet, ohne gleich zu Beginn zu sehen, zu welchen literaturwissenschaftlich relevanten Einsichten einen das Ganze bringen kann. Nicht, dass ich eine solche Anleitung nicht auch wichtig finde, aber ich denke die Motivation sich da durchzuarbeiten könnte nach einer anregenden Lektüre wie der von Underwoods Buch einfach weit höher sein als ohne.
So weit erst einmal meine ersten Gedanken dazu, ich denke, das Nachdenken wird bei mir noch etwas anhalten, aber während der Gedankenstrom noch fließt, schicke ich schon einmal viele Wochenendgrüße nach Würzburg!
Pingback: