Bestseller or no Bestseller – das ist hier die Frage
Inhalt / Content
Was mache ich nur mit diesem Buch? Diese Frage stelle ich mir im Grunde schon seit ich die ersten paar Seiten von Matthew Jockers‘ und Jodie Archers neuem Buch „Der Bestseller-Code“ gelesen habe. Es steht außer Frage, dass es ein äußerst spannendes Sachbuch ist. Es berichtet über ein kühnes literaturwissenschaftliches Projekt – nämlich den Versuch, Bestseller von nicht-Bestsellern mittels computerunterstützer Methoden zu trennen und sogar Vorhersagbarkeit zu erreichen. Aber: Es ist nicht so ganz Fisch und auch nicht Fleisch. Für ein literaturwissenschaftliches Werk ist es zu unkonkret, genauso wie für einen Schreibratgeber. Trotzdem bietet es seinen Lesern eine sehr unterhaltsame Show. Gewürzt haben die Autoren das ganze natürlich mit viel Digital HumanitiesAuch als digitale Geisteswissenschaften bezeichnet. Ein Forschungsfeld, in dem vielfältige digitale Methoden eingesetzt werden, um geisteswissenschaftliche Projekte zu bereichern. Das können z.B. Computerprogramme zur Textanalyse sein oder Software, mit der digitale Editionen zugänglich gemacht werden. Zum Feld der digitalen Geisteswissenschaften kann auch die Beschäftigung mit Phänomenen der Digitalisierung und die digitale Wissenschaftskommunikation gezählt werden. More Magie (und wenigen Blicken in die Black Box).
Was ist der Bestseller-Code und ist kommerzieller Erfolg bei Büchern vorhersagbar?
Unglaublich aber wahr, dies ist die Fragestellung, der Jockers (ja, der Matthew Jockers, über den ich bereits in der Rezension zu „Macroanalysis“ geschrieben hab) und Archer in einer beeindruckenden fünfjährigen Forschungsarbeit nachgegangen sind. Dass dies nicht unbedingt im Kerninteresse der Literaturwissenschaft, sondern eher für das Literatur-Business von Bedeutung ist, wissen die Autoren selbst. Anscheinend nehmen sie genau das zum Anlass, sich von Ersterer etwas ab- und zu Letzterem etwas hinzuwenden. Natürlich steht am Anfang ihres fünfjährigen Projektes ein wenig Digital HumanitiesAuch als digitale Geisteswissenschaften bezeichnet. Ein Forschungsfeld, in dem vielfältige digitale Methoden eingesetzt werden, um geisteswissenschaftliche Projekte zu bereichern. Das können z.B. Computerprogramme zur Textanalyse sein oder Software, mit der digitale Editionen zugänglich gemacht werden. Zum Feld der digitalen Geisteswissenschaften kann auch die Beschäftigung mit Phänomenen der Digitalisierung und die digitale Wissenschaftskommunikation gezählt werden. More Magie. Als allererstes haben die beiden anhand eines Testkorpus geprüft, ob ein Computer überhaupt einigermaßen zuverlässig Bestseller von nicht-Bestsellern unterscheiden kann. Das Ergebnis war ausreichend beeindruckend, um sich auf die Suche nach dem Bestseller-Code zu begeben.
Was sind Bestseller?
Archer und Jockers haben ein Forschungskorpus aufgebaut, das sage und schreibe 5.000 zeitgenössische Romane umfasst. Diese Bücher haben sie in zwei Gruppen geteilt: Die Beststeller und die nicht-Bestseller. Wie bei jeder guten computergestützten Untersuchung haben sie natürlich auch hier zuerst genau definiert, was ein Bestseller ist. Und hier kommen wir gleich zur ersten Schwäche des Buches. Die Autoren entscheiden sich an dieser Stelle nämlich dafür, diejenigen Romane als Bestseller zu markieren, die es auf die New York Times Bestseller-Liste geschafft haben. Daran ist per se noch nichts verkehrt. Doch im Folgenden gehen die beiden meistens davon aus, dass sie ein mehr oder weniger weltweites Phänomen betrachten. New York Times Bestseller scheinen für sie Weltbestseller zu sein. Das stimmt zwar teilweise, aber eben nur teilweise.
Ein zweiter Punkt ist, dass sie auch Übersetzungen in ihr Korpus aufgenommen haben. Sie betrachten zum Beispiel die Millemium-Reihe von Stig Larsson. Und obwohl sie ein wenig darauf herum reiten, dass die sprachlichen Gepflogenheiten im britischen und amerikanischen Englisch variieren, verlieren sie keine Worte darüber, was die Übersetzung für die auf Sprache basierenden Analysen bedeuten könnte. Es wird also nicht so richtig klar, welche Störfaktoren hier auf die Untersuchung eingewirkt haben könnten. Vielleicht zeigt dies aber auch nur ein, dass wir es eben gerade nicht mit einer wissenschaftlichen Abhandlung zu tun haben.
Die magische Black Box
Damit sind wir auch schon bei dem Thema, das mich beim Lesen am meisten frustriert hat. Die Methode bleibt vage und so etwas wie Reproduzierbarkeit sucht man vergebens. Nun kann man als digitaler Geistewissenschaftler zwar einzelne Bausteine des von Jockers und Archer liebevoll “Bestseller-o-meter” genannten Wunderalgorithmus erahnen. Da ist etwas Stilometrie mit drinnen, Topic Modelling, Sentiment Analysis und noch ein paar andere Methoden. Auch auf nicht digitale Methoden wie eine vergleichende Analyse von Titeln greifen die beiden zurück.
Immer wieder kommen die Autoren darauf zu sprechen, dass ihr Computer ihnen Wahrscheinlichkeiten geben würde, wie z.B. “Dieses Buch ist zu 96,7% ein Bestseller”. Wie genau er zu einer solchen Einschätzung kommt, ist mir nicht klar geworden. Gibt es eine Art Tool-Pipeline mit Hilfe derer am Ende eine Gesamtauswertung vorgenommen wird? Oder bestimmen die Autoren aus den Einzelauswertungen selbst einen Mittelwert? Und wie passt so etwas wie eine Titel-Analyse ins Bild? Gibt es tatsächlich den einen, bahnbrechenden Algorithmus zur Vorhersage eines Bestsellers, den Autoren und Verlagen propagieren? Oder sind doch eher viele Einzelschritte nötig?
Es ist mir klar, dass die Autoren nie das Versprechen machen, auf diese Fragen einzugehen und dass dahinter wahrscheinlich marktstrategische Gründe stehen. Eine bewusste Abkehr von der wissenschaftlichen Community ist auch denkbar. Schließlich haben Archer und Jockers tatsächlich eine Literatur-(oder sollte ich besser sagen Bestseller-)Agentur gegründet. Trotzdem machte es mich beim Lesen ganz kribbelig, dass genau diese Details hinter Allgemeinheiten verschleiert blieben.
Der Bestseller-Code
Genug gemeckert, kommen wir endlich zu den Errungenschaften dieses Buches. Zunächst einmal rückt es Bücher in den Vordergrund, die viele Menschen gelesen haben und das oft auch sehr gerne. Dafür wurden sie zwar bereits in anderen Rezensionen gelobt, aber ich führe das hier auch noch einmal an, da dies wirklich auch ein literaturwissenschaftlich bedeutsamer Schritt ist. Außerdem haben sie das Unglaubliche tatsächlich geschafft. Sie haben ein ziemlich belastbares System von Textanalysen auf Wortbasis gebaut, das nicht nur die Gemeinsamkeiten amerikanischer Bestseller analysiert, sondern auch Texte auf ihre Bestseller-Tauglichkeit prüfen kann.
Die Beschreibungen der Eckpfeiler dieses Systems und die Merkmale von Bestsellern und kommerziell weniger erfolgreichen Büchern sind mega-spannend. Sie berichten von häufig verwendeten Wörtern oder quantitative Verteilung von Themen in Texten. Auch konkrete Tipps für Autoren können dabei herauskommen. So empfiehlt es sich z.B. sich auf einige wenige Themen zu beschränken. Die drei bis vier Hauptthemen sollten rund 40% des Textes oder mehr einnehmen.
Die Themen des Bestseller-Codes…
Eines dieser Themen sollte menschliche Nähe oder Beziehung sein. Auch Themen wie Beruf und Arbeit und auch Familienleben machen sich gut im Bestseller-Code eines Buches. Politik ist ein schlechtes Thema, ebenso wie Erotik (und von dieser Erkenntnis sind die Autoren wirklich sehr begeistert). Auf eine regelmäßige Spannungskurve mit vielen Hochs und Tief sollten Bestseller-Spekulanten außerdem achten. Ein als journalistisch identifizierter Schreibstil ist gut, um Bücher zu verkaufen. Ein von Literaturwissenschaftlern geprägter Stil holt die großen Preise wie z.B. den Pulitzer. Ach ja und Hunde verkaufen sich besser als Katzen.
…und wie uns diese präsentiert werden
Etwas, das bei diesem Buch auch hervorsticht ist der Schreibstil. Ja, wirklich, die Autoren sind humorvoll und verstehen es außerdem, eine gewisse Spannung aufzubauen. Das Buch liest sich gut weg und man könnte es tatsächlich sogar als Page-Turner bezeichnen. Natürlich fragt man sich permanent, ob sie ihr eigenes Buch mit Hilfe ihres Bestseller-o-meters optimiert haben und natürlich werden ihre stilistischen Analysen sie sensibilisiert haben. Mit oder ohne algorithmische Unterstützung, dieses Buch ist wirklich eine angenehme Lektüre und das ist für ein Sachbuch schon recht ungewöhnlich vor allem für ein literaturwissenschaftlich geprägtes.
Objektivität, Reliabilität, Validität
Die statistischen Methoden, die Jockers und Archer in ihrem „Bestseller-Code“ beschreiben sind wohl so objektiv wie sie in einem literaturwissenschaftlichen Kontext nur sein können. Wie aber verhält es sich denn nun mit den anderen ob Gütekriterien der Wissenschaft – Objektivität, Reliabilität, Validität? Nun, ich denke, für den Testfall Amerika, den die Autoren in ihren – ich nenn sie mal – Laborexperimenten betrachtet haben, kann man zumindest die Verlässlichkeit attestieren. Die beiden Literaturkenner haben ihr System wirklich auf Herz und Nieren geprüft und sich auch Herausforderungen gestellt. So haben sie z.B. erfolgreich das Phänomen „fifty Shades of Grey“ untersucht, das trotz des erotischen Themas in seinem Wortmaterial das Bestseller-Potential zu erkennen gegeben hat.
Objektive Daten und eine innovative Idee
Insgesamt kommen sie auf eine Trefferquote von 80% bei Vorhersagen unter Laborbedingungen, was schon mehr als ordentlich ist und weit über einem zufälligen 50:50 liegt. Bisher Haben Archer und Jockers noch kein unveröffentlichtes Werk als Bestseller identifiziert. Aber einem befreundeten Autor konnten sie wenigstens erklären, warum man sein Manuskript abgelehnt hat und wie er es verbessern könnte. Die Zukunft wird zeigen, ob ihre Idee einer Literatur-Agentur, in der einer der Hauptmitarbeiter ein Computer ist, tatsächlich fruchtet. Ein innovativer Ansatz ist es auf jeden Fall.
Wie verlässlich kann so ein Bestseller-o-meter sein?
Aber die Übertragbarkeit bereitet mir Sorge und somit auch die Validität der Erkenntnisse in diesem Buch. Was würde das Bestseller-o-meter z.B. mit einem Roman machen, in dem einer der Protagonisten ein kommunistisches Känguru ist und der trotzdem wochen- ja sogar monatelang auf der Spiegel Bestseller Liste ganz oben stand? Zu gern würde ich sehen, wie Die Autoren ihre beeindruckende Studie auf andere Testumgebungen anwenden. An einer Stelle erwähnen sie z.B. , dass auf dem amerikanischen Markt nach Stieg Larsson schwedische Krimis erst ausgesprochen en vogue waren und dann schnell vergessen wurden. Hier zu Lande aber sind schon seit den 70er Jahren und dem Autorenduo Sjöwall/Wahlöö skandinavische Krimis anhaltend beliebt…
Ein feiner Spaß oder doch etwas mehr?
Am Ende läuft es natürlich darauf hinaus, dass man gerne selbst einmal ein bisschen mit so einem Wunderalgorithmus (wenn es ihn denn gibt, den „Einen“) herumspielen würde. Da das in absehbarer Zeit aber nicht möglich sein wird, wird uns nichts anderes übrig bleiben als weiter zu schauen, ob Archer und Jockers noch mehr in Sachen Bestseller-Code aus ihrem Kaninchenhut holen. Die digitale Literaturwissenschaft wird dieses am ehesten als populärwissenschaftliche Sachbuch einzuordnende Werk vielleicht eher am Rande wahrnehmen und sich nicht plötzlich zu einem Forschungsfeld für Bestseller wandeln. Aber trotz aller Zerrissenheit, was meine Meinung zu diesem Buch angeht, bereue ich keine Seite, die ich darin gelesen habe. Es hat nämlich schlicht und einfach Spaß gemacht!
Jodie Archer und Matthew Jockers: „Der Bestseller-Code“, erschienen im Plassen-Verlag Juli 2017. ISBN: 9783864704994 Preis: 19,99€ in der gebundenen Ausgabe.