Wissenschaft im Trend: Big-Data-Algorithmus findet die nächsten großen Bestseller

In ihrem kürzlich veröffentlichten Buch „The Bestseller Code: Anatomy of a Blockbuster Novel“ beschrieben zwei Wissenschaftler der Stanford University, wie ein von ihnen entwickelter Algorithmus mit einer Zuverlässigkeit von 80 % vorhersagen kann, welche neuen Romane sich zu Bestsellern entwickeln werden.

Genau wie viele andere Bereiche der Kultur- und Kreativwirtschaft, wie etwa Film und Fernsehen, ist auch das Verlagswesen Hits abhängig. Doch nach wie vor ist es eine hohe Kunst, einen zukünftigen Bestseller auch als solchen zu erkennen, und Verleger verlassen sich meist auf ihr Bauchgefühl, auf Erfahrung gestützte Vermutungen und auf ihr Wissen darüber, was schon früher gut verkäuflich war. Dies führt selbstredend nicht immer zum gewünschten Ergebnis –einige der meistverkauften und von Kritikern am höchsten gelobten Werke wurden mehrfach abgelehnt, bevor ihre Autoren einen Verleger finden konnten. Dazu zählen J. K. Rowling mit „Harry Potter und der Stein der Weisen“, Stephen King mit „Carrie“ (das insgesamt 30 Mal abgelehnt wurde) und Frank Herbert mit seinem Science-Fiction-Meisterwerk „Dune“, um nur drei Beispiele für Autoren zu nennen, die nach Abschluss eines Vertrages letztendlich hoch erfolgreich wurden und die literarische Landschaft mit ihren Werken prägten.

Der neue Algorithmus, der von seinen Entwicklern „Bestseller-Ometer“ genannt wird, könnte hier Abhilfe schaffen. Seitdem digitale E-Books seit den 2000er Jahren immer beliebter werden, verlassen sich Verleger nicht mehr ausschließlich auf ihr Bauchgefühl, sondern wenden auch zunehmend Big Data an – und bei diesem Trend setzt der Algorithmus an. Die Entwicklung begann im Jahr 2008 an der Stanford University, als die Doktorandin Jodie Archer gemeinsam mit Matthew L. Jockers, einem Associate Professor für Englisch (der nun an der University of Nebraska-Lincoln tätig ist, jedoch an der Gründung des Stanford Literary Lab beteiligt war), erforschen wollte, wie Computer Bücher auf eine Art und Weise analysieren und verstehen können, auf die es Menschen nicht vermögen.

Die Merkmale des perfekten Romans

Nach mehreren Jahren der Zusammenarbeit analysierten die Forscher mit der Rechenleistung tausender Computer 20 000 Romane von der Bestsellerliste der New York Times. Diesen Computern brachten sie sozusagen das Lesen bei, sodass diese Satzanfänge und -enden sowie Abschnitte mit direkter Rede erkennen und die Handlung grob nachvollziehen konnten. Anschließend ermittelten sie mithilfe spezieller Auswertungsalgorithmen die Merkmale, die Bestseller am häufigsten aufweisen. Inzwischen kann das Bestseller-Ometer mit einer Zuverlässigkeit von 80 % voraussagen, ob ein neuer Roman sich zu einem Hit oder einem Flop entwickeln wird.

Was sind also die entscheidenden Faktoren, die nach dem Beststeller-Ometer einen neuen Bestseller wahrscheinlich machen? Ein junge, starke aber dennoch emotional aufgewühlte Heldin (denken Sie nur an Katniss Everdeen aus „Die Tribute von Panem“ oder an Lisbeth Salander aus „Verblendung“) ist ein guter Anfang. Sex sollte nicht zu detailliert beschrieben werden, sondern eher zwischenmenschliche Beziehungen. Es sollten nicht zu viele Ausrufezeichen gesetzt und nicht übermäßig viele Adjektive und Adverbien verwendet werden, stattdessen sollten regelmäßig Verben wie „müssen“ oder „brauchen“ vorkommen, und wenn der Protagonist ein Haustier hat, sollte dies eher ein Hund als eine Katze sein. Auch Umgangssprache stellt kein Problem dar – die Leser von Bestsellern bevorzugen einen informellen Stil und Ausdrücke wie „uff“ und „okay“. Zu guter Letzt ist auch der Buchtitel von Bedeutung: Ein einfaches Nomen wirkt ansprechend, wie bei „The Goldfinch“ („Der Distelfink“) von Donna Tartt oder bei „The Island“ („Die Insel der Vergessenen“) von Victoria Hislop.

Die Nummer eins des Algorithmus

Archer und Jockers waren gespannt, welchen der tausenden Romane die Software am besten bewerten würde. Als Lieblingsroman des Algorithmus stellte sich „The Circle“ („Der Circle“) von Dave Eggers heraus, ein Thriller aus dem Jahr 2013, in dem eine junge College-Absolventin eine Stelle bei einem mächtigen Technologieunternehmen antritt, das den düsteren Plan verfolgt, die Anonymität im Internet zu zerstören und die Welt so nach den eigenen Vorstellungen umzugestalten.

Die hohe Bewertung begründet sich insbesondere durch den weiblichen Hauptcharakter, durch den Umstand, dass „müssen“, „brauchen“ und „wollen“ die am häufigsten verwendeten Verben waren sowie durch den Fokus auf drei bestimmten Themen – Technologie, Berufsleben und zwischenmenschliche Beziehungen. Letztere Thematik findet laut dem Algorithmus in allen Bestsellern insgesamt am meisten Beachtung. Vor allem aber wurde „The Circle“ tatsächlich zum Bestseller und hielt sich über mehrere Wochen hinweg in der Bestsellerliste der New York Times.

Archer ist sich jedoch auch der Ironie dieses Ergebnisses bewusst – in „The Circle“ wird eine dystopische Zukunft beschrieben, welche auf die Gefahren von Big Data und der Technologie aufmerksam macht, die in immer mehr Bereichen unseres Lebens eine wichtige Rolle spielt.

Obwohl Archer und Jockers derzeit nicht die Vermarktung ihrer Software planen, wird sich Big Data auch auf absehbare Zeit noch mehr auf das Verlagswesen auswirken. Die verstärkte Anwendung von Datenanalyse birgt jedoch die Gefahr, dass Verlage zur Gewinnmaximierung weniger unterschiedliche Erzählstile zulassen. „Wir befürchten, dass der Algorithmus den Markt homogenisieren könnte, deshalb haben wir uns gegen eine Vermarktung entschieden“, erklärte Archer. „Ursprünglich sollten mit dem Bestseller-Ometer Verlage vielmehr ermutigt werden, neuen Autoren eine Chance zu geben, auch wenn sie ein finanzielles Risiko darstellen.“

veröffentlicht: 2016-10-05
Kommentare


Privacy Policy