3 Google, Facebook & Co.: Was können und was planen die Big Five?
Der kontroverse deutsche Psychiater und Medienskeptiker Manfred Spitzer sagte einmal sinngemäß, er wolle in keiner Medienwelt leben, die von fünf amerikanischen Konzernen beherrscht wird. Diese »Big Five«, so der Sprachgebrauch seit einiger Zeit, sind Google, Facebook, Apple, Microsoft und Amazon. Von Suchservices bis zu Handybetriebssystemen arbeiten alle fünf an ähnlichen Themen und kommen doch aus ganz unterschiedlichen Kontexten. Jaron Lanier sagte dazu kürzlich in einem Interview mit Christoph Drösser in der »Zeit«:
»Unter den fünf großen Tech-Firmen sind nur zwei, die abhängig sind von diesem süchtig machenden Geschäftsmodell, das sind Google und Facebook. Sie verdienen Geld nur über Online-Anzeigen. Die anderen drei, Apple, Amazon und Microsoft, verkaufen auch richtige Produkte und Dienstleistungen.«1
Die deutschsprachige Kommunikationswissenschaft nennt die »Big Five« seit einiger Zeit etwas sperrig die »Tech-Intermediären«. Das soll heißen, dass diese auf so gut wie allen technologischen Medienkanälen als Technologieführer und »Vermittlungsinstanzen« aktiv sind: An ihnen führt kein Weg vorbei.
Wenn es um den Trend zu automatisch generierten Inhalten geht, ist es also unvermeidlich, sich den Status quo der »Big Five« genauer anzusehen und diese zu fragen, was die Zukunft mit sich bringen wird. Dazu gleich vorweg: Je bedeutender der »Tech-Intermediäre«, desto weniger auskunftsfreudig war er. Auch nach zunächst wohlwollenden Reaktionen mehrerer Pressesprecher und PR-Agenturen verweigerten letztlich sowohl Google als auch Facebook jegliche Auskunft über Betaversionen und geplante Entwicklungen.
Es ist erstaunlich, wie intransparent und zugeknöpft diese vermeintlich liberalen Unternehmen sind. Auch die Tatsache, dass zwar immer wieder reagiert und hin und her delegiert wurde, aber letztlich keine verwertbare Antwort kam, zeugt nicht von Effizienz. Apple und Wikipedia, vor allem aber kleinere Unternehmen und Start-ups erwiesen sich nicht nur als auskunftsfreudiger, sondern haben mitunter den Autor gleich in die jeweilige Company eingeladen.
Zunächst kurze definitorische Überlegungen: In einem erweiterten Sinne sind jede Liste von Google-Ergebnissen und jeder Facebook-Newsfeed automatisch generierter Content, da die Abfolge der Einzel-Items von Algorithmen bestimmt wird: Bei den Ergebnissen der Google-Websuche spielen geografische (via IP-Adresse) und persönliche (vergangenes Suchverhalten via Cookies) Determinanten eine Rolle, vor allem eben bei Suchbegriffen wie »Bäcker« oder »Zahnarzt«, bei denen Google annimmt, dass der/die NutzerIn einen lokalen Bezug impliziert oder eben bei Suchbegriffen, die der/die NutzerIn in der Vergangenheit bereits häufig eingetippt hat. Ich habe aber festgestellt, dass sich etwa auch die ersten zehn Suchergebnisse der GoogleWebsuche »Alternative für Deutschland« zwischen einem Nutzer in Dresden, Deutschland, und einem Nutzer in Klagenfurt, Österreich, ab dem vierten Treffer zu unterscheiden beginnen – ohne dass bei beiden eine Suchhistorie des Begriffs bestehen würde (beide nutzten google.de).2 Wenn man aber auch Google-Ergebnisse oder Facebook-Newsfeeds als automatisch erzeugte Inhalte bezeichnen möchte, wie nennt man dann etwa Facebook-Freundschaftsalben oder roboterjournalistische Texte? Ich beschränke mich im Folgenden auf die Definition von automatisch generiertem Content im engeren Sinne. Google-Ergebnisse oder Facebook-Newsfeeds sind hingegen von Algorithmen gerankter Content. Dieser kann wiederum automatisch generierte Inhalte als Content-Items bzw. -Elemente enthalten.
Automatisch erzeugter/produzierter/generierter Inhalt bzw. Content kann somit als jener Content definiert werden, der eine abgeschlossene Sinneinheit darstellt (etwa Bilderalbum, journalistischer Bericht, Computergrafik, Explainer Video), die in diesem Arrangement/in dieser Abfolge der Bestandteile nicht von Menschenhand produziert wurde, sondern das Ergebnis der Anwendung von Algorithmen ist – mitunter aber auf der Basis von Templates, deren Inhalte die Menschen vorab produziert hatten. Die entscheidende Frage ist daher: Fand ein automatisches Neu-Arrangement von Bestandteilen/ Elementen innerhalb der Sinneinheit statt? – Freilich müssen wir zugestehen, dass die Grenze zwischen automatisch generierten Inhalten und anderen Formen des automatisierten Einwirkens auf Inhalte (wie Inhalte-Extraktion, -Hierarchisierung oder -Zusammenfassung) zu einem gewissen Grad auch fließend ist – wie dies bei nahezu allen sozialwissenschaftlichen Definitionen der Fall ist.
3.1Google
Bei Google konnten acht Features bzw. Erscheinungsformen identifiziert werden, die mit dem automatischen Extrahieren und/oder Generieren von Content zu tun haben. Auffallend ist dabei, dass Google häufig auf Quellenangaben bei automatischen Inhalten verzichtet und eine manuelle Änderung des Contents oftmals trotz Feedback-Option nicht möglich ist.
Featured Snippets
Es handelt sich dabei um automatisch extrahierte Texte, die Antworten auf einfache in die Suchmaschine eingetippte Fragen darstellen. Diese erhalten den Platz 0 auf der Trefferliste, d. h. in der organischen Suche. Google entscheidet selbst, welche Suchbegriffe bzw. Suchanfragen mit einem Featured Snippet beantwortet werden.3 Erstaunlich viele Suchanfragen werden nicht mit einem Featured Snippet versehen. Eine Logik der Abgrenzung ist eigentlich nicht erkennbar. Auch lässt sich nicht beeinflussen, von welcher Webseite das Featured Snippet entnommen wird. Bei deutschsprachigen Google-Seiten dürften dies häufig der Duden oder die Wikipedia sein.
Abb. 3–1 Featured Snippet oberhalb der Trefferliste zur Suche »Cursor«
Quelle: Screenshot von [ECO] https://www.google.de
Google entscheidet am Beispiel der Suche »Cursor« etwa, dass nicht der entsprechende Wikipedia-Eintrag angezeigt wird, sondern die Praxistipps-Seite von chip.de. Quellen- und Datumsangabe sind erfolgt, auch das Bild wurde von der Quelle mit übernommen.
Abb. 3–2 Featured Snippet oberhalb der Trefferliste zur Suche »Was heißt Copy/Paste?«
Quelle: Screenshot von [ECO] https://www.google.de
»Was heißt Copy/Paste?« wird ebenfalls mit einem Featured Snippet beantwortet. Bemerkenswert ist hier, dass die bloße Eingabe von »Copy/Paste« nicht zum Featured Snippet geführt hätte. Dieses wird erst angezeigt, wenn das Suchwort mit »Was ist …« oder »Was heißt …« verknüpft wird.
Featured Snippets sind in der Grauzone zwischen automatisch erstelltem Content und organischer Trefferliste anzusiedeln (kein automatisch erstellter Content im engeren Sinne). Ich habe mich dennoch entschieden, sie hier aufzunehmen, weil sie eventuell Vorboten von Automated Content bei Google sind.
Ein neues Feature ist in diesem Zusammenhang die »Nutzer fragen auch«-Box. Google zeigt mit diesem Feature einen Trend an, von der Suche mit Termen und der Antwort mittels einer bloßen Auflistung von Webseiten wegzugehen in die Richtung einer mehr dialogischen Frage/Antwort-Suchmaschine. Der/die NutzerIn formuliert Fragen an Google, und Google beantwortet diese Fragen.
Abb. 3–3 »Nutzer fragen auch«-Box zur Suche »Was ist Copy/Paste?«
Quelle: Screenshot von [ECO] https://www.google.de
Knowledge Graph
Der Google Knowledge Graph ist älter als die Funktion Featured Snippets oder die Neuentwicklung der »Nutzer fragen auch«-Box. Das Projekt Knowledge Graph ist Googles semantische Datenbank, die vorwiegend aus Personen, Unternehmen/Organisationen und historischen Ereignissen besteht. In Deutschland ist die Funktion seit Ende 2012 online.4 Sichtbar sind die Ergebnisse des Knowledge Graph rechts neben der organischen Trefferliste. Hier werden Fotos, Texte sowie verwandte Suchanfragen angezeigt. Wie bei den Featured Snippets handelt es sich auch bei den Knowledge-Graph-Infoboxen um automatisch extrahierte Inhalte – allerdings mit dem entscheidenden Unterschied, dass die Inhaltspartikel spezifisch arrangiert werden. Bei Kurzangaben, etwa biografischen Daten, fehlen manchmal die Quellenangaben. Viele Zuordnungen, etwa von Fotos zu Wikipedia-Texten oder von Büchern zu Autoren, stimmen auch nach sechs Jahren noch nicht. Es gibt eine Feedback-Funktion, die offenbar keine Wirkung hat. So habe ich etwa schon mehrmals gemeldet, dass in meiner Knowledge-Graph-Infobox das Foto eine andere Person darstellt und fünf von zwölf insgesamt mir von Google zugeschriebenen Büchern nicht von mir stammen. Und alle fünf angeblich im Verein mit mir »auch oft gesuchten« Personen stehen in Wahrheit mit mir in keinem...