Von den drei wissenschaftlich wohl interessantesten Eigenschaften einer Aktie (Rendite, Aktienpreisvolatilität und Handelsvolumen) wird in dem vierten Kapitel mangels Kapazitäten ein fast ausschließlicher Fokus auf die Rendite gelegt.
Im Rahmen ihrer Studie entwickeln Loughran und McDonald Wortlisten, die für den Einsatz in Finance besser geeignet sind als Wortlisten aus anderen Disziplinen und untersuchen den Zusammenhang zwischen ihren entworfenen Wortlisten und Variablen wie der Rendite und der Volatilität der Rendite.[305] Das Datenmaterial umfasst 50115 10-K-filings von 8341 einzelnen Unternehmen aus den Jahren 1994 bis 2008.[306] Der hauptsächliche Untersuchungsgegenstand, eine von den Autoren entwickelte 2337 Wörter umfassende Negativwortliste auf Basis der tatsächlichen Nutzungshäufigkeit in 10-Ks, wird mit der Harvard-IV-4 TagNeg wordlist (H4N) aus dem Harvard Psychological Dictionary verglichen.[307] Die Umwandlung der 10-Ks in das Wortschatzhistogramm gemäß dem Vector Space Model fußt auf dem bag of words model, in deren Rahmen als Gewichtungsmethode die tf.idf zur Anwendung gelangt.[308] Im Ergebnis lässt sich bei Verwendung der von den Autoren entwickelten Negativwortliste sowohl in der univariaten als auch in der multivariaten Regression ein Muster dergestalt feststellen, dass der Anteil der Wörter der Negativwortliste in den 10-K filings wächst, wenn sich die Renditen in dem vier-Tage-event window ab dem Tag der Veröffentlichung verringern.[309] Die Renditeveränderung in der multivariaten Regression (ausgedrückt als buy-and-hold excess return abzgl. CRSP value-weighted buy-and-hold market index return)[310] beträgt -0,3 %, .[311] Im Vergleich zu einer Methode unter Benutzung der tf.idf zeigt ein auf einem einfachen Zählen der Belegungen in den Wortkategorien beruhenden Verfahren, bei dem alle Wörter das gleiche Gewicht besitzen, eine deutlich größere Renditeveränderung (ca. -19,54 %).[312] Die Erklärung für den Unterschied dieser beiden Resultate sehen die Autoren in der Fähigkeit der tf.idf, die von der durch das bloße Zählen ausgelösten Überbetonung einzelner Wörter im Hinblick auf den Einfluss auf die Negativität entscheidend abzumildern.[313] Es lässt sich kein systematischer Anstieg des Anteils der Wörter der H4N in den 10-k-filings für den Fall feststellen, dass eine Renditeverringerung eintritt.[314] Die Autoren schlussfolgern daraus, dass die H4N für den Einsatz in auf Wirtschaftsterminologie fußender Untersuchung ungeeignet ist, da sie einen Großteil der Wörter, die in einem wirtschaftlichen Kontext keine negative Konnotation haben, als negativ einstuft.[315] Für das Jahr nach Veröffentlichung kann eine positive Korrelation aller Wortlisten (positiv, negativ, Modalverben, etc.) mit dem Volatilitätsniveau festgestellt werden.[316] Einen allgemeinen Hinweis in Bezug auf die Erklärungskraft der Inhaltsanalyse für Kapitalmarktgrößen geben die Autoren zum Schluss: Es ist nicht das Ziel der Inhaltsanalyse anwendenden Literatur, die kausale Verknüpfung von Ton und Aktienrenditen zu bestimmen.[317] Vielmehr könnte der Ton eine Ersatzvariable für andere Informationen wie das Zahlenwerk der Rechnungslegung, welche Renditeveränderungen induzieren, sein und als solche untersucht werden.[318]
Jegadeesh und Wu verwenden einen Ansatz, der jedem Wort eine Gewichtung gemäß den Marktreaktionen auf die Dokumente (sog. 10-k-filings), die dieses Wort enthalten, beimisst.[319] Zur Anwendung kommen dabei zwei verschiedene Wortlisten: Zum einen findet die Positiv- und Negativwortliste nach Loughran und McDonald Einsatz.[320] Zum anderen wird eine Liste erstellt, die den Ansatz auf alle einen Ton anzeigenden Wörter der englischen Sprache ausdehnt; konkret werden das Harvard IV-4 Psychological Dictionary, die Positiv- und Negativwortlisten nach Loughran und McDonald und die oberen und unteren 200 Einträge der Wortliste nach Bradley und Lang zu einem global lexicon zusammengeführt.[321] Für die Wörter dieser beiden Listen werden Gewichtungen auf Grundlage der Marktreaktionen auf 10-k-filings ermittelt.[322] Sämtliche 45860 zur Untersuchung herangezogenen 10-k-filings aus dem Zeitraum von 1995 bis 2010 werden über die Electronic Data Gathering, Analysis, and Retrieval database der SEC eingeholt.[323] Die Renditeveränderung wird wie bei Loughran und McDonald gemessen als buy-and-hold return abzgl. the CRSP value-weighted index.[324] Zusammenfassend lässt sich zum einen unter Einschluss von Kontrollvariablen eine signifikante Korrelation zwischen dem Dokumententon und der auf die Veröffentlichung der Dokumente folgenden Marktrendite im event window [0,+3] (0 steht für den Veröffentlichungstag) sowohl für positiv[325] als auch für negativ,[326] konnotierte Wörter erkennen.[327] Der Dokumententon ist dabei einerseits für die separaten Positiv-, Negativ- und Neutralwortlisten des global lexicon und andererseits für die zusammengeführten Listen des global lexicon gleichermaßen informativ.[328] Diese Erkenntnis ist wichtig, da sie veranschaulicht, dass der Ansatz der Autoren nicht abhängig ist von in der Konnotation nach Positivität und Negativität eingestuften Wortlisten und somit die Eliminierung von Subjektivität, die mit einer solchen Einstufung verbunden wäre, möglich ist.[329] Robustheitsanalysen verdeutlichen, dass der Markt in dem initialen event window nicht vollständig auf den Ton der 10-k-filings reagiert, sondern eine Unterreaktion zeigt und sich sowohl für positive als auch negative Wörter innerhalb eines Zeitraums von bis zu zwei Wochen nach Veröffentlichung eine signifikante Renditeerhöhung ergibt.[330] Die angemessene Wahl der Gewichtungsmethode für die Inhaltsanalyse ist mindestens ebenso wichtig wie die vollständige und genaue Zusammenstellung der Wortliste:[331] Wird vergleichend zu der eigens entwickelten Gewichtungsmethode die tf.idf zwecks Gewichtung eingesetzt, stellen die Autoren einige Unzulänglichkeiten der tf.idf gegenüber Ersterem oder zumindest Unterschiede zwischen den Gewichtungsmethoden fest. U. a. kann unter Verwendung der tf.idf die Positivwortliste nicht benutzt werden, um den Dokumententon reliabel zu quantifizieren, denn es zeigt sich in der univariaten Regression für die Positivwortliste eine signifikant negative Korrelation mit dem Renditemaß, wenn tf.idf eingesetzt wird.[332] Daneben finden die Autoren heraus, dass bei Verwendung der tf.idf als erklärende Variable in der Untersuchung der Beziehung zwischen Rendite und Dokumententon unter Berücksichtigung von Kontrollvariablen keine signifikante Erklärungskraft der tf.idf für positive und negative Wörter besteht.[333] Sehr ähnliche Ergebnisse für IPO-Prospekte legen die Verallgemeinerung der selbstentwickelten Gewichtungsmethode nahe.[334] Der Ansatz der Autoren ist ein neuer Ansatz zur Bestimmung der Stärke jedes Worts bei der Vermittlung eines negativen oder positiven Tons, der ein bedeutend verringertes Maß an Subjektivität enthält, deshalb den Dokumententon reliabel misst und offenbar besonders gut einsetzbar in Finance und Accounting ist.
Tetlock et al. gelangen in ihrer Studie zu ähnlichen Ergebnissen wie Loughran und McDonald, deren Methodik sich von der von Tetlock et al. in einigen Punkten unterscheidet. Bei Letzteren sind zum einen die lexikalischen Ressourcen die Positiv- und Negativwortlisten aus dem Harvard IV-4 dictionary und wird zum anderen der Ton der Dokumente nicht mittels des Gewichtungsmaßes tf.idf gemessen, sondern als Anteil der negativen Wörter an der Gesamtanzahl der Wörter eines Dokuments.[335] Das Untersuchungsmaterial umfasst alle (>350000) Artikel über S&P 500-Unternehmen aus dem Wall Street Journal (WSJ) und dem Dow Jones News Service (DJNS) aus dem Zeitraum von 1980 bis 2004.[336] Eines der zentralen Ergebnisse ist, dass negative Wörter in der Gesamtheit der firmenspezifische Neuigkeiten bereithaltenden Artikel geringfügig niedrigere Renditen für den Folgetag voraussagen.[337] Nur bei separater Betrachtung des DJNS – und nicht bei isolierter Betrachtung des WSJ – bleibt das Ergebnis signifikant.[338] Die allgemeine von den Autoren vorgenommene Beurteilung des Verhaltens des Kapitalmarkts bezüglich Neuigkeiten ist, dass der Kapitalmarkt relativ effizient in der Aufnahme und Weiterverarbeitung von firmenbezogenen Fundamentaldaten ist, da die Unterreaktion des Marktes auf negative Wörter ab einem Tag nach der...