Hören funktioniert anders als Sehen. Im komplexen Vorgang menschlicher Wahrnehmung besitzt die auditive Komponente verglichen mit der dominant insistierenden visuellen eine andere Qualität. Sie offenbart sich weniger bewusst, erscheint vielschichtiger und funktioniert vor allem auch körperlicher. Akustisches Wahrnehmen ist zwar primär an das Sinnesorgan Ohr gebunden, verwirklicht sich aber durchaus, in Verbindung mit dem Tastsinn, synästhetisch. Vor allem bei sehr hohen Lautstärken gerichteter Töne, wie sie bei einer Filmvorführung im Kinosaal vorkommen, werden die von Schallwellen erzeugten Vibrationen auch taktil aufgenommen. Und dies schon von einem kaum früher zu denkenden Zeitpunkt an: Hören ist im Vergleich zu etwa Schmecken oder Sehen der primärste (archaischste) unserer Sinnesvorgänge, schon vor unsere Geburt nehmen wir im Mutterleib Geräusche war (vgl. Chion 1994: VIIf. und ausführlicher das erste Kapitel in Chion 1984[21]).
Walter Murch beschreibt diese spezifische Qualität des (Film-)Tons in seinem Vorwort zu Michel Chions Monographie Audio-Vision metaphorisch als „dancing shadow“ (Chion 1994: XVIII), welcher über eine „mysterious perceptual alchemy“ (ebd.: VIII) das Filmbild zwar entscheidend, aber gewissermaßen unsichtbar beeinflusst. Mit einer weiteren Metapher leitet Murch das Programm von Chions Ausführungen zum Film ein: Die unterdrückte Königin Sound soll endlich Gleichberechtigung erfahren gegenüber dem regierenden König Bild, das Ungleichgewicht in der theoretischen wie analytischen Auseinandersetzung der beiden Parameter getilgt werden.[22] Dabei, und das macht bereits der Titel des Buches auf prägnante Art und Weise deutlich, geht es Chion weder um eine Polemik gegen eine nun mal äußerst visuell geprägte Kultur noch um einen Vorzeichenwechsel im Sinne einer das Bild dominierenden (Re-)Positionierung des Filmsounds. Vielmehr soll durch die genauere Betrachtung der auditiven Ebene des Films (gerade eben auch in ihrer spezifischen Singularität) ein Gleichgewicht hergestellt werden, um dann in einem, wenn man so will, zweiten Schritt das Zusammenspiel von Ton und Bild näher zu beleuchten und für eine akkuratere Analyse fruchtbar zu machen. Chion installiert dafür vor allem im ersten Teil seines Buches ein ganzes Arsenal an Begrifflichkeiten, die Ton-Phänomene einerseits in ihrer Diversität und ihrer oftmals unterschätzten Bedeutung für das Filmerleben genau zu fassen versuchen, gleichzeitig aber immer auch schon als konkret auf den Film anwendbare Analyseinstrumente funktionieren sollen.[23]
Seinen Ausgangspunkt konzeptualisiert Chion mit dem Begriff des added value, welcher ihm dann auch gleich als doppelt konnotierter sowohl in einer positivierenden wie auch negativierenden Funktionalität dient. Zum einen fängt er damit den Mehrwert einer audiovisuellen (Film-)Darstellung gegenüber einer rein visuellen bzw. ausschließlich auditiven Wiedergabe ein, zum anderen entlarvt der Begriff aber auch das Verständnis von Sound als nicht weiter wichtige Hinzugabe zum Bild:
By added value I mean the expressive and informative value with which a sound enriches a given image so as to create the definite impression, in the immediate or remembered experience one has of it, that this information or expression “naturally” comes from what is seen, and is already contained in the image itself. Added value is what gives the (eminently incorrect) impression that sound is unnecessary, that sound merely duplicates a meaning which in reality it brings about, either all on its own or by discrepancies between it and the image (Chion 1994: 5).
Trotz der hier bereits angedeuteten kritischen Aufschlüsselung dieser audiovisuellen Illusion (vgl. ebd.) führt eben genau diese Entzweiung als (nötiger) Ausgangspunkt – immer wieder erfolgt in den weiteren Ausführungen die Bezugnahme auf das added value, im Hinblick auf eine Konzeptualisierung wie der synchresis ist es gar unverzichtbar – Chion hin zu einer vordergründig äußerst texttheoretischen Beschreibung.[24] Ton und Bild werden als Zeichensysteme verstanden, die sich gegenseitig einer Addition gleich Bedeutetes hinzufügen können. Das Verständnis von Film als Text ist auch seinen direkt anschließenden Ausführungen inhärent, wenn er die Strukturierung des Filmbildes durch Sound beschreibt. An erster Stelle steht dabei der (geschriebene, aber vor allem gesprochene) Text im Film. „Why speak of language so early? Because the cinema is a vococentric or, more precisely, a verbocentric phenomenon” (Chion 1994: 5). Sind gesprochene Worte Teil der Tonspur eines Films, nehmen wir diese zuerst und vor allem wahr, um sie schnellstmöglich auf ihre Bedeutung hin zu entschlüsseln, so Chion. Resultat ist eine hierarchisch strukturierte Aufmerksamkeit und Wahrnehmung des Zuschauers, in der (verständlicher) Sprache eine übergeordnete Wertigkeit zukommt: „So if these voices speak in an accessible language, you will first seek the meaning of the words, moving on to interpret the other sound only when your interest in meaning has been satisfied” (ebd.: 6). Das implizite Projizieren eines kognitionstheoretischen Modells wird in diesen Ausführungen deutlich: Zugespitzt ist der Filmtext demnach ein Input aus verschiedenen (zwei) Informationsparametern (Bild und Tonspur), die vom Rezipienten in ihrer Singularität bewusst und im Hinblick auf ihre (nachträgliche) Sinnhaftigkeit ausgewählt und wahrgenommen werden, um dann im Zuschauergehirn verarbeitet zu werden und als Output wieder auf die audiovisuelle Präsentation im Kinosaal zurück zu fallen.[25] Beispielhaft führt Chion einen Fernsehbeitrag von 1984 an, in dessen Verlauf der Moderator aufgrund der Tatsache, dass er die gesendeten Bilder vorher selbst noch nie gesehen hatte, einen improvisierten Kommentar abgibt, welcher durch seine enorme Redundanz Komik erzeugt. Chion macht klar, dass auch jeglicher andere redundante Kommentar unseren bedeutungskonstituierenden Blick auf das Bild beeinflusst (gelenkt) hätte. Er schlussfolgert: „[…] their redundancy is illusory, since in each case these statements would have guided and structured our vision so that we would have seen them ‚naturally‘ in the image“ (ebd.: 7). Diese Natürlichkeit, bei Chion hier als Ergebnis eines kognitiven Prozesses beschrieben, gilt es (unter anderem) im Verlauf dieser Arbeit streng phänomenologisch als ausdrücklich ganzheitlich zu fassendes Zusammenspiel von Bild und Ton, das sich in seiner Zeitlichkeit ausdrückt und als (emotionale) Bewegung im (Leih-)Körper des Zuschauers verwirklicht, zu charakterisieren. Die Seite des Zuschauers und dessen Körperlichkeit, der somatische Bereich der Soundwahrnehmung also, fällt bei Chion keineswegs ganz heraus, wird jedoch zumeist nur angedeutet und nicht weiter ausformuliert. Inwiefern solch eine multisensorische Körperlichkeit konstituierend für eine emotional gebundene Filmwahrnehmung ist, bleibt so zwischen dominierenden Ausführungen zu geistigen Verstehensprozessen eher implizit. Bei seinen einleitenden Aussagen zur Rolle der Musik im System des added value unterteilt Chion beispielweise zwischen empathischer und nichtempathischer Musik (empathetic/anempathetic music, vgl. ebd.: 8). Dabei spricht er zwar von einer emotionalen Resonanz (emotional resonance, vgl. ebd.: 9) der Filmmusik, bleibt aber in seinen Beschreibungen erneut beinahe ausschließlich der Textebene verhaftet. Empathische Musik nimmt demnach die Stimmung der (bildlichen) Filmszene auf, gleicht sich deren Rhythmus und Ton an. Sie sei in kulturell festgelegten Codes verschiedener Stimmungen wie Traurigkeit und Freude zu beschreiben. Die anempathetic music hingegen erzeugt eine (dem Bild durchaus gegenläufige) Unbestimmtheit, die aber gerade wegen ihrer Teilnahmslosigkeit die Emotionen der Protagonisten und des Zuschauers noch verstärkt.[26]
Im weiteren Verlauf des ersten Teils seines Buches buchstabiert Chion das Konzept des added value weiter aus und nimmt dabei die Rolle des Sounds bei der Strukturierung der Zuschauerperzeption im Hinblick auf Bewegung und Geschwindigkeit im Bild zukommt, in den Blick. Auch hier dient ihm die gegensätzliche Wesensart von Bild und Ton als Ausgangspunkt. Während das projizierte Filmbild gleichermaßen von Bewegtheit und Unbewegtheit, von bewegten wie unbewegten Objekten dominiert sein kann, ist Sound durch seine Natur des linearen Fortschreitens in der Darstellung von Stagnation begrenzt. Bei vermeintlich monotonen (gleich bleibenden) Originaltönen (Chion nennt hier den Wasserfall als Beispiel) transportiert schon der deutsche Begriff des Rauschens die immer vorhandenen, leichten Abweichungen, welche den Ablauf in der Zeit zumeist spürbar evident machen, mit.[27] „As the trace of a movement or a trajectory, sound thus has its own temporal logic” (ebd.: 10). Gleichzeitig unterscheidet sich die Wahrnehmung von Ton und Bild. Trotzdem das Hören weniger bewusst abläuft, funktioniert es doch zugleich im Hinblick auf Nachvollziehbarkeit und Analyse schneller und präziser als das Sehen. Wir ‚hörverstehen‘ gewissermaßen rascher und genauer als das wir ‚sehverstehen‘, dabei immer ein bewegtes Bild vorausgesetzt.[28] Während bei der Wahrnehmung von Musik und Geräuschen...