Füzi Izabella: A hang funkciói Balázs filmesztétikájában a hangos váltás kontextusában

A filmtudomány egyik leggyakoribb megállapítása a filmi hanggal kapcsolatban, hogy az mindig a képnek alárendelve kap funkciót, és a kép realitásillúziójának a támogatására szolgál. A filmelméletek szívós képközpontúsága egyrészt a némafilm történeti elsődlegességéből fakad (a hangosfilm leegyszerűsítve és tévesen fogalmazva pusztán csak hangot ad a képhez), másrészt abból, hogy a film esztétikai hatásmechanizmusait, a médium lényegi tulajdonságát a kép által gondolják megragadhatónak. Így gyakran előfordul, hogy a hang tárgyalását vagy teljesen mellőzik, vagy egyfajta (redundáns) kísérőként, illusztrációként tüntetik fel. Rick Altman megfordítja ezt az alárendeltségi viszonyt, és azt állítja, hogy a hangosfilm képei a hasbeszélő bábjához hasonlítanak, vagyis az a funkciójuk, hogy elrejtsék a hang technikai eredetét, naturalizálják és a képen megjelenő beszélőknek tulajdonítsák azt. A narratív filmben a cselekvő képességet, a narratív erőt a beszéd lehetősége jelenti, a történetmondó film legtöbb kifejező eszköze (a megvilágítás, a kompozíció, a beállítások időtartama, a szerkesztés, a központozás) a beszéd érthetővé tételét szolgálja. „Dialógus nélkül a kép többértelmű, hiányos és meghatározatlan.” [1] Mindkét álláspontnak a kiigazítása az a megközelítés, miszerint a hangnak és a képnek ugyanolyan jelentőséget kell tulajdonítanunk; a hangsáv és a képi sáv ilyen demokratikus egymás mellett létezése azonban szintén megkérdőjelezhető. Chion (1994, 1999) [2] amellett érvel, hogy a film esetében nem beszélhetünk önmagában is megálló hangi dimenzióról. Először is a képi dimenziónak a keret mint térbeli és a beállítás mint időbeli határ kölcsönöz egységességet, és a filmben nincs a keretnek vagy a beállításnak megfelelő, önálló hangi egység (ehhez a minimális egységhez talán az egyes hangi rétegek elkülönítésével kerülünk a legközelebb, melyeknek vizuális megfelelői az egymásra fényképezett képek lehetnek). Másodszor azért sem tételezhetünk egy önálló hangsávot, mivel a képtől leválasztott filmi hangok nem alkotnak a képek, beállítások, jelenetek kompozíciójához hasonló összefüggő egységeket (1994: 39-40). Mindez annak a következménye, hogy a filmben kép és hang vertikális viszonya, punktuális egymásra vonatkozása a kitüntetett, a szimultaneitás, és nem a tartam (vagyis a képi és a hangszekvencia időbeli és térbeli kibontakozásának összefüggései); a harmónia vagy a diszharmónia, nem pedig az ellenpont [3] a meghatározó. Így a kép és a hang értelmezését a filmben a Chion által kauzális hallásnak nevezett, a ki beszél? mi a hang forrása? kérdésekre adott válasz irányítja.

Ha sem az alárendelő, sem az egyenrangú viszony nem ad kielégítő elméleti modellt, hogyan ragadható meg kép és hang filmi egymásmellettisége, egymás mellé rendelése (koegzisztenciája)? Melyek azok a pontok, ahol a két érzékterület és a kétféle közvetítés egyáltalán összevethetővé válik? Van-e valamilyen szükségszerű kapocs a látás és a hallás között, illetve hogyan teremti meg a film kettőjük egymásra vonatkozását? Az egyik kontextus, amely nyilvánvaló módon adódik ennek a kérdésnek a vizsgálatára, a hangosfilmre való áttérésnek a történeti időszaka. E tanulmányban nem foglalkozom ennek a váltásnak a technikatörténeti vonatkozásaival, [4] inkább azt tartom szem előtt, hogy a hang technikai reprodukciója milyen esztétikai, elméleti, formanyelvi kihívások elé állítja a film médiumspecifikus, korabeli tárgyalását. Balázs Béla 1930-as filmesztétikájának hangra vonatkozó meglátásait nemcsak arra használom, hogy tanúskodjanak e filmtörténeti korszakváltásról, hanem általuk a hang kérdésének a filmtudományban máig is problematikus aspektusait szeretném kidolgozni. Balázs A film szelleme (1930) című második filmesztétikájának egyik legjelentősebb fejezete (A hangosfilm) nemcsak a hang bevezetésével járó technikai kihívásokkal foglalkozik, hanem az új médiumban rejlő lehetőségek kiaknázásával is. Balázs megpróbálja kitalálni, hogy milyen jövőbeli használatokra ad alkalmat a rögzített hang a filmben, [5] és ezek közül melyek az esztétikailag meghatározó használatok. Mindeközben számba veszi a hang fizikai, fiziológiai és perceptuális tulajdonságait. Az 1948-ban közreadott Filmkultúra (A film művészetfilozófiája) [6] átveszi a hangosfilmről szóló fejezet főbb belátásait, szó szerint idézve, egyértelműsítve vagy az eltelt több mint két évtized filmes gyakorlata alapján kiegészítve, korrigálva A film szellemében előrebocsátott jóslatokat. A Filmkultúrában három fejezet foglalkozik a hang kérdésével: A hangosfilm című fejezet mellett az emberi hangra (főként a dialógusra) és a hangosfilmgroteszkre vonatkozó megállapításokat külön fejezet tárgyalja.

Ellentétben kortársaival (és azzal, ahogyan a recepcióban tévesen hivatkozzák) A film szellemében Balázs üdvözli a hangosfilm megjelenését, profetikus kijelentéseket tesz jövőbeli felhasználásáról, ahhoz hasonlóan, ahogy a mozgóképi médium megjelenését üdvözölte. A későbbi Filmkultúrában viszont megváltozik az álláspontja: a hangosfilmet azért kárhoztatja, mivel nem váltotta be a hozzá fűzött reményeket. A hang fogalmával a filmelemzésben általában három különböző jelenséget nevezünk meg: a beszédet, a zenét és a zajt (zörejt). Balázs a hang esztétikai lehetőségét nem a szó, az emberi beszéd hangi rögzítésében és képhez való társításában keresi; a beszéd a későbbi Filmkultúrában is – az addigra kialakult hangosfilmi gyakorlatokat figyelembe véve, melyek épp annak túlsúlyával és hangsúlyozásával jellemezhetőek – leginkább akusztikai minőségeiben érdekli. Balázs elutasítja a beszéd kitüntetettségét (és ezáltal mégiscsak hasonló, ha nem is annyira radikális álláspontot foglal el, mint kortársai), és az „akusztikai környezet” feltárását szorgalmazza: „Mindet, ami az emberi beszéden kívül még beszél, szól hozzánk az élet roppant társalkodásában, és szakadatlanul befolyásolja érzéseinket és gondolatainkat.” [7] Az idézett passzus színre viszi Balázs esztétikai célkitűzésének – az arc fogalmában már elemzett [8] – ellentmondásosságát: az emberi beszéden kívüli „beszédet” akarja megragadni a filmbeli hang által, miközben saját szóhasználata az emberi beszéd összefüggésein belül marad („beszél”, „szól”, „társalkodás”). Egyszerre akarja megtartani a hang érzéki tulajdonságait – „a dolgok sajátos hangját” (2005: 177) és közvetlenségét -, és nyelvként, közvetítőként érteni meg azt, felismerni „a dolgok sajátos hangjában önálló életük megnyilatkozását” (uo. saját kiem. F.I.).

Hogyan lehet visszahátrálni a hang szimbolikus dimenziója elé, oda, ahol a hangot még nem sajátította ki a jelentés, a közvetítés? Mi a hang lényege mindenféle közvetítettség nélkül? Hogyan lehet reprodukálni a hang „eredeti varázsát”, ha a hang minden egyes „megszólaltatása” módosítja az eredeti hangot? A hang ilyen lecsupaszítása nem a hang hiányával fenyegető csendhez vezet-e? A továbbiakban a hang tárgyalásának két különböző kontextusát vizsgálom meg Balázsnál az egymással versengő, egymást „remedializáló” [9] médiumoknak a történetében, valamint azon megkülönböztetések vonatkozásában, melyek a hangos váltás által előidézett formanyelvi, narratív és a befogadást érintő változásokból adódnak. Látni fogjuk, hogy Balázs kép és hang viszonyának a bevezetőben említett álláspontoktól eltérő dimenzióját dolgozza ki. A kép és a hang összekapcsolásának, viszonyuk tárgyalásának gyakran az az alapja, hogy a hangot a beszélő kilétére vagy a hangforrás megjelölésére vonatkozó információk mentén értelmezzük. Így maga a hang is azáltal nyer értelmet, hogy jelentése a vizuálisan megjelenített vagy a képről hiányzó forrásban van lehorgonyozva, amit a hangosfilm által bevezetett szinkronizáció tett lehetővé.  Balázs a hangelméletében kép és hang egy másik típusú artikulációjára tesz javaslatot, melyből nem vonható ki a hangzó tér, melyben a hang megszólal, sem a hallgató teste, melyen a hangok visszaverődnek. Ezek az akusztikus minőségek a vizualitástól eltérő összefüggéseket hoznak létre. A tanulmány a továbbiakban úgy épül fel, hogy először a hang mibenlétének általános kérdéseit vázolom A film szellemének egyik passzusa alapján, majd azokat a felosztásokat tárgyalom, melyek a hangosfilmben a hang különböző típusainak elkülönítéséhez vezettek (diegetikus vs. nondiegetikus; szinkronhang vagy forráshang vs. térhang).

A hang: reprezentáció vs. mediáció

Hang és kép összekapcsolása a hangosfilmben először is egy egyedülálló konfigurációt hoz létre a médiumok történetében. Balázs nem önmagában a hang technikai reprodukcióját gondolja mérföldkőnek, hanem annak hangosfilmbeli, a kép együttesében való alkalmazását; meggyőzően érvel amellett, hogy a színház, a rádió és a hangjáték – még a technikai rögzítés alkalmazásával – sem képes ennek a viszonynak a létrehozására. A színpad a hang szimbolikus potenciáljára támaszkodik, úgy kezeli a hangot (főként a térhangról van szó), mint a díszletnek az egyik elemét. Ugyanakkor a színpad elszakítja a hangot a reprezentált tér összefüggéseitől (tér és hang szerves viszonyát Balázsnál lásd később). [10] A rádió és a hangjáték hasonlóképpen az akusztikai környezet illusztrációjára használja a hangot, melyet mindig az emberi beszéd közvetít. („A hangjátékban mindig el kell mondani, mit hallunk.” 2005: 177)

Ezzel szemben a hangosfilm jelentősége, hogy a kép és a hang együttes artikulációjában olyan formákat rögzít, melyek kezelhetővé, érthetővé teszik a bennünket körülvevő lármát, hangzavart. A művészetnek ez az apollói funkciója azokra a jövendölésekre rímel, melyekkel Balázs az új vizuális kultúra eljövetelét hirdette A látható emberben. A látás kiművelését most az akusztikai műveltség fejlesztése követi: „A hangosfilm megtanítja fülünket differenciálni. Ahogyan a némafilm megtanított bennünket látni. Megtanuljuk, hogy hangok alapján asszociáljunk és következtessünk.” (2005: 178) A hangi minőségekre érzékeny, a hangzavart elemeire bontó szelektív fül képezi az alapját a hangosfilmben rejlő esztétikai lehetőségeknek. Itt Balázs olyan hangfogalmat bont ki, amely a hallás differenciáló (szűrő) műveletén alapszik, azon, hogy a hangok hallása (hearing) a hallgatásra (listening) épül, vagyis a hangokat kihalljuk, és nem meghalljuk. A hallgatás során a hallás a hang előre meghatározott differenciális jegyei szerint történik, és kizár más, az adott szituációban nem releváns vonásokat. Innen már csak egy lépés annak felismerése, hogy a hallgatást olyan jelölő és kulturális gyakorlatok határozzák meg, melyek történetileg és sok más tekintetben is változóak. Ilyen gyakorlatnak tekinthető a zenehallgatás (annak különböző változataival), a beszédhangok felismerése, az emberi hang fizikai tulajdonságainak a beszélő érzelmeire, szándékaira való vonatkoztatása, de még a zajok, zörejek felismerése, megnevezése, osztályozása is. Balázs úgy hivatkozik a hallás-hallgatás ezen tevékenységére, mint „olvasásra”, dekódolásra, mely a hangzavart értelmes beszéddé fordítja le: „A hangosfilm megválthat és meg is vált bennünket a lárma zűrzavarától, mert kifejezéssé alakítja át: értelmet, jelentést ad neki.” (2005: 177) A hang technikai reprodukciója a hangosfilmben azért lehet ünneplésre méltó – a mozgás, az emberi test, az arc mozgóképi reprodukciójához hasonlóan -, mivel felülírhatja az emberi fül szelekciós elveit. A prosztétikus fülnek technikai ágense a „hangzavart elemeire bontó” (uo.), analizáló mikrofon membránja, mely a hangforrás és a fül között közvetít. A mesterséges dobhártya korábban észrevétlen hangokat hallhat meg, emelhet ki, erősíthet föl, és ezáltal újra is definiálja a hangok tartományát, a hallható és a nem hallható, a hallható és a látható közti összefüggéseket.

Balázs azonban egy ezzel ellentétesnek mondható hangfogalmat is felvázol, mely tagadja, hogy a hangot a szelekció részlegességén alapuló reprezentatív értékére lehetne egyszerűsíteni. Hangsúlyozza, hogy mindezidáig (a hangosfilm megjelenéséig) a médiumok és a művészetek pusztán csak ábrázolták a hangot (a költők leírták a hangokat, a színpadon eszközként használták). Pedig szigorúan perceptuális értelemben véve a hang nem is ábrázol – ez a tulajdonsága szembeállítja a képpel:

„[A hang] még csak nem is ábrázolás. Mert a vásznon a színész képe jelenik meg, de hangjának nem képét érzékeljük, hanem a hangot önmagát. Nem ábrázolva, hanem visszaadva. Talán egy kevéssé megváltozik, de realitása mindig ugyanaz.” (2005: 183)

A fenti gondolat, miszerint „a hang nem ábrázolás” kétféle gondolatmenet kontextusában bukkan fel az 1930-as filmesztétikában. Az egyik kontextus a „hangbeállítás” lehetőségeit és nehézségeit tárgyazza. Korábban láttuk, hogy Balázs szerint a hangosfilm akkor éri el a művészeti státuszát, ha lehetővé teszi a hangnak kifejezésként történő értelmezését, ami együtt jár a hang manipulációjával. Némi képzavarhoz folyamodva az „alkotó hangkamera” megvalósulásának a feltételét abban látja, hogy a hangfelvevő ne csak reproduktív, hanem produktív potenciállal is rendelkezzen, és lehetővé tegye az alkotó számára a manipuláció általi értelmezést. A probléma abban áll, mondja Balázs, hogy a hang rögzítésében – ellentétben a képi rögzítéssel, ahol pusztán csak a térbeli nézőpont megválasztásával (a kamera elhelyezésével) ugyanazon tárgy különböző nézeteit, értelmezéseit lehet megvalósítani – nem állnak rendelkezésre az értelmezés ilyen eszközei. Míg a képi beállítást az operatőr a látószög, a távolság, a megvilágítás megválasztásával manipulálhatja, a hang „színe, alakja, »fiziognómiája«” az egyetlen manipulálható paraméter, a távlat, által nem változik. (2005: 183) A korabeli filmfelvételi technikákat vizsgálva, láthatjuk, hogy a hangosfilm megjelenésének hajnalán, amikor a kép- és hangfelvételt egyszerre készítették a jobb szinkronizáció céljából, valóban csak a távlat (a mikrofon távolsága a hangforrástól) jelentette a manipulációs lehetőséget. Ráadásul a képi és a hangi távlat gyakran konfliktusba is került egymással, például az olyan felvételen, ahol a szereplő a kamerától távol helyezkedik el, de a beszéde tisztán kivehető; ebben az esetben a nézőpont és a „hallópont” [11] nem esik egybe, és egyfajta percepciós zavarodottságot hoz létre, legalábbis a kortársak egy része így érzékelte. Éppen ellenkezőleg Balázs, aki a közel és a távol szimultaneitását a hangosfilm médiumspecifikus lehetőségének tekintette, [12] mely a csend sajátos, esztétikai tapasztalatában is meghatározó (a balázsi értelemben vett csendet később tárgyalom). Bár a hang technikai, manipulációs lehetőségei azóta jelentősen megváltoztak (az utószinkron gyakorlatában át is alakultak), és talán kiterjeszthetők a hangszínre és a „fiziognómiára” is, ez a megállapítás azért fontos, mert színre viszi a kifejezésen és az ábrázoláson alapuló esztétika szempontjainak a kudarcát a filmbeli hang megragadásában. A kudarc egyik oka, hogy „A felvétel egyéni beállítási lehetőség nélkül mindig csak gépies reprodukció marad.” (uo.), ha viszont a hangot „túlságosan” is manipulálják a műteremben, elveszíti felismerhetőségét és azonosságát, nem a hang értelmezését hozza létre, hanem új hangot eredményez. Hang és kép ellentéte tehát a hang (mint tárgy) identitásának és a képen megjelenő tárgy identitásának eltérő (percepciós?) feltételeiből eredeztethető.

Hang és kép ellentétének másik kontextusa a „hangosfilmgroteszk” kapcsán kerül elő, melyet Balázs a hang nem realista, nem reproduktív potenciálja miatt dicsér. A nagyrészt animációs filmekből vett példák (Miki egér, Félix cica) azért vannak felértékelve, mert ezekben az esetekben a hang nem „fedi”, vagy szolgálja, vagy leképezi a képet, ami újfent rámutat a kép és a hang ontológiájában mutatkozó különbségekre:

„Mi is a hang valószerűtlenségének tulajdonképpeni lényege? El tudunk képzelni mesebeli szörnyetegeket, lerajzolhatunk soha nem látott mesealakokat. De mesebeli hang, mesebeli zörej? Hogyan csengenek? Könnyen kiagyalhatunk olyan lényeket, amelyek a valóságban elképzelhetetlenek, de elképzelhetetlen az olyan hang, amely a valóságban nem szólalhat meg. Rajzolhatunk olyasmit, ami nem fordul elő. Mert a kép: ábrázolás, tehát kitalált is lehet. A hang ábrázolását azonban nem halljuk, csak magát a hangot. A hang csak akkor létezik, hogyha hallható a valóságban is.” (2005: 197)

Az 1945-ös Filmkultúra még hozzáteszi:

„Kigondolhatunk mindenféle nemlétezőt és lehetetlent. De nem tudunk lehetetlen hangot kitalálni, olyat, mely a valóságban meg nem szólalhatna. Hiszen már valósággal megszólaltattuk, akkor, mikor kitaláltuk. A kép ábrázolás lévén és illúzió, lehet valami nemlétezőnek, kitaláltnak a képe is. A filmbeli hang nem képe a valóságos hangnak, hanem önmaga megismétlése, megszólaltatása. Vagyis hangban lehetetlent kitalálni lehetetlen.” (1961: 214)

Itt Balázs valami olyasmit látszik állítani, ami ellen egy sor, a hanggal foglalkozó filmelméleti munka tiltakozik, mégpedig, hogy a hang nem ábrázolás, nem reprezentáció. James Lastra Reading, Writing, and Representing Sound[13] című tanulmánya ragyogóan és árnyaltan foglalja össze az ide kapcsolódó álláspontokat és azok problematikusságát. Azok, akik az eredeti és a reprodukált hang ontológiai azonosságát állítják (Christian Metz, Gerald Mast, J.-L. Baudry és Balázst is ide sorolja a fentiekben idézett passzus alapján), azért tehetik meg ezt, mert a hangot úgy definiálják, mint amit kulturálisan és társadalmilag meghatározott olvashatósága határoz meg. Metz azért mondhatja, hogy az utcán és a filmben hallott pisztolylövés között nincsen ontológiai különbség, mert a hangot ismételhető és érthető szemiotikai struktúraként, jelölő egységként fogja fel. Ez az álláspont nagyjából megegyezik Balázs első hangfogalmával, a szelektív hallással. A filmteoretikusok másik csoportja (Alan Williams, Rick Altman és Tom Levin) a fenti azonosságot társadalmilag konstruált „hallási/hallgatási gyakorlatnak” tulajdonítja, mely elfedi azokat a változtatásokat, melyeket a hang a reprodukció során elszenved. Lastra azonban rámutat arra, hogy a reprodukciónak torzításként, de legalábbis változásként való felfogása olyan „eredeti” hangfogalomra épít, mely az érzéki és a fenomenális teljesség felmutatásával megismételhetetlen eseményként tételeződik. Ezzel szemben Lastra amellett érvel, hogy minden hallási/hallgatási gyakorlat egyformán konstruált, és éppen a hang reprodukciójának ideológiai hatásaként jön létre a torzítatlan, reprezentációtól független eredeti hang fogalma. [13] Holott, hacsak a rögzítés gyakorlatát tekintjük, azt láthatjuk, hogy az eredeti hang, melyet például egy koncerten rögzítenek, már eleve színre van vive, bizonyos, a rögzítés szempontjából fontos összefüggések szerint, tehát a rögzítés előtti és utáni állapot nem különíthető el a beavatkozás mértéke szerint. Továbbá a hang észlelése a koncertteremben önmagában is megsokszorozza az „eredeti” eseményt például annak függvényében, hogy a terem mely részéből hallgatjuk. Lastra azzal zárja tanulmányát, hogy kijelöli a hang jövőbeli tanulmányozásának főbb feladatait: „Olyan reprezentációelméletet kell kialakítanunk, mely nem ragaszkodik az eredeti és a másolat között fellépő veszteséghez, olyan elméletet, mely a reprezentációk referenciális hatását nem valamely logikailag elérhetetlen ideállal való összehasonlításban akarja meghatározni, olyan elméletet, mely elkerüli az »eredeti« és a reprezentáció közti azonosság naiv elképzelésének a csapdáját.” [14]

Das Testament des Dr. Mabuse, 1933

Das Testament des Dr. Mabuse, 1933

Visszatérve Balázs állításaihoz, megállapíthatjuk, hogy álláspontja a Lastra által elkülönített egyik csoportba sem sorolható be. Nem világos azonban, hogy Balázs mire alapozza a hang (és reprodukciója) [15] identitását. Fenomenológiai összefüggésekben, a hang észleléséből kiindulva, mondhatjuk, hogy eredeti és reprodukált hang között nem tudunk különbséget tenni: a hang „realitása mindig ugyanaz”. Ez a témája például Fritz Lang Mabuse-sorozata második részének, a Dr. Mabuse végrendeletének (Das Testament des Dr. Mabuse, 1933): a rögzítés elszakítja a hangot a forrásától, és ismételhetővé teszi azt az eredeti és a reprodukált közti különbség felszámolásával.  A hang ontológiai bizonyossága, mely az észlelhetőségéhez kapcsolja azt, a másik oldalon, a mediáció tekintetében tehát éppen hogy totális szimulációt eredményez. Amennyiben a hang létezőségének nem a hangforrás létezése a kritériuma – mint például az animáció esetében -, úgy a hallucinatórikus hangok is teljes jogú realitásra tesznek szert. Friedrich Kittler szerint a művészetek illúziót vagy fikciót hoznak létre, míg a technikai médiumok szimulációt termelnek. [16] Az, hogy a „hangban lehetetlent kitalálni lehetetlen” tehát arra is utal, hogy a romantikus művészet által hirdetett, a valóságpróba kényszerét nélkülöző, szárnyaló képzelet itt le van horgonyozva, földhöz van szegezve, hiszen a hangok kitalálása nemcsak hogy rászorul az érzékek együttműködésére, hanem a képzelet munkája egyenesen azokba csatornázódik bele (ellentétben például a némafilm elképzelt hangjaival).

Meglepőnek tűnhet, hogy a hang ezen indexikus tulajdonságait (vö. a mikrofon membránja vagy a fül dobhártyája, melyet a hanghullámok rezgésbe hoznak) Balázs a korábban szintén indexikus tulajdonságokkal felruházott (fotografikus) képpel állítja szembe. Az ellentét a Bolter-Grusin (2011) szerzőpáros által megfogalmazott „remedializáció” fogalom által is magyarázható. Egyrészt minden új médium a régi médiumok köntösében mutatkozik be: Balázs fogalmai a hangosfilm leírására a némafilmben használatos elnevezéseket hasznosítják újra (hangkivágás a képkivágat mintájára, hangnagyközeli a közelkép mintájára, hangtávlat a perspektíva mintájára, hangáttűnés). Másrészt az új médium versenyre is kel a régiekkel, amikor a „valós nevében” felüllicitálja azokat, és autentikusabbnak vagy valóságosabbnak tételezi önmagát. Hang és kép „értékkülönbségét” Balázs a „fényképezés árnyékszerűségével” (2005: 183) magyarázza: míg a kép medialitása „hipermediált”, a hangtapasztalat közvetlenül hozzáférhető [17], a hang horgonyozza le a képet a „valóságba”. Fontos hangsúlyozni, hogy a hang és a kép Balázs általi szembeállítása nem abszolutisztikus érvényű tézisként lehet továbbgondolásra érdemes (hiszen számos ellenpéldát lehetne felhozni), inkább a hang és a kép bizonyos használati, befogadási módjaira érvényesek azok a belátások, melyeket ebből a szembeállításból nyerünk. A képnek reprezentációként való felfogása a megjelenítés modellje alapján a hiány és a jelenlét kategóriái szerint történik: ebben az esetben a kép olvashatóságát az ábrázolt tárgy felismerhetősége azonosíthatósága vezérli. A rögzített hang mint médium, mely nem egy eredendő jelenlét újra megjelenítése, hanem egyszeri megszólalás és ismétlés egyszerre, a mediációnak azon felfogásán alapul, miszerint a médium egy bizonyos típusú viszonynak a beiktatása, mégpedig a teresítés (distantiation), a távolságteremtés eszköze. A hang mint médium hozza létre azt a nem pusztán fizikai értelemben vett távolságot, melyet áthidal, medi(atiz)ál. [18] Például a Psycho (Alfred Hitchcock, 1960) záró képsoraiban a Norman beszédtelen arcához társuló anyai hang a képen látottakhoz képest egy olyan távolságot hoz létre, mely Norman hasadt személyiségében, identitásában képződik. Ezzel szemben a hang is felfogható reprezentációként, amikor a képen megjelenő vagy a képről hiányzó hangforrás megjelenítődéseként értelmeződik.

[youtube=http://www.youtube.com/watch?v=TcJiu4jXfTk]

Míg a korábbiakban tárgyalt szemiotikai fogalomban a hang megismerő értéke a hang jelkarakteréből vezethető le (a hang által a világot értjük meg), abban az állításban, miszerint „a hang nem ábrázolás”, a hang mint tárgy és a hang mint jel közti különbség szűnik meg, a jelviszony beomlik. Nincs a tárgynak olyan azonossága, amely a különböző reprodukciókban is fenntartható, mint az egy és ugyanazon tárgyról készített képek esetében. [19] Minden egyes hang egyedi, sajátos „megszólalás”, olyan esemény, amelynek során a hang „kitalálása” (invenciója) egybeesik annak performanciájával. Ez egyike lehet azon fontos passzusoknak, ahol Balázs elszakad a reprezentáció (poszt)romantikus összefüggéseitől, a kifejezés vagy kifejezhetetlenség kérdéseitől, és a hang közvetítését a (technikai) médium keretein belül gondolja el.

Csakhogy Balázsnál a hang mindkét aspektusa egyformán fontos: egyszerre szeretné megtartani a hangot mint beszédet (nyelvet, megnyilatkozást) és a hangot mint eseményt, melyet a hangrögzítés tesz lehetővé. Ha a hang önmagában képtelen működésbe hozni a reprezentáció gépezetét, akkor hogyan tehet szert arra a szimbolikus funkcióra, mely „megnyilatkozásként” (2005: 177), „partitúraként” vagy „ábrázoló és kifejező hangszerként” (2005: 198) teszi megragadhatóvá? Balázs filmesztétikáinak a meghatározó törekvése a filmet az „ember új érzékszerveként” (2005: 95, 96) olyan artikulációs felületté alakítani, mely ember és környezet, test és lélek, felület és mélység oppozíciói között közvetít. A hang reprodukciója (mediális közvetítése) és a hang mint reprezentáció közti szakadékot úgy próbálja meg áthidalni, hogy a hangosfilmbeli reprodukált hanghoz különféle referenciákat rendel hozzá. A hang mint egy másik érzékterület bevonása a hangosfilmben egyszerre jelenti kép és hang közös nevezőre hozását (pl. a fentiekben említett képi eljárásoknak az átvételében, a képi és hangritmus jelenségében, az akusztikai tudattalan fogalmában [2005: 185-187]), és azok elkülönböződő jellegének hangsúlyozását (például a hanghíd funkciójában, valamint a hangnak azon vonatkozásában, hogy a mikrofon által ugyanaz a szólam egyszerre tud kiválni a háttérzajból és beleolvadni abba [20]). Mindezt szem előtt tartva nem marad más hátra, mint hogy kidolgozzuk a hang és a kép azon viszonyait, melyeket a hangosfilm által meghatározott új hang- és képfogalom tesz lehetővé.

Bár a mindennapi észlelésben hang és kép összekapcsolása természetesnek tűnik („A képet és a hangot egyetlen esemény elválaszthatatlan megjelenési formájának képzeljük el”, 2005: 189), kettejük egymásra vonatkoztatása ennél sokkal áttételesebb. Balázs hol azt hangsúlyozza, hogy a kép (mint hangforrás) és a hang hasonlít egymáshoz, és ha elég művelt a fülünk, akkor megtanuljuk leleplezni a „hangpótlékot” (2005: 188), hol pedig azt, hogy „optikai és akusztikai képzeteink között irracionális [az] összefüggés” (2005: 198). Az első artikulációs felület tehát kép és hang között adódik, mégpedig a hang forrásának a vonatkozásában. A némafilmtől eltérően a hangosfilm hanggal ruházza fel a diegetikus világot, miközben meg is foszthatja azt hangjától. A némaság és a beszéd mint lehetőségek tehát a hangosfilmben a médium hatókörén belül helyezkednek el. A másik artikulációs felület a hang és a tér között jön létre, amely nem azonos a hangnak a vizualitáshoz való viszonyával, amennyiben a térképzés vizuális és auditív lehetőségei is különbözőek, és gyakran konfliktusba is kerülnek. Míg a kép/hang interfész a hangforrás és a hang közti távolságot szünteti meg a szinkronizáció által (vagy teszi láthatóvá kép és hang elcsúsztatásával), a tér/hang interfész pontosan ennek a távolságnak ad hangot, amennyiben „magát” a teret szólaltatja meg. A következőkben ezt a két felületet vizsgálom a hangosfilm és a némafilm eltérő kontextusában; ahhoz azonban, hogy a szinkronhang (vagy forráshang) és a térhang megjelenését vizsgáljuk, egy megalapozó distinkciót szükséges bevezetni: a diegetikus és a nondiegetikus különbségét.

A hangosfilm hang-kép viszonyai

Visszatekintve a némafilmre és annak korabeli vetítési-bemutatási eljárásaira, a filmesztéták gyakran hangsúlyozzák, hogy a némafilm nem volt „néma”: egyrészt mindig valamilyen hangi kísérettel (zene, kommentátorok, színészek, zajgépek) mutatták be, másrészt maguk a karakterek sem némák, csak a közönség számára nem hallható módon beszélnek (mi, a nézők vagyunk „süketek” a beszédükre, ahogyan Chion szellemesen megfogalmazza). [21] Helyesebben fogalmaznánk, ha azt mondanánk, hogy a hangosfilm újdonsága a diegetikus [22] hang, tehát a történethez kapcsolódó forráshang és térhang bevezetése. Ezáltal a hang mibenléte és státusza változik meg a hangosfilmben. A némafilmnek különösen a korai korszakában a mozgóképi alkotást sokkal inkább tekintették egyfajta partitúrának, mintsem kész és befejezett alkotásnak. A különböző bemutatási, előadási körülmények és módozatok a filmbemutatást a színházi előadáshoz tették hasonlatossá. (A hasonlóságot jelzi az is, hogy egy ideig a mozikat filmszínházaknak hívták.) Annak ellenére, hogy számos, hangot használó tényező is hozzájárulhatott az előadáshoz, ezek a hangok vagy a történetet kommentálták, vagy annak hangjait „illusztrálták”. Különösen azokban az esetekben, ahol a filmhez komponált zene végigkíséri a mozgóképet, érdemes lenne a film és az előadó művészetek (balett, pantomim) párhuzamát újra megvizsgálni, mely főleg a színészi játék vonatkozásában indokolt. A hangosfilm újdonsága, hogy megszólaltatja magát a történet világát azáltal, hogy kép és hang újfajta összekapcsolási lehetőségeit hozza létre, és új összefüggéseket vezet be.

A diegetikus és a nondiegetikus dimenziók elhatárolása a narratív szintek (elméleti, narratológiai) elkülönítését jelenti. A „diegetikus/nondiegetikus” jelzők a diegézis szóból erednek, melyet az elbeszélés és az utánzás (diegézis és mimézis) közti platóni megkülönböztetésre szokás visszavezetni. [23] A filmi narratológiában a diegetikus kategóriája a történet szcenikus [24] tulajdonságait foglalja össze, vagyis a jelenet (mint a történet jelen ideje) tér-idejét, a karakterek mozgását és a történethez kapcsolódó (azaz akár a szereplők által is hallható) hangok összességét. A nondiegetikus ezzel szemben a történeten kívüli mozzanatok összefoglaló neve, és a narratív közvetítést hangsúlyozó jelzésekben nyilvánul meg. A diegetikus/nondiegetikus különbség (a filmelemzés egyik alapvető fogalompárosa) a történet és a vászon [25] (vagy képernyő, cselekmény, narráció) kettőségére rímel, és a narratív rendszerek alapvető dualitásának (fabula/szüzsé, történet/cselekmény) a megjelenési módjait jelöli a filmben a tér, az idő, a mozgás és a hang vonatkozásában. A diegetikus/nondiegetikus különbsége azt a kettősséget jelöli, amely a narratív művek befogadásának is meghatározó jellemvonása. Egyfajta skizofrén tudatról van szó, ami abban nyilvánul meg, hogy a történetek befogadása közben egyszerre veszünk részt a történet itt és most-jában (a jelenlétnek ezt az illúzióját a filmelméletben az azonosulás fogalmán keresztül jellemezték), és vagyunk tudatában a történet befejezettségének, megformáltságának. [26] A következőkben azt szeretném bizonyítani, hogy a diegetikus hang megjelenítésével a hangosfilm eltérő módon viszi színre a diegetikus és a nondiegetikus viszonyát.

A diegetikus/nondiegetikus különbséget a némafilm is ismerte: a kísérő zene, a narrátori közléseket megfogalmazó feliratok, a szereplői mozgás által nem motivált kameramozgás, a lassítás, gyorsítás, egymásra fényképezés mint narrátori kommentár olyan nondiegetikus vonások, melyek lehetővé tették a történeten belüli és a történetre vonatkozó, elbeszélői metavonások megkülönböztetését. A diegetikus hangnak (leginkább a zajoknak, zörejeknek) a zajgépek által való imitálása a vetítés alatt vagy a kísérő zene partitúrájába való beillesztése és a hangszerek általi utánzása, a dialógusokat tartalmazó feliratok mintát adhattak a történet hangjairól a némafilmben, de valójában képtelenek voltak eltávolítani azt a vastag üvegfalat, mely a némafilm nézőjét elválasztotta a történet világától, és megfosztotta annak hangjaitól. A diegetikus hangok további forrása a némafilmben a képek által megidézett, nem hallható, de „látható” hangok, melyeket a képen látható hangforrásból vagy a hangra reagáló, szintén látható karakterek viselkedéséből következtetünk ki. A diegetikus hangokhoz való ilyen áttételes hozzáférés következtében a korabeli esztétikák úgy hivatkoznak a filmre, mint elsődlegesen vizuális médiumra, ami egyébként nem jelentette a hanghatásoktól való megfosztottság tapasztalatát. [27] A „némaság” csak egy utólagos, a hangosfilm által remediált némafilm jellemző tapasztalata.

A hangosfilm a diegetikus hangok két új minőségét hozta létre: a forráshangot, mely a szinkronizációnak nemcsak gyártástechnikai, hanem olvasási kódként történő alkalmazásán alapul, valamint a térhangot, mely Balázs szerint a vizuális regiszterhez képest eltérő módon szólaltatja meg a teret. A forráshang (vagy szinkronhang) és a térhang inkább a hang két különböző aspektusa, mintsem a filmbeli hangok két különböző osztálya. A hangvisszaverődés (reverberáció) jelenléte a hang térbeliségét hangsúlyozza, míg a (hallható) visszhang nélküli hang a forrásra irányítja a figyelmet. [28]

Szinkronizáció

A diegetikus/nondiegetikus közti különbséget tehát nem a hangosfilm vezette be, ennek ellenére nemcsak megszilárdította ezt a kettősséget, hanem alapjaiban is átformálta, aminek két legfontosabb eszköze a diegetikus beszédhang és a térhang megjelenítése. Az ajakszinkron (lip-synch) a szereplők beszédének látványához hozzákapcsolta a hallható beszédhangokat. Balázs A látható emberben a hang nélküli testek expresszív erejét hangsúlyozta a némafilmben. A színházi színész és a filmszínész játékában az a különbség, hogy a színházi színész mozdulatai beszédét tolmácsolják, annak vannak alárendelve: „Átélt szövegmondásnál a mozdulatok is onnan fakadnak, ahonnan a szavak” (2005: 28), a testben a mozdulat és a szó súlypontja mintegy egybeesik. A némafilm-színész mozdulatai (akárcsak a táncoséi) fölszabadulnak a szavak terhe alól, és a látható „mozdulatbeszéd” más módon, de újra beszédessé teszi a testet – „a szem, nem a fül számára” (2005: 29). [29] A film szelleme nem tér vissza a színházias „beszédmozdulatra” a hangosfilm megjelenése kapcsán (minthogy az emberi hang csekély és inkább alábecsült szerepet kap Balázsnál 1930-ban), a Filmkultúra azonban néhány évtized távlatából már megtalálja a beszédnek a gesztikus, mozdulatszerű elemeit, a beszéddel együtt járó „zengést”, „hanggesztust”, melyek az intonációban, a hangsúlyban és a hangszínben öltenek testet (1961: 210). A beszédhang megjelenése azonban Balázs szerint nem volt problémátlan és pusztán csak nyereséges változás. Amint látni fogjuk, a némafilm és a hangosfilm a diegetikus világhoz való hozzáférés két teljesen különböző módozatát hozta létre.

A hangos váltás előtti és utáni hang-kép kapcsolatok változásának szemléltetésére álljon itt két Balázs-idézet:

„Még a némafilm első esztendeiben készült egy Paganini-film Conrad Veidttel. Az ördöngös hegedűst börtönbe zárják, de ő kihegedüli magát. Játékának boszorkányos hatása, hogy a megbűvölt őrök félreállnak az útjából és hogy hegedülve megbénít minden ellenállást. A tömeg is megbabonázva nyit utat a hegedűszónak. […] Mint látvány szép és meggyőző jelenet, éppen azért, mert néma! Egy nagy színész néma játéka elképzeltet olyan fantasztikus hegedűjátékot, melytől leereszkednek az őrök fegyverei. De mekkora hegedűművésznek kellene a hangosfilmben valósággal játszania, hogy ezt elhitesse?! A csak látható, fantáziában élő zene hatása lehet boszorkányos. A valóságban hangzó zenének hatása már a közönség százféle zenei ízlésétől és érzékenységétől függ.” (1961: 188)

„Keserves csalódás, valósággal kínos leleplezés volt, mikor a közönség hallotta és megértette a filmsztárok beszédét, melyet eddig csak látott. Nem az a tény, hogy beszéltek, hanem az, hogy mit beszéltek, döbbentett meg mindenkit. Amit mondottak, olyan triviális, együgyű és híg volt, hogy jobb ízlésű közönség visszasírta a némafilmet. […] hallható szavuk bődületes trivialitása elborította tekintetük emberi mélységét.” (1961: 208)

A két idézetben szembeállított kétféle hatás a hangi dimenzió különböző jellegű közvetítettségében rejlik. A némafilmben a jelenetet, melyben Conradt Veidt kihegedüli magát a börtönből, valószínűleg [30] aláfestő zene kíséri. A történet fordulatának meggyőző volta Balázs szerint abban a némafilmes konvencióban rejlik, hogy a diegetikus hang képzeletbeli jellegű, tehát – még abban az esetben is, ha ez a fantasztikus hegedűjáték a kísérő zene része, vagy érzékeltetve van általa – a nondiegetikus zene pusztán csak egy hiánynak, a képzeletben létrejövő hangnak az elégtelen „pótléka”. A második idézet, mely a hangosfilmben hallatott beszéd feletti csalódást fogalmazza meg – a hangosfilmbeli dialógusok „nívótlanságának” kontextusában -, színre viszi a képzelt és a tényleges hang (jelentés) közti konfliktust. A némafilm hanghatásai tehát a hiány olyan betöltésén, pótlásán alapulnak, melynek egyetlen tényleges, fizikailag hallható hang sem felel meg. Ezért fogalmaz Chion úgy, hogy a hangosfilm nem az emberi hangok hiányát szüntette meg, hanem a nézőnek azon szabadságát, hogy a maga módján képzelje el azokat: a hangosfilm bezárta az imagináriust (1999: 9).

Az imaginárius befektetésnek ez az állandó jelenléte, a képeknek képzeletbeli kiegészítése, hanggal való felruházása lehet felelős azért, amit a némafilm hipnotikus hatásának neveznek. A diegetikus hangok (főként az emberi beszéd) hiánya, illetve közvetített volta (feliratok, képi utalások által) elvontabbá, Balázs kifejezésével „stilizálttá” teszi a karaktereket. A kikövetkeztetett hang, beszéd, jelentés nem egyértelműsít, hanem megőrzi tételezett jellegét, ezért sohasem lehetünk biztosak a karakterek motivációit, érzelmeit, vágyait illetően. [31] A hallhatatlan beszéd a némafilmben nemcsak a szereplők indítékaival kapcsolatban utalja a nézőt saját feltételezéseire, hanem többnyire a nyílt kijelentések, a szereplők közti párbeszéd tekintetében is (amennyiben az erre utaló feliratok hiányoznak). Ez az alapvető bizonytalanság összekapcsolódik a hangjától megfosztott világ látványával, mely a szereplők számára többé-kevésbé érthető, sajátos törvények alapján működik. Innen az a benyomás, hogy a némafilmes szereplők pusztán csak bábok, melyeket egy számunkra láthatatlan, felsőbb erő mozgat. A némafilm kísérőzenéje – még akkor is, ha többé-kevésbé stilizáltan utal a diegetikus hangokra, vagy ahogy Balázs a korábban idézett passzusban fogalmaz, „ábrázolja” azokat – egy külsődleges egységesítő erő, mely nemcsak hozzáférést ad a diegetikus világhoz, hanem el is választ tőle. Ezt a sajátos kirekesztettséget Balázs így fogalmazza meg: „A némafilmnek nagy előnye volt ez a hangosfilmmel szemben. Mert a csend szava még meg is szólalt a zenében, és a táj és ember és a környező tárgyak közös zenekíséretben jelentek meg a vászon képein, és ezzel egynyelvűek lettek és irracionális beszélgetésüket éreztük és sejtve értettük, ha egy közös muzsika szólt belőlük” (1961: 193).

A némafilm zenéjének ez a külsődleges, egyszerre összekapcsoló és elválasztó jellege abból adódik, hogy a nondiegetikus zene egy egészen különös hang-kép kapcsolatot hoz létre, mely által nem a hang forrását keressük a képen, hanem a dallam és a képsor időbeliségükben játszanak szerepet. Az ilyen tipikus némafilmes szituációk – amikor egy sokáig elfojtott, visszatartott érzés, érzelem tetőfokára hág, a várakozás, az üldözés, stb. – mind egyfajta kumulációt visznek végbe, egy fokozatos összeadódást, melyet a zene, a mozdulatok, gesztusok, beállításváltások sajátos ritmika szerint tagolnak, felépítenek, de végső soron képsor és zene általában tartamként [32] viszonyulnak egymáshoz, s nem a szinkronizált pillanatok sorát hozzák létre (ahogy ez a hangosfilmben általában történik). A némafilm „hangjait” tehát egyrészt az jellemzi, hogy a hangtalan, de beszélő és a hangokra reagáló testek látványa olyan hiányt vagy üres helyet képez, melynek imaginárius betöltésével a néző nem tudja kivonni magát a szupplementum logikájából (vagy végzetes kirekesztettségét tapasztalja meg a diegetikus világból, vagy éppen a hangnak semmilyen „fizikai” hang által nem létrehozható teljességét). [33] Másrészt a nondiegetikus zene mint a diegetikus világ hangjainak „illusztrációja” vagy „ábrázolása” a tartam időbeliségét kölcsönzi az elbeszélésnek. Ez utóbbi azt jelenti, hogy ellentétben a hangosfilm normaként működő szinkron hangjával, mely lineáris és perspektiváló hatású, a némafilm zenéje (vagy a nondiegetikus zene a hangosfilmben) modulálja az időt: képes kitágítani vagy összezsugorítani azt.

A hangosfilm által bevezetett szinkron diegetikus hang lehetősége megváltoztatja a film időbeliségét azáltal, hogy „szinkronizációs pontokat” [34] hoz létre, melyek a szcenikus narrációt, a történet itt és most-ját helyezik előtérbe. A szinkronhangot Balázs akkor tartja elfogadhatónak, ha az hozzáad a képi információkhoz. Az egyik ilyen módja a hang használatának, mikor a hang megteremti „a forrás helyének atmoszféráját” (2005: 181). A hangosfilmbeli szinkronizáció fogalma azt jelöli, hogy a hang forrásához milyen típusú tér [35] kapcsolható, a hallott és látott érzetek egyidejűsége (vagy azok időbeli elcsúsztatása, szétkapcsolása) által: ha a hang forrása (és annak tere) látható a képen, akkor képen belüli (vagy más terminológiában: szinkron) hangról, ellenkező esetben képen kívüli (aszinkron) hangról beszélünk. [36] (Maguk az elnevezések megtévesztőek, hiszen a hang sohasem lehet képen belüli, mint ahogyan arra Metz felhívja a figyelmet. [37]) A kép és a hang egyik összekapcsolási lehetősége tehát a „ki beszél?”, „mi a hang forrása?” kérdésekre [38] vizuális összefüggésekben adott válasz. Ez az a szempont, melynek a korabeli filmesztétikák a legnagyobb figyelmet szentelték, és majdnem egyöntetűen az aszinkron hang alkalmazását részesítették előnyben, aminek fő oka a szó diktatúrájától való félelem volt. [39] Balázs 1948-as Filmkultúrája átveszi az aszinkronitásra vonatkozó érveket, [40] miközben A film szellemében kép és hang kapcsolata eleve problematikus viszonyként van bemutatva. A Chion által „kauzális hallásnak” nevezett percepciós mód varratszerűen [41] működik, mivel a hangot könyörtelenül a forrásához illeszti, mintegy lehorgonyozza a forrás látható vagy – az aszinkron hang esetében – kikövetkezetett képében. A forrás nélküli, lebegő hangokat, melyek a tér egyetlen meghatározott, körülhatárolható pontjához sem tartoznak Chion akuzmatikus hangnak [42] nevezi, és ezt a hangtípust tartja a hangosfilm egyetlen nóvumának. A szinkronizáció tehát mindig a tér látható minőségéhez kapcsolódik, mely a hang forrását pontosítja. A térnek viszont van egy olyan akusztikai aspektusa is, mely nélkülözi a láthatóság kritériumát.

Térhang

Míg a kép és hang viszonyában a hang forrása és a hang közti szinkronizáció az egyik döntő interpretációs mozzanat, a térhang kiegészíti vagy át is írhatja a vizuális referenciát. Hang és tér viszonya talán a leghangsúlyosabb aspektusa a hang kérdésének A film szellemében. A hang térbeli jellege által kimutathatók a hang azon materiális és mediális aspektusai, melyek a hang reprodukciójából (s nem pedig reprezentációjából) következnek. A hangnak – ahhoz, hogy médiumként viselkedjen, azaz információt továbbítson – szüksége van egy másik médiumra, a távolságot megjelenítő térre: a hang rezgés, melyet a levegőrészecskék hullámok formájában továbbítanak. Az így definiált hang azt a távolságot jeleníti meg, melyet az analóg médiumokra jellemző indexikus jel áthidal, vagyis a rezgő test és az azt felfogó érzékeny membrán (hártya) kapcsolata. A tér, pontosabban a levegő, a hang egyik fizikai csatornája, és Balázs számtalan alkalommal hangsúlyozza elválaszthatatlanságukat; [43] azoknak a kategóriáknak nagy része, melyeket a hang elemzésére felvonultat (távolság/közelség, hangperspektíva, hangbeállítás, hangközeli, a csend) térbeli meghatározottságú. Ezen összefüggésből kiindulva Balázs a hangot a tér médiumaként kezeli.

Az így definiált hang a tér olyan minőségét artikulálja, mely csakis ebben a hangi dimenzióban „szólaltatható meg”:

„a hang sokkal inkább térbeli jellegű, mint a vizuális jelenség. Ugyanaz a hang, ugyanaz a szó egészen különbözőképpen cseng egy pincében, egy magas kupola alatt, egy csónakban vagy az utcán. A hang egyáltalán nem függetleníthető a tértől. Mindig határozott térjelleggel rendelkezik, aszerint, hol csendül fel […] Már most is pontosabban következtethetünk a hang színéből a környező térre, mint egy tárgy megvilágításából.” (2005: 180)

„Ez az igazi, a térbeli hang, amelynek hangszínében él forrása helyének atmoszférája.” (2005: 181)

A hang által artikulált tér különbözik a vizuális összefüggésekben létrejövő tértől, mely utóbbi a filmben döntő módon a reneszánsz perspektíva elveit juttatja érvényre, melynek alapja, hogy a fénysugarak a szemben gyűlnek össze. A hang esetében nincs ilyen kitüntetett fókuszpont [44]: sem a halló, sem a hangkibocsátó fél nem kiemelt szereplője a térben modulált hangnak. A hang forrását pusztán a hallás alapján nem lehet a térben pontosan lokalizálni („Halljuk ugyan a teret, de a hangforrás helyét a térben nem hallhatjuk. Hogyha ugyanabban a szobában két hang szólal meg egyszerre, nem világos előttünk a térbeli viszonyuk.” [2005: 180]), a tér a hang megszólaltatója, egyszersmind médiuma. Bár az akusztikai tér a hallgató térbeli helyzete által perspektivált (például a nézőtéren mindenki kissé másként hallja a film hangjait), a hallgató maga is ezen tér által meghatározott, és nem kívül áll rajta. A hangperspektíva a térbeli tárgyak irányát vagy a távolságát jelöli, de képtelen oly módon befogni vagy uralni a teret, mint a centrális vizuális perspektíva.

Balázs példái A hangosfilm című fejezetben majdnem kivétel nélkül a diegetikus tér hangjaira vonatkoznak. A hang vonatkozásában a hangosfilm által artikulált tér három különböző típusa [45] különíthető el: a diegetikus tér, a nondiegetikus tér és a nézőtér (a moziterem vagy a befogadás tere). A diegézis tere virtuális, körvonalait az elbeszélés alapján alkotjuk meg anélkül, hogy ennek a térnek a fizikai határait megrajzolnánk. Balázs szerint a filmbeli rögzített hang képes megjeleníteni ezt a minőséget, mivel a hang megmártózik abban a térben, melyben hallhatóvá válik. Míg a diegetikus térből a vászon pusztán csak (bizonyos szemszögből, megvilágításban láttatott) részleteket, vagyis látható mintákat ad, a diegetikus hangot nem tekinthetjük „mintának”: a diegetikus tér esetében a látható és a hallható minőségei nem szimmetrikusak. A látható mindig keretezett a vászon által (ezért a vászon terét egyszersmind nondiegetikusnak [46], azaz az elbeszélési modalitások függvényének kell tekintenünk), a hang egészen más módon keretezett a filmben. Bár vannak példák a szereplő általi, diegetikus keretezésre (a legkorábbi Hitchcock Zsarolás [Blackmail, 1929] című filmjében fordul elő, amikor a lelkiismeret-furdalás által gyötört nő a szomszédasszony elbeszéléséből a „kés” szót hallja egyre hangosabban, amivel előző éjszaka leszúrta támadóját), az általános gyakorlat szerint a mikrofon elhelyezése nem annyira egy konkrét térbeli pozíció kijelölése a hallgató számára, mint inkább egy tértapasztalat létrehozása. A képi sávban a különböző látószögű, kameraállású beállítások az analitikus vágás által a tér konzisztens, varratszerű képét rajzolják ki. A térhang esetében nem beszélhetünk a tér ilyen, különböző hangperspektívákhoz rendelt felbontásáról: Balázs szerint a térhang szerepe, hogy a „mikrofon csodája” által összekapcsolja a film diegetikus terét a nézőtérrel. Amikor fülünk azonosul a mikrofon membránjával, ez a kihelyezett fül köldökzsinórként működik, mely „megszünteti a távolságot a néző és az ábrázolás tárgya között” (2005: 181). A befogadási tér jellegzetesen akusztikai tere modulálja a filmhallgató számára a film hangjait, melyek körülveszik, ostromolják a hallgató testét és érzékeit. [47]

A térhang akusztikailag teszi hozzáférhetővé a hangforrás és a hallgató fél terét. A két térnek az egybeesése (vagy épp elkülönülése?) a technikai közvetítés folyamán a „mikrofon csodája” által lehetséges, de Balázs egy olyan tapasztalatot is fontosnak talál, amely nem szünteti meg a kettő közötti távolságot. A csend Balázsnál nem a hang hiányát jelöli, hanem a hang mint közvetítő médium előtérbe állítását. A csend tapasztalata meghatározó az egész balázsi életműben, a Naplók bejegyzéseitől az 1925-ben megjelent Die Phantasie-Reiseführer című esszékötetben is. [48] Ezekben a leírásokban, melyeket A film szelleme majdnem szó szerint átvesz, a csend olyan eseményként jelenik meg, mely leginkább a sokkélményhez hasonlítható, egy olyan behatáshoz, amelynek megfelelő kifejezése visszatartódik: „belső, elfojtott kiáltás, harsány némaság […] hangtalan robbanás” (181).

A csend térvonatkozása abban jelenik meg Balázs szerint, hogy csakis a tér végtelensége hozhatja létre azt a „kozmikus élményt”, amelyet a színpadon nem is lehet érzékeltetni, csak a hangosfilmben. „Csönd az, ha messzire hallok. Ameddig elhallok, addig saját terem vesz körül, az én terem. A zajban úgy érezzük, mintha a hangok szűk falakkal vennének körül, olyan ez a hangkamra, mint a börtön cellája. A zaj túlharsogja a távolabbi életet, amelyet csupán látunk, mint egy zárt ablakon keresztül. Némajátékot látunk. Az a tér azonban, amelyet csak látunk, de nem hallunk, sohasem kézzelfogható. Csak azt a teret éljük t, amelyet hallhatunk is.” (182) A részlet háromféle tér megkülönböztetésén alapul: a zajból felépülő hangkamráé, a némajátékszerű látott, de nem hallott távoli tér és a hallott messzeség.

Talán a csendnek ez a minősége áll a legközelebb a természeti tárgyak Benjamin által leírt aurájához, amennyiben mindig távoli, a szubjektum által kisajátíthatatlan, transzgresszív tapasztalat marad. [49] Ugyanakkor ez a csend nagyon is beszédes, nem „semmi”, hanem hallgatással terhes, a tárgyak „titkos nyelve”, mely teljességgel figyelmen kívül hagyja az embert és az emberit. Akárcsak Baudelaire Correspondances című költeményében, ahol a természet olyan nyelvet beszél, amely titkos jelekből és kapcsolatokból épül fel, Balázsnál a csend „földalatti módon kapcsolódik a múlt minden órájához” és a „világ összcsendjéhez”, ezért mondhatja, hogy „aki nem ismeri a csendet, annak múltja sincsen”. [50]

Következtetések és módszertani megjegyzések

A fenti fejtegetések a filmi hangnak leginkább azon aspektusait érintették, melyek Balázsnál is előtérbe kerülnek. Számos más, érvényes szempontja van a hang tárgyalásának, például a hang bevezetésének technikai és intézményes háttere, a különféle hangoknak szigorúbb tipológiája (hangkommentár, hangalámondás, belső monológ, dialógus stb.). A némafilm és a hangosfilm hangi potenciáljának az összevetésénél nem annyira az „eredeti” történeti állapot és a korabeli befogadás helyreállításának a célja vezetett, hanem annak megmutatása, hogy a hangosfilm hogyan képezi meg azt a különbséget, mely elkülöníti a némafilmtől: a némafilm számunkra már óhatatlanul is a hangosfilm „szemén” vagy „fülén” keresztül közvetítődik.

A filmet audiovizuális médiumként szokás meghatározni, de kép és hang viszonya és szerepe máig sem tisztázott a filmtudományban. Balázs a hangi reprodukció és a hang mint reprezentáció közti felismert szakadékot úgy próbálja áthidalni, hogy a hangot a képhez és a térhez rendeli hozzá oly módon, hogy a kettő között artikulációs viszonyt feltételez. A szinkronizáción alapuló kauzális hallásnak a működtetése a hangosfilmet a hangforrás képi jelenlétének és hiányának villódzásaként határozza meg. Ezzel szemben a térhang az egyik olyan felület, amely által az általában morajlásként meghatározott, a kommunikációt (az emberi beszédet) hátráltató zajok és zörejek információforrássá válnak. A hang így olyan eseménnyé válik, mely nem választható le a hangforrás és a térbe helyezett hallgató testi, perceptuális tapasztalatairól, és azokról az akusztikai minőségekről, melyek a hang érzékelését meghatározzák. Az esztétika és a technika között közvetítve Balázs olyan utat keres, mely egyaránt megmutatja „a technika szellemét és a szellem technikáját” (2005: 198).

[A szöveg a Bolyai János Kutatási Ösztöndíj támogatásával készült.]

Jegyzetek

 1. [1] Rick Altman: Moving Lips: Cinema as Ventriloquism. Yale French Studies, 60. szám, Cinema/Sound. (1980), 67-79. 68-69.
 2. [2] Michel Chion: Audio-Vision. Sound on Screen. Szerk. és ford. Claudia Gorbman. New York, Columbia University Press, 1994. és The Voice in Cinema. Szerk. és ford. Claudia Gorbman. New York, Columbia University Press, 1999. További hivatkozások a főszövegben.
 3. [3] Az ellenpont fogalmának téves filmi használatához lásd Chion 1994: 36-37. Chion rámutat arra, hogy az audiovizuális ellenpontnak a filmtörténetben használt fogalma legtöbbször tévesen használja a zenei analógiát, és az ellenpont kategóriája alá sorolt jelenségek tulajdonképpen a disszonáns harmóniához tartoznak. Míg a harmónia az egyidejűleg hangzó hangok (akkord) viszonyát jelöli, az ellenpont horizontális síkon jön létre azáltal, hogy a párhuzamos hangokat különálló és egyenrangú szólamokként kezeli. Az ellenpont gyakori formája a kánon és a fúga. Az ellenpontra épülő hanghasználat pártolói a szólamok egyenrangúságát a vertikális hang-kép viszonyra vonatkoztatják. Chion szerint a filmi hangsáv nem működik önálló szólamként.
 4. [4] Lásd ehhez például Rick Altman alapvető és úttörő munkáit. Introduction. Yale French Studies, 60. évf. (1980) Cinema/Sound tematikus szám, 3-15. vagy az általa szerkesztett Sound Theory – Sound Practice című kötetet (New York, Routledge, 1992). További forrásokhoz lásd a filmsound.org oldalt, ahol online és offline források vannak listázva tematikusan.
 5. [5] A hangosfilm a 20-as évek legvégén kezdett elterjedni, de volt néhány átmeneti év, amíg a filmszínházak átálltak a hangosítási technika kialakítására.
 6. [6] Ezt a változatot fordították le angolra először (Theory of the Film. Character and Growth of a New Art címmel [New York, Dover, 1970]), és adták ki magyarul 1961-ben A film (Budapest, Gondolat) címmel.
 7. [7] Balázs Béla: A látható ember. A film szelleme. Budapest, Palatinus. 2005. 176. További hivatkozások a főszövegben.
 8. [8] Lásd The Face of the Landscape című tanulmányomat.
 9. [9] A remedializáció fogalmához lásd: Jay David Bolter – Richard Grusin: A remedializáció hálózatai. Ford. Babarczi Katica. Apertúra, 2011. tavasz (http://apertura.hu/2011/tavasz/bolter-grusin)
 10. [10] „A színpad vizuálisan elénk varázsolhatja az erdő hangulatát, akusztikailag nem. A hang a színpadon sohasem cseng úgy, mint az erdőben. Mert az akusztikai hatást a valóságos tér határozza meg. És még akkor is, hogyha a színpadon valamilyen technikai eszköz segítségével sikerül előállítani a hang eredeti színét, a nézőtéren teljesen megváltozik a hanghatás.” (2005: 181)
 11. [11] Lásd ehhez Rick Altman (1992) „point of audition” fogalmát, valamint ennek kritikáját Chionnál (1994: 89).
 12. [12] „Nagyközeliben láthatjuk és hallhatjuk, hogyan ordít egy ember, és ugyanazon a képen azt is halljuk, mint vész el magányos és elhaló hangja a tömeg zajában.” (2005: 187)
 13. [13] A következő lépésben Lastra azt javasolja, hogy a hangi reprodukciót soroljuk be a reprezentáció fogalma alá. Ez azért leegyszerűsítő eljárás, mivel összemossa a reprezentáció kérdésfelvetéseit a technikai médiumok megjelenésével kialakult mediáció történeti kérdéskörével. A hang vonatkozásában ezt a különbséget lásd Friedrich Kittler: Gramophone, Film, Typewriter (Ford. Geoffrey Winthrop-Young és Michael Wutz. Stanford, Stanford University Press, 1999.) első fejezetét.
 14. [14] Lastra: i. h. 86.
 15. [15] Bár az idézetekben nem hangzik el, a szövegkörnyezetből kiderül, hogy a hangosfilmben rögzített hangról van szó.
 16. [16] Friedrich Kittler: Elméleti előfeltevések. In uő: Optikai médiumok. Ford. Kelemen Pál. Budapest, Magyar Műhely-Ráció Kiadó, 2005. 19-40.
 17. [17] A hipermediáció és a közvetlen hozzáférés (immediation) szintén Bolter és Grusin fogalmai: mindkettő az élmény autentikusságán alapul, csakhogy míg az előbbi a médium megtapasztalása által teszi ezt, addig az utóbbiban a médium kitörli önmagát. Míg Bolter és Grusin szerint minden médium a maga képére formálja át a valóst, melynek nevében igényeket támaszt annak legtökéletesebb közvetítésére, addig Kittler szerint a technikai médiumok (szemben a művészetekkel) ténylegesen is a valóst mediatizálják. A médiumok ezen meghatározásának kulcseleme Kittlernél a shannoni információ- és kommunikációfogalom, mely nélkülözi mind az értelem, mind az ember jelenlétét.
 18. [18] A reprezentáció és a mediáció közti ilyen típusú megkülönböztetést John Guillorytól kölcsönzöm. Guillory amellett érvel, hogy a médium fogalma, abban az értelemben, ahogyan ma használjuk, hiányzott a nyelvelméleti, -filozófiai gondolkodásból, és csak a technikai médiumok tömeges használatával, a XIX. század második felétől kezdődően artikulálódott. Guillory a reprezentációt a mediáció egyik stratégiájának tekinti; e két fogalom viszonyának történeti összefüggéseihez lásd John Guillory: Genesis of the media concept. Critical Inquiry, 36. évf., 2. szám (2010. tél), 321-362.
 19. [19] A látható és a hallható vonatkozásában még van egy fontos különbség, amely viszont az észlelő identitásához kapcsolódik. Míg önmagunk látása csak részleges, addig a hangkibocsátást mindig kíséri az általunk kibocsátott hangok hallása. (Ezért van például az, hogy a siket kisbabákat pár hónapos korukban a sírásuk alapján ki lehet szűrni.) A hangkiadás és a hallás szimultaneitásából adódó megerősítő és szabályozó funkció árnyalhatja a lacani tükörfázis alapvetően vizuális modelljét. A beszédhangok, illetve az írás látható formája közti különbséget a nyelvi artikuláció szempontjából lásd Niklas Luhmann: Az írás formája. Ford. Oláh Szabolcs. In Intézményesség és kulturális közvetítés. Szerk. Bónus Tibor, Kelemen Pál, Kulcsár-Szabó Zoltán. Budapest, Ráció Kiadó, 2005. 431-455. 442.
 20. [20] „A halk hang úgy cseng, mintha be lenne építve a környező zajokba. Ennek sajátos a hangulata, és igen alkalmas a mélyreható elemzésre. Hiszen nemcsak a közeli hangot halljuk, hanem egyidejűleg felfogjuk viszonyát és összefüggését is az akusztikus összhatással. A csak vizuális film erre képtelen.” (2005: 187. kiem. F. I.)
 21. [21] Chion összeveti a filmes korszak retrospektív elnevezéseit: a latin nyelvekben – akárcsak a magyarban – a „néma” megjelölés használatos (franciául például: cinéma muet), míg az angolban a „csendes” vagy „hangtalan” (silent film). Míg az előbbi a beszéd képtelenségét állítja, az utóbbi a hangok hiányára utal. Ezzel a distinkcióval szimmetrikus a „talking film” (beszélő film) és a „sound film” (hangos film) elnevezésekben megmutatkozó különbség (a beszéd jelenléte, illetve a hang jelenléte). Chion a maga részéről ezekhez a megjelölésekhez a „süket film” megjelölést teszi hozzá, utalva arra, hogy a néző számára a diegetikus világ egy süket embernek a nézőpontját vagy „hallópontját” kínálja. (Chion 1999: 6-8)
 22. [22] Ez ilyen formában csak a történetmondó filmre áll. Meg kell vizsgálni a hangosfilm bevezetésének a következményeit a nem történetmondó filmek esetében is.
 23. [23] Platón: Állam 393c-d. Richard Raskin (1992) szerint Etienne Souriau alkalmazta először a terminust a filmre L’univers filmique (Paris, Flammarion, 1953. 7.) című munkájában. A platóni passzus az idézés technikájának két módozatát különbözteti meg: mikor a költő saját nevében beszél, és nyíltan idézi valakinek a beszédét, és azt, amikor felveszi a beszélőnek a pozícióját, és eltünteti a saját jelenlétét. A narratológia a narratív közvetítés két eltérő módjaként vette át ezt a megkülönböztetést, és nagyrészt a szereplő és a narrátor közti távolságtartás mértékét jelölte vele. Az irodalmi narratológiában ennek a távolságnak a végpontjait jelöli például az idézett beszéd és a függő beszéd, az idézett monológ és az elbeszélt monológ (Cohn) vagy a külső és belső fokalizáció (Genette, Bal).
 24. [24] A filmbeli történetmondás (különösen a „klasszikus narratíva”) paradigmatikus és meghatározó szintagmája a jelenet, melyben a történetet közvetítő mozzanatok kevésbé kézzelfoghatóak, mint a többi narratív szintagma (gyakorító, váltakozó, leíró stb.) esetében. Éppen ezért a diegetikus kategória a mimézishez áll közelebb, míg a nondiegetikus kapcsolódik a diegézishez.
 25. [25] A „vászon” ebben az összefüggésben a történet létrehozásának a mozzanatára, az elbeszéltségre, annak modalitására vonatkozik. Bár a vásznon megjelenő alakok, tárgyak általában a történet részei, a vászon határai, kétdimenziós jellege, a képen kívüli mind olyan tulajdonságok, melyek a kettő különbségét hangsúlyozzák.
 26. [26]
 27. [27] Éppen ellenkezőleg. A nagy vonatrablás 1904-es vetítéséről a Philadephia Inquirer azt írja, hogy a nők befogták a fülüket, hogy kizárják a puskalövések zaját. Idézi Rick Altman: The Silence of the Silents. Musical Quarterly, 80, 4. szám (1997): 649-657.
 28. [28] A forráshang és térhang közti különbséget Chion is említi; hang és kép együttes olvasását, vagyis a két érzékterülethez kapcsolódó érzetek egymásra vonatkoztatását a filmben „audiovizuális szerződésnek” nevezi. Lásd Chion tanulmányát az Apertúra jelen számában.
 29. [29] Bár az arcjáték és a test elsősorban vizuális kifejezési formák, Balázs kitétele, miszerint ezek „nem kizárólag látható jelenségek” (2005: 28), minthogy egyfajta „belső zenét”, ritmust közvetítenek, alátámasztja azt az értelmezésemet, hogy a némafilmben a hang nélküli testek a néző számára hallhatatlan hangok táncát járják. A nondiegetikus zene ennek a hangnak csak illusztrációja.
 30. [30] A filmet nem sikerült megszereznem.
 31. [31] Szalóky Melinda azt vizsgálja, hogy a Virradatban az általunk csak kikövetkeztetett, a szereplők által hallott hangok milyen jelentéstöbbletet eredményeznek az értelmezésben, és hogyan számolják fel a külső és belső hangok közti határt: „Vizualizált hangnak nevezem a narratív szempontból jelentős akusztikai jelenségek festői visszaadását, egyfajta hangközelit, amely – mint általában a közelkép – arra szolgál, hogy irányítsa és megszervezze a nézői figyelmet, és segítse a nézőt a történet megértésében.” (saját ford. Szalóky Melinda: Sounding Images in Silent Film: Visual Acoustics in Murnau’s Sunrise. Cinema Journal, 41. évf., 2. szám (2002. tél), 84-108.)
 32. [32] A tartam típusú időbeliséget Balázs a fiziognómia térbeli összefüggései kapcsán alkalmazza a bergsoni fogalom, a dallam segítségével (a közelképen megjelenő arc úgy viszonyul a térhez, mint ahogy a dallam az időhöz): „Ennek a sajátos dimenziónak a megértéséhez hozzá fog segíteni Bergson, aki az időt és a tartamot (durée) elemzi. A dallam, mondja Bergson, egyes hangokból tevődik össze, melyek egymás után, tehát az időben hangzanak el. Mégis a dallamnak nincsen kiterjedése az időben. Mert az első hangot csak az teszi a dallam elemévé, hogy a következőkre utal és a legutolsóra is vonatkozik. Tehát a legutolsó hang – bár időben csak másodpercek múlva fog felhangzani – mint dallamalkotó, már jelen van az elsőben. És az utolsó hang is csak azért dallamot befejező, mert az elsőt hozzáhalljuk. A hangok egymás után az időben hangzanak. Vagyis reális tartamuk (durée) van. De a dallam egységes vonalának nincs kiterjedése az időben. A hangok egymásra vonatkozása nem időbeli jelenség. A dallam nem apránként keletkezik az idő folyamán, hanem mint egységes egész, megvan már az első hang felhangzásánál. Honnan tudnám különben, hogy dallamot kezdek vele?” (1961: 65-66). A dallam bergsoni metaforája az idő mint puszta kronológia elutasítását vezeti be: a dallam linearitása másodlagos tartamként való megtapasztalásával szemben.
 33. [33] A némafilm hangi dimenzióját talán a regényolvasáskor tapasztalt vizuális elképzeltetéséhez, kiegészítéséhez hasonlíthatnánk.
 34. [34] Chion terminusa, mely a vizuális és a hangi események szinkronitását jelöli (1994: 58).
 35. [35] A különböző hangokhoz tartozó tereket Chion arra vezeti vissza, ahogyan a film a korábbi médiumok hanghasználatát remediálja: a diegetikus szinkron hang a színházi, a nondiegetikus zene az opera és a vaudeville hagyományait folytatja, és a hely, melyhez kapcsolódik, a tényleges vagy a képzelt zenekari árok (1994: 68), a narrátori kommentár a laterna magica vetítésekre nyúlik vissza. (1999: 4)
 36. [36] A némafilm is ismerte a képen belüli/képen kívüli oppozícióját: a szereplőknek a képen kívülre vezető tekintete, az árnyékok, melyek a képen kívülről vetültek (Balázs példája), egy láthatatlan dimenziót vagy a későbbiekben megmutatott helyet tesznek elképzelhetővé.
 37. [37] Metz, Christian: Aural Objects. In John Belton és Elisabeth Weis (szerk.): Film Sound: Theory and Practice. New York, Columbia University Press, 1985. 157-8.
 38. [38] Ezen kérdések irodalomelméleti relevanciáját és a prozopopoeia alakzatának elemzését lásd Paul de Man és Bettine Menke írásaiban.
 39. [39] Eisenstein, Pudovkin és Alekszandrov 1928-as kiáltványa például így fogalmaz: „A hanggal végzett első kísérletekben arra kell törekedni, hogy a hang határozottan ne essen egybe a vizuális képekkel.” (Eisenstein 1998: 84) Ezt a hanghasználatot „a vizuális és auditív képek új zenekari ellenpontjának” nevezik.
 40. [40] Eisensteinék fentebb idézett kiáltványa elítéli a beszélő filmek „naturalizmusát”, „ahol a hangfelvétel […] pontosan egybeesik a vásznon látható mozgással, és a beszélő emberek, a hangot adó tárgyak stb. valamiféle »illúzióját« kelti”. (uo.) Balázs: „A hang aszinkron használata a hangosfilm legkifejezőbb eszköze. Szinkron felvételekben a hang voltaképpen csak naturalisztikus kiegészítése a képnek. Arra jó, hogy a film még hasonlóbb legyen a valósághoz.” (1961: 203)
 41. [41] A varrat a hetvenes évek filmelméletének Lacan pszichoanalitikus elméletéből importált kulcsfogalma, mely elsődlegesen a klasszikus narratíva nézőpont-technikájára vonatkozik.
 42. [42] Lásd ennek részletes tárgyalását Chion The Voice in Cinema című könyvében.
 43. [43] „A hang nem függetleníthető a tértől. Mindig határozott térjelleggel rendelkezik, aszerint, hol csendül fel.” (2005: 180); „A hang konkrétabb, térbelibb, mint a kép, amely a filmen megszólaltatja.” (2005: 183)
 44. [44] A nézőpont mintájára létrehozott „hallópont” létezéséről szóló vitákat Chion foglalja össze: 1994, Point of audition.
 45. [45] A különböző minőségű terek elhatárolásában Mary Ann Doane felosztását veszem alapul, melyet kiegészítek a nondiegetikus tér fogalmával. Ezt a tértípust Doane a vászon terének nevezi, a nondiegetikus tér fogalma viszont tágabb ennél. (Mary Ann Doane: A film hangja: test és tér artikulációja. Ford. Fürstner Klára és Pataki Katalin. Apertúra, 2006. tavasz. http://www.apertura.hu/2006/tavasz/doane/)
 46. [46] A vászon látható tere a referenciálisan működő kauzális hallás során kap szerepet, melynek célja a hang forrásának vizuális azonosítása. A nondiegetikus tér hangi forrásai az aláfestő zene és a narrátori kommentár, melyeket csak ritkán lehet konkrét térhez, helyhez kapcsolni (a visszaverődő, hangteret képező hangkommentár kevésbé autoritatív és testetlen).
 47. [47] A befogadási tér hangtérként való aktiválását különösen a Dolby-rendszer valósította meg azáltal, hogy a hangvisszaverődést a néző testét körülvevő burokként használta.
 48. [48] Lásd Balázs Béla: A csend. In uő: A fantázia-útikalauz, avagy a lélek bedekkere vakációzók számára (részletek). Ford. Török Ervin. Apertúra, 2009. ősz (http://apertura.hu/2009/osz/balazs)
 49. [49] Benjamin a természeti tárgyak aurájának példájaként a „horizonton kirajzolódó hegyvonulatot” említi, Balázsnál a csendet megteremtő esemény „amikor a tenger végtelenjében alig hallhatóan elhangzik egy kiáltás, amikor a téli hósivatagban valahol messze ostor csattan” stb. (182)
 50. [50] Balázs Béla: A csend. Benjamin a műalkotások auráját eredezteti „a hagyomány összefüggésrendszerébe történt beágyazottságukból”, azok eleven, változékony és a jelen számára kisajátíthatatlan távolmaradásából.