A film teoretikusai az utóbbi időben talán túl elhamarkodottan jelentették ki, hogy a film hangja egyenlő partnere a képnek, mint valami nagy demokráciában.  [1] Nem kell visszatérni ahhoz a vitatható érvhez, hogy „a film vizuális médium”, annak érdekében, hogy kérdéseket tegyünk fel a filmi hang helyzetéről.  [2] Úgy gondolom, fontos az intuitív hangérzékelésünk közelebbi vizsgálatával kezdeni.

A fenomenológia talán fontos dolgokat világíthat meg azzal kapcsolatban, hogy milyen elképzeléseink vannak a hangról. Bár a hang és a fény ugyanarra a hullámtermészetű fizikai alapelvre vezethető vissza, az érzékelésükben különbségek vannak. A fényesség és a szín, úgy tűnik, inkább egy tárgyban, annak sajátjaként jelennek meg – annak tulajdonságai -, nem pedig a tárgybóláradnak.  [3] A hangra ezzel szemben úgy gondolunk, mint ami egy forrásból jön, egy tárgyból, legyen az egy rádió, egy ajtó vagy egy csizma. A szín (látszólag) tulajdonság, míg a hangot kiadja valami. Hajlamosak vagyunk ezért arra, hogy a hangot átmenetiként és esetlegesként fogjuk fel – egy „on/off” jelenségként -, míg a látvány függetlenebb (egy hivatkozási pont, ha úgy tetszik). Nem úgy gondolunk a tárgyakra, mint alapvetően színtelen dolgokra (pedig természetesen azok); hanem úgy hisszük, a könyvnek piros a borítója akkor is, ha sötétben van. A háttérzajra, a szoba zajára, saját lélegzésünkre és a csöndre azonban úgy gondolunk, mint aminek nincs hangja, és ebből adódóan a tárgyakat alapvetően hangtalanoknak fogjuk fel, addig, amíg meg nem érintjük őket, vagy másképp mozgásba nem hozzuk. A hang jön és tovatűnik, míg a fény állandónak látszik. Ráadásul ezek a hiedelmek kapcsolatban lehetnek az emberi nyelv univerzális tulajdonságaival. Van arra vonatkozó bizonyíték, hogy számos nyelvben az öt fő érzékszerv olyan hierarchiát követ, mely a látással kapcsolatos igéket a hallással kapcsolatos igék fölé helyezi.  [4]

Úgy tűnhet ezért, hogy a látvány mint maradandó és a hang mint múlandó elképzelés beépült az érzékelő aktivitásunkba és nyelvhasználatunkba. Ezeket a tényeket elméleti szinten is meg kell vizsgálnunk, mikor azt elemezzük, hogy a néző hogyan szembesül a hanggal és a képpel a filmen. Vajon a hang kevésbé kötődik a szubsztancia kanti kategóriájához, mint a látvány? Ha így van, melyek azok a hanghoz fűződő előfeltételezéseink, amelyek irányítják a film vizuális sajátosságaiból nyert tudás megszerzését? Megváltoztathatók-e ezek az előfeltételezések annak érdekében, hogy megváltozzon a hang és a fény kapcsolatáról kialakult felfogásunk? Még általánosabban: hogyan lehet a hang hasznos a számunkra a világ leírásában és egy valóságos világ elgondolásában a film fikcionális ábrázolásán keresztül? Hogyan kapcsolódik a hang a nyelv szerkezetéhez? Ezeket a problémákat összefoglaló néven a filmi hang „episztemológiai” vetületeként kezelem a továbbiakban.

A filmi hang episztemológiáját a következő sorokban felvázolt érvelésen keresztül fogom megközelíteni. A világ egyes jellegzetességei és az, hogy ezek hogyan kerülnek velünk érintkezésbe, mélyen beágyazódtak a nyelvünkbe, értelmünkbe és cselekedeteinkbe. Ennek eredménye az az aszimmetrikus megítélésmód, mely szerint a tárgyaknak látható és hallható tulajdonságokat tulajdonítunk. Úgy tűnik, hogy a tárgyak látható (és másmilyen) tulajdonságokból épülnek fel, míg a hang a tárgyról lekapcsolhatónak és átmenetinek látszik. Ez az aszimmetria megmagyarázza a látás kiemelt szerepét a filmi médium által megjelenített tárgyak megértésében. Mindazonáltal lehetséges a hangot olyan módon érzékelni, amely megszokott előítéleteinken felül áll. Ez azonban másfajta mentális irányultságot igényel (inkább a „felülről lefelé”, mint a „lentről felfelé” történő műveleteket) az „idő” más érzékelésével, ami másféle folyamatot hasznosít a tárgyak leírásában. Amikor az érzékelés ezen aspektusait gondosan tisztáztuk, számos, a hang természetéről szóló ellentmondásos kijelentés összehangolhatóvá válik, míg számos, a film alapvető összetevőiről (pl. a mozgásról, a vágásról, a hangról és a kameráról) szóló egyszerű kijelentés elvethető.

1. A hang mint melléknév

Nem kétséges, hogy a materiális tárgyak felé hajlunk: az autó fog elütni, nem a fénye vagy a hangja. A kérdés az, hogy miért tűnik a fényesség és a szín inkább egy materiális tárgyhoz kötöttnek, mint a hang, és miért képes így a fény és a szín megbízhatóbb vezetőt szolgáltatni testünknek a világban való mozgáshoz. A válasz talán a fény- és hanghullámok fizikájában rejlik. Gondoljunk például a fény sokkal rövidebb hullámhosszára (és magasabb frekvenciájára) a hangéval szemben.  [5] A színként érzékelt fény legnagyobb része visszaverődik a felületekről, vagy áthalad rajtuk, míg a hallott hang legnagyobb része közvetlenül a forrásból jön. Az az információ, amit egy olyan hang helyzetéről és forrásáról nyerünk, amely egy visszaverődő hangból jön (pl. visszhang), általában minimális ahhoz képest, amelyik közvetlenül jut el hozzánk hangerő, hangmagasság és hangszín formájában. Úgy is fogalmazhatnánk, hogy mi emberek nem tudunk a hang alapján eligazodni környezetünkben (mint ahogy azt a denevérek és a bálnák teszik), hanem ehelyett a látásra támaszkodunk, hogy vezesse testünk mozgását (mivel az emberi fül nem érzékeli azt a sokkal magasabb hangfrekvenciát, amely a keskeny sugárban való terjedéshez és a felületekről való pontos visszaverődéséhez szükséges). A fény egyenes vonalú terjedése képes nagy felbontású képet adni egy tárgy széleiről és alakjáról, de nem tud elhajolni a sarkok körül; ennélfogva egy tárgy színe élesen meghatározott, és nem válik homályosan elmosódottá. Ezzel szemben az emberi fül által feldolgozott hang kevésbé pontos, de flexibilisebb: képes hajlani a sarkok körül, vagy egy hallgató mögött előbukkanni, és így egy tárgyat globálisabban, „mozdulateseményként”, a környező tér zavaraként közvetíteni.  [6] A fény és a hang tehát abban a képességükben különböznek, ahogy egy tárgy relatív helyzetét és anyagi szerkezetét felfedik, mert működési frekvenciájuk más. Az emberek számára a látott információ sokkal fontosabb a tér érzékelésében, mint a hallott.  [7] Ezt könnyen igazolhatjuk, ha körülnézünk környezetünkben és észrevesszük, hogy milyen kevés tárgy és akadály ad ki hangokat.

Egy második nagy különbség a fény és a hang között a mozgásukban van. Mivel a hanghullámok mechanikusak, és szükségük van egy közvetítő közegre – mint amilyen a levegő vagy a víz vagy az emberi csont -, a hang jelenléte két mozgást implikál: egy vibráló aurális forrást és egy vibráló közeget. Ezzel szemben a fény elektromagnetikus sugárzásának nincs szüksége közvetítő közegre – ha volna, nem látnánk a csillagokat éjjel -, és nem ugyanazt a mozgásformát képviseli, mint a hang. A fény olyan fotonmozgást testesít meg, mint például az elektromos töltés oszcillációja vagy az atom energiaállapotában történő változás. A hang az emberi testet körülvevő közegben történő mozgástól függ. Ez azt jelenti, hogy egy adott tárgy mozgását át kell fordítani (a médium adta képfelbontás határain belül) olyan cselekvés léptékére, ami az emberi léptékkel összemérhető. A hangokkal, melyeket hallunk, bár végső soron molekuláris interakciókból származnak, a médium nagyívű mozgásain keresztül találkozunk. A levegő közegében például egy mechanikai zavar az egymást követő levegőmolekulákat olyan módon hozza rezgésbe, hogy irányuk párhuzamos lesz a nagy nyomásváltozások haladási irányával, melyeket mi hangként érzékelünk. Megszakítások egy hangban (és más változások a hang minőségében) nemcsak egy vibráló aurális forrásra utalnak, hanem egy elasztikus médiumot is jellemeznek, melyben különböző aurális források találhatók. A hang lehetővé teszi számunkra, hogy egy (vibráló) tárgy belsejét halljuk, és – talán hozzátehetnénk – hogy halljuk azt a felszínt, amit nem láthatunk, illetve, hogy halljuk azon felszínek sokaságát, melyek talán túl sokan vannak ahhoz, hogy összjátékuk különlegességébe beleláthassunk (pl. a levelek hirtelen moccanása a fán egy szélfuvallatban vagy egy versenyautó motorzaja vagy a templomi orgona hangja). Így még a „csend” is térbeli interpretációjú struktúrát nyer: a médium visszatért kezdeti állapotához (alapzaj [room tone]).  [8] Ezzel ellentétben a látható fényt közvetlenül érzékeljük, mert a mozgása nem követeli meg egy közvetítő közeg mozgását. Az elektromágneses mezők rezgési iránya merőleges azon sugárzás terjedésének irányára, amelyet mi fényként érzékelünk. Így a fényt és a hangot különböző fajta erők hozzák létre, melyek különböző irányokban működnek a terjedés irányára való tekintettel. Ráadásul a hangnak, ellentétben a fénnyel, szüksége van egy terjedési közegre. A fény hathat egy médiumra, mint ahogyan a naplemente vörösre változtatja az atmoszférát, de ilyen esetekben a médium pusztán megvilágított tárggyá válik. A fény az őt visszaverő tárgyakon keresztül fedi fel tulajdonságait, míg a hang egy olyan médiumon keresztül teszi ezt, mely mozog, és körülölel minket.

Az, ahogy az emberi biológia képes kiaknázni a fény és a hang közötti fizikai különbséget, azt eredményezi, hogy a hangnak kisebb túlélési értéke van az emberek számára, mint a fénynek. Ez a tény húzódhat meg Christan Metz azon vélekedésének hátterében, hogy a hang alapvetőenmelléknévi, míg a látvány főnév. Metz a hang episztemológiai vetületét boncolgatja, amikor kijelenti, hogy minden érzékelés a verbális nyelv megnevező funkciójából ered. Amikor látunk egy „lámpát”, és azt megnevezzük, az azonosítás teljes, és mindenféle kiegészítés csupán melléknévi lehet – egy „magas, olvasó” lámpa.  [9] Ezzel szemben, amikor hallunk, és megnevezünk egy hangot, az azonosítás nem lesz teljes. Egy „fütyülő” hangot pontosítani kell: mi fütyül? Honnan ered a hang? A szélnek a füttye a fák között, a folyón túlról[10] Metz szerint a hangok pusztán leíró jellegű melléknevekként funkcionálnak olyan szubsztanciák kapcsán, melyek alapvetően vizuálisak, és pontosan megnevezhetők egy főnévvel. Ez akkor is igaz, ha egy hang beazonosítása nyelvileg egy főnévvel történik: „Hallottam a fütyülést”. Megint az a kérdés, hogy ki vagy mi adja ki a fütyülő hangot? Metz szerint a látás és a hallás ezen tulajdonsága az indoeurópai nyelvek alany-állítmány szerkezetére vezethető vissza, valamint az elsődleges, a másodlagos és a harmadrendű tulajdonságokra, melyeket a nyugati filozófiai hagyomány hozott létre. A nyelvet és a filozófiát pedig társadalmi és kulturális jelenségekként tartjuk számon. Az, hogy mi „érthető” számunkra, attól függ, hogy hogyan tanultunk osztályozni és kategorizálni, valamint feltehetőleg attól, hogy milyen társadalmi cselekvések és célok támogatottak vagy megengedettek a világ bizonyos speciális leírásai mellett.  [11] Ily módon Metz egyetért Roland Barthes-tal és másokkal abban, hogy a világot egy adott társadalom céljai és kifejezési módjai határozzák meg, és nem csupán egy univerzális „természet”, elfogulatlan szemmel nézve.

Miközben Metz a naiv érzékelésről szóló elgondolást szedi darabokra, és helyére új társadalmi és történeti elemeket állít, a nyelvészeti determinizmussal kacérkodik. Szerinte egy észlelt dolog és a szó, amely megnevezi, szoros, szétszakíthatatlan köteléket képez.  [12] Bár természetesen nem szükséges kiejtenünk a szót, ha hallunk vagy látunk valamit, de egy vagy több szót elő kell hívnunk elménkben „gondolatként” azért, hogy az érzékelés érthető legyen. (Ez egyezik Metz más kontextusban történt megállapításával, miszerint egy revolver képe egy filmen nem „revolverként” fordítódik, hanem egy verbális felkiáltásként: „Itt egy revolver!”) Mindazonáltal nem szükséges elfogadnunk ezt a fajta nyelvi determinizmust azért, hogy megőrizhessünk egy alapvető különbségtételt a hallható és a látható tárgyak között a való világban és a filmen.  [13] Ha a természetes nyelvet csupán egyfajta mentális kalkulációként fogjuk fel, akkor nem kell a nyelvészetet úgy tekintenünk, mint vezető episztemológiai paradigmát az érzékelés működésének leírásában.

A fénynek van egy elemi előnye a hanggal szemben, amikor a cél a tárgyak és tulajdonságaik azonosítása és helyének megállapítása a bennünket körülvevő térben vagy a film által megjelenített térben. (Bár, mint azt később tárgyaljuk, ez az előny elveszhet, amikor más célokról van szó, mint például az indoklás, felidézés, keresés, módosítás, tervezés, tanulás, szándék, óhaj vagy elképzelés.) Amikor célunk az, hogy felfedjük, mik a dolgok és hol találhatók (azaz hogy egzisztenciális kijelentéseket fogalmazzunk meg), a fény állandónak és egyszerűen a távoli tárgyak által birtokoltnak tűnik, míg a látszólag esetleges hangot, úgy látszik, valami létrehozza. Mindazonáltal a hang mint melléknév nem csupán a fény halvány utánzata. A hang időszakos érzékelése felerősíti a mozgásról való benyomásunkat, mert együtt jár a hangot hordozó közeg feszültségével és elernyedésével. Az eredmény az, hogy a hang jelenléte egy környezetben vagy a filmen kitágítja térérzékünket, mert folyamatos mozgást jelez valahol középen: a rezgő forrás megrezegtet egy nagy közeget. A filmen természetesen a mozgást a hangszórók okozzák, melyek szó szerint zavart keltenek a mozi háromdimenziós terében. A hang egy bizonyos mozgáseseményre irányítja a figyelmünket, és így a fénynél nagyobb „intimitást” ér el, mivel, úgy tűnik, a nézőt közvetlen kapcsolatba hozza egy közeli eseménnyel a levegő közegén keresztül, amely átjárja a teret, megérintvén mind a nézőt, mind pedig az ábrázolt eseményt.  [14]

Az aurális tárgyak háromdimenziós reprodukciója ellentétben áll a látható tárgyak filmen való, kétdimenziós reprodukciójával. (A vetítő fénye, bár a mozi háromdimenziós terén hatol át, azáltal jelenít meg ebben a térben, hogy csupán egy felületet világít meg – a mozivásznat – anélkül, hogy zavarná a levegő médiumát.) Ezért a hang és a kép összevetésének egy lehetséges kimenetele az, hogy a hangból arra a következtetésre juthatunk, miszerint a kép által reprezentált tér mozgást és hangterjedelmet tartalmaz, melyek közeliek és egyidejűek; vagy másképp fogalmazva, a mozi hangjának tere helyettesítheti a film által jelzett teret.  [15] Ez a kapcsolat csak a hang és a fény közötti alapvető különbségek miatt lehetséges. A megfelelő körülmények között mindkettő a „tér” magasabb szinten keletkező érzékelési kategóriájába olvad.

A filmen a hang és a kép „szinkronizálásának” technikája egy egységes és folyamatos térábrázolást eredményez.  [16]Általánosan tekintve a szinkronizált hang sokkal többet jelent, mint a szó hangjainak és a szereplő ajakmozgásának összehangolását. Sok más fajtája van a látható mozgásnak, melyeket össze lehet kötni hangokkal azért, hogy egy egységesített teret ábrázoljanak: testmozgás (a tánc és a „Mickey Mousing” [a zene és a szereplői mozgás összehangolása- a szerk.]), mozgásban lévő tárgyak, pulzáló fény, kameramozgás és még ennél is absztraktabb, a vágással, a cselekménnyel és a történetmondással kapcsolatos változások (pl. egy ‘drámai akkord’ egy drámai kijelentés kiemelésére).  [17] Ilyen tekintetben az aszinkron hangot egyszerűen úgy értelmezhetjük, mint egy technikai hiba eredményét. Az aszinkron hang azonban összetettebb problémát is jelenthet a nézőnek, ha valós diszkontinuitást jelez az ábrázolt térben – egy másik „jelenetet”, amely még nem látható, talán még nem narrativizált: például amikor a hangot arra használják, hogy összekössön, vagy átfedjen beállításokat vagy jeleneteket; vagy arra, hogy előre jelezzen egy eseményt; vagy hogy lezárjon egy narratívát; vagy arra, hogy diegetikus ill. nem diegetikus metaforaként működjék. Ilyen esetben a hang valamiképpen a fény „előtt” jár, nem a nyomában, hanem valahol máshol: a hang, úgy tűnik, előrejelzi és létrehozza a teret, kérdéseket vetve fel a látott tárgyak hogyanjával és miértjével kapcsolatban. Hogy megértsük azt, hogy a hang hogyan uralhatja a fényt a film megértésében, tüzetesebben át kell gondolnunk a hang, a mozgás és a tér kapcsolatát.

2. A hang az átlagos világban

Fontos kapcsolat van a mozgás és az aurális vagy vizuális tér érzékelt kiterjedése között. A mozgás és a tér különállóak, de nem függetlenek. Azért, hogy „mozgás” létrejöjjön, lennie kell (1) egy helynek és (2) egy másik helynek, amely irányába a mozgás történhet. Hasonlóképpen, ahhoz, hogy „tér” létezzen, lennie kell (1) egy helynek és (2) egy másik helynek, hogy a két hely közötti mozgásnak vagy az ok-okozati interakciónak legalább a lehetősége adott legyen; másképp milyen értelemben létezhetne a második hely kielégítő közelségben az elsőhöz képest ahhoz, hogy hozzákapcsolódhasson egy fogalmi együttesben, amelyet „térnek” nevezünk? „Tér”-érzékelésünk ilyen módon arra alapszik, hogy elképzeljük a lehetséges mozgások legalább egy részét a helyek között a tárgyak egy halmazát tekintve, mely tárgyak közül legfontosabb maga az érzékelő személy. A tér és a mozgás tehát összekapcsolódik egymással, azonban nem egyenlők vagy szimmetrikusak, mivel létezhet két hely valós mozgás nélkül, de semmilyen valós mozgás nem létezhet hely nélkül. Ennek oka az, hogy a köznapi értelemben a mozgást az egyik tulajdonságával azonosítjuk, a sebességgel, ami pedig nem más, mint két hely közötti távolság osztva az idővel. Ilyen értelemben a mozgás nem olyan alapvető, mint a tér, hanem a hely és az idő kapcsolatától függ. Vagy másképp fogalmazva: bár egy megfelelő mozgás a látható távolságot „időtartammá” alakíthatja, a térnek van távolsága, az időnek pedig van tartama mozgás nélkül is.

Az átlagos érzékelésben a tér és az idő különállónak és változatlannak tűnik, ami a mozgást a térhez és az időhöz képest alárendelt helyzetbe taszítja. Amint látni fogjuk, jobb elkerülni a hang abszolút terminusokkal való jellemzését. Produktívabb, ha a hangot egy bizonyos vonatkozási rendszerhez kapcsoljuk, amelyben megismerhető lehet, illetve egy bizonyos kérdéscsoporthoz, amelyet megválaszolni kívánunk. Az általam implicit választott vonatkozási rendszer a hang (és a mozgás) vizsgálatára az emberi érzékelés, a kérdéseim pedig azt boncolgatják, hogy milyen kapcsolat van a mindennapi életben, illetve a moziban történő hangérzékelés között. Feltételezésem szerint az emberi tapasztalat a newtoni mechanika által leírt „átlagos dimenziók világára” korlátozódik, és nem terjed ki az einsteini univerzum nagyléptékű szerkezetére, sem pedig a kvantummechanika mikrovilágára.  [18] Az emberi érzékelés és gondolkodás mechanizmusát visszük át a térbeli, időbeli és ok-okozati átlagos világ kereteire, melyet a szilárd tárgyak uralnak. [19] Egy ilyen világban a hang hátrányos helyzetben van, a két általunk már vizsgált ok miatt: először is, más frekvencián működik, mint a fény (egy tárgy tulajdonságait elszórtabban oldja fel), és másodszor, szorosan kötődik egy elasztikus médium folytonos mozgásához, amit viszont helytől való függőségében érzékelünk (azaz a mozgást úgy értelmezzük, mint szilárd testek helytől helyig történő mozgását egy téren belül). Úgy tűnik, a fény fontosabb a hangnál, mert jobban fel tudja fedni azokat a szilárd tárgyakat, melyek az átlagos világban legfontosabbnak ítélt eseményeket alakítják. A hanggal ellentétben a fény birtokba veszi azon szilárd tárgyak tulajdonságait, melyeket megvilágít (pl. állandóság, különállóság és az energia-megmaradás). Amikor a fényre, mint „szilárd” tárgyra gondolunk (azaz amikor áttetszővé válik), valószínűbb, hogy egy főnév alakjában jelenik meg. A hang ezzel ellentétben tünékenyebbnek és mozgásfüggőbbnek tűnik, ami miatt valószínűbb, hogy igei vagy melléknévi kifejezést kap – mint egy másik tárgy állítmánya vagy jelzője, melynek anyagiságát biztosra vesszük (még ha nem is látjuk). Az a képességünk, hogy halljuk, ahogyan a hangoklétrejönnek, párhuzamosan létezik azzal a képességünkkel, hogy létrehozunk hangokat (melyeket azután hallunk), míg a fényt csak érzékeljük, de nem mi hozzuk létre. A fényességnek, megint úgy tűnik, van egy külön sajátossága, az emberi testen „kívül” és attól függetlenül, míg a hang testünk és mozdulataink részének tetszik. Ily módon, a nyelv, a humán biológia és az átlagos világ fizikája együttesen alkotják a hangérzékelés kezdeti feltételeit: a hangnak távoli, megvilágított tárgyakhoz való viszonyítását. Más szóval, az általunk hallott hangokat a fény tevékenysége által szerzett tudás alapján ítéljük meg.

Ez azonban még kevés a konklúzióhoz. Még mérlegelnünk kell, milyen kapcsolatban lehet a hang az „idővel”. Az idővel kapcsolatos általános hiedelmeink az „időfolyam” alapmetaforájában öltenek testet.  [20]Úgy hisszük, az idő független a tértől: a folyam partján kezdődik és ér véget. Ezen kívül azt képzeljük, hogy az idő folyamatosan és megfordíthatatlanul egy adott irányba folyik. Amint azt Hérakleitosz megjegyezte: „Nem léphetsz kétszer ugyanabba a folyóba, mert mindig más és más víz folyik tovább.”  [21] Nem a „víz” az idő a metaforában, hanem a víz „mozgása”, ahogyan „elhalad”. A mozgás az, ami állandóan új folyót képez. Az időt így anyagtalannak és tünékenynek gondoljuk el, ami mindig elillan, elszökik előlünk, kifogy vagy elfogy. Az idő véges erőforrásnak bizonyul, amely tartósítható, de csak időlegesen. Ennek megfelelően, befektetett, megtakarított, beosztott és birtokolt időről beszélünk, de csak azért, mert az időt el lehet tölteni, el lehet veszíteni, elfecsérelni, elvenni, ellopni vagy kölcsönözni (pl. „Ez a munka több időt vett el, mint amennyim volt rá”).  [22] Mint az energia, az idő is értékesnek tűnik, de láthatatlan és változó, és ezért nehéz megtartani. Nem meglepő ezek után, hogy hajlamosak vagyunk az időt igeként vagy jelzőként tekinteni, vagy egy elkerülhetetlen folyamatként, ami valamire irányul (a testek oszlását idézi elő), vagy valahová tart (minket maga mögött hagyva). Ezért a hang időbeli folyamatként való jellemzése, úgy tűnik, csak megerősíti a hang fényhez viszonyított másodlagosságát. Úgy gondolunk a hangra, mint ami kitölti a fény által meghatározott merev teret, hasonlóan a víz és az általa megtöltött pohár viszonyához. Ismételten, ami múlandónak (és folyékonynak) látszik, az valószínűleg ige vagy melléknév formájában jelenik meg.  [23]

Ezen konklúzió után, már ami a hangnak a fényhez mért kezdeti érzékelését illeti, nézzük most meg, hogy hol húzódnak ennek az érzékelésnek a határai. Amellett fogok érvelni, hogy van egy másik módja is annak, ahogyan az időt általában elgondoljuk az átlagos világban. Amikor úgy képzeljük, hogy az idő másképpen működik, mint mondjuk a folyó, akkor a hangérzékelésünk megváltozik.

3. Az idő két érzékelése és az érzékelés két típusa

Tom Levin szerint a hangnak speciális és egyedülálló kapcsolata van az idővel és a térrel, ami alapvetően különbözik a filmi kép és idő, valamint tér kapcsolatától: „minél szorosabb a szó és a kép viszonya, annál kifejezettebbé válik a köztük lévő ellentét“.  [24] Úgy gondolja, hogy a hangot és a képet összemérhetővé lehet tenni valamely értékskálán, vagy az egyiket a másik fölé lehet emelni, de csak egy ideológiai gyakorlaton belül. Kijelenti például, hogy mivel a hang és a kép alapvetően különbözőek, a kimerevített képnek nincs valódi akusztikai megfelelője.  [25] William Johnson épp az ellenkező végkövetkeztetésre jut. Érvelése szerint csakúgy, mint ahogyan egy és ugyanaz a kép sokszorosan megismételhető egy „kimerevített képben” annak érzékeltetésére, hogy megállt az idő, ugyanígy egyetlen hang is ismételhető azért, hogy megakasszon egy dallamot, és megállítsa az idejét.  [26]Johnson azt kívánja bemutatni, hogy a hang és a kép lényegében egyenlő és ideológiailag semleges; hogy ugyanazoknak az esztétikai technikáknak és manipulációknak vannak alávetve; és hogy bármely egyenlőtlenség vagy dominancia a másik felett indokolatlan előítéletet tár fel – úgymond elméleti süketséget vagy vakságot. Hasonló ehhez Noël Burch kijelentése, miszerint „Úgy tűnik, hogy a hang és a kép kapcsolatának esszenciális természete nem a köztük lévő különbségnek, hanem inkább a köztük fennálló hasonlóságnak köszönhető”.  [27]

Én azonban úgy vélem, hogy mindkét érvelés intuíciói helyesek, mert két különböző kognitív készséget vesznek figyelembe – két különböző típusú érzékelő-tevékenységet. Levin érvelése a hang „közvetlen” érzékelésén alapszik, ahol a hang természeténél fogva az időben létezik; maradandó és van tartama. E szerint a nézet szerint a hang, mint az időfolyam, nem képes megállni, bár új hangok hallhatók, melyek nagyon hasonlóak a régiekhez. Levin nézete, úgy hiszem, egybevág azzal a hangról szóló felfogással, amelyet ezidáig ismertettem; azaz a hang ige- vagy melléknévként történő felfogásával. Ha a hangot kimerevítenénk, semmit sem lehetne hallani. A hangnak mindig valamifelé kell mozognia, vagy valahonnan származnia, egy (állandóbb) tárgyból vagy állapotból. Johnson érvelése másrészről a hang „közvetett” érzékelésére épül, ahol a hangot egy nagyobb kontextusban tekintjük, jelenleg úgy is mondhatjuk, hogy egy „diskurzusban” vagy „narratív” szerkezetben vizsgáljuk.  [28] Johnson számára tehát a nagyon hasonló hangok a megfelelő körülmények között azonosnak tekinthetők, és azt képzelhetjük, hogy az idő lelassult vagy megállt, vagy megfordult és újraindult, vagy nem folytonos. Valóban, megfelelő körülmények között (a megfelelő háttér mellett) elképzelhető, hogy az idő különböző transzformációkon megy át, még bizarr „konfigurációkat” is kirajzolhat. Ez esetben jogos az idő leírására használt tér metafora, mert az idő fogalma kitágult, és egy nagyobb eseménynek vagy mintának a részeként tekintendő. A térmetafora akkor bukkan fel, mikor az időnek olyan viszonylagos aspektusairól beszélünk, mint például az időrend, az ismétlés vagy a szimmetria. Az idő tartamát most egy szilárd tárgy kiterjedéséhez hasonlóan értelmezzük (pl. „Ez egy hosszú nap volt”. „Már nem lesz hosszú ideig közöttünk”), és így fixnek és szilárdnak foghatjuk fel, olyannak, ami nem mozog, de mozgatható, zsugorítható, növelhető, eltolható vagy áthelyezhető; sőt még tökéletesen meg is kettőzhető és ismételhető.  [29] Ebben az új értelemben az idő főnévvel vagy igenévvel leírható szubsztanciává válik. (Jégtáblák úsznak most az „időfolyamon”.) Ha tehát az idő a helyzettől függően különböző módokon tekinthető, vagy különböző variációkban jelenhet meg, beleértve a hosszmértékkel mérhetőt, akkor a hang is elszakadhat melléknévi státuszától, ha közvetetten érzékeljük.  [30]Ahhoz, hogy megvizsgáljuk, mi történhet a hanggal, röviden vázolnunk kell ezt a két általános időérzékelési módot.

A köznyelv „tik-tak” kifejezése hűen tükrözi alapvető időértésünket.  [31] Miért nem azt mondjuk, hogy „tik-tik”? Úgy hiszem, a magánhangzó megváltoztatása a preferált változatban az idő mint tiszta tartam meghatározását szolgálja, ami egy rövid szünet a beszélt időben, melyet a hang kis eltérése jelez. A „tak” tulajdonképpen egy másik „tik”, de kissé áthelyezve. Ezzel ellentétben a „tik-tik” kétértelmű. Jelölhet egy rövid időintervallumot, ha a második „tik” az első „tik” másolatánaktekinthető; másrészről, jelölheti csupán az idő egy pillanatát (egy akusztikus állóképet), ha a második „tik” az elsővel azonosnak értendő, az előző „tik” ismétlésének, ugyanannak a „tik”-nek, amit (valahogyan) újra hallunk.  [32]

A „tak” tehát általában egy másfajta „tik”-ként értendő, egy második esetként, egy másolatként. A magánhangzó megváltozása pont elégséges ahhoz, hogy megőrizzük a megkülönböztetést két egyenlő entitás között, és így mérhessük a közöttük lévő intervallumot vagy tartamot. Másrészről egy második „tik” talán nem egy új és különálló „tik”. Talán felfogható úgy, mint csupán egy korábbi „tik” újabb megjelenése (azaz ahol csak egy „tik” van és csak egy időpillanat, nem számít, hányszor halljuk); ilyen esetben azonban egy új referenciakeretet kell elképzelnünk egy olyan időhöz, ami alapvetőbb tartamból származik, amelyben végül is két nagyon hasonló szó hangzott el (és hallatszott) más és más időpontban. A „tikek” identitását (az új, magasabb szinten) azon az áron szereztük, hogy máshol eltekintettünk a különbségtől és a különállástól. A tartamtól való „távolság”, amelyet azáltal értünk el, hogy a tartamot térbelivé tettük (és megállítottuk), lehetővé teszi, hogy az időt új értelemben említsük, azaz a tapasztalásnak egy magasabb szinten történő, nagyobb volumenű elemzésén belül tekintsük. Olyan ez, mintha valaki úgy határozna, hogy olyan távolságból néz két jelet egy lapon, hogy azok egy jelnek látsszanak, csak azért, hogy egy új nézőpontot nyerjen a környezetről. Nincs ebben az identitással és különbséggel mért hasonlóságokkal való játékban természetesen semmi szabálytalan, mivel ilyen játék áll a nyelv, a klasszifikáció és a megértés középpontjában is. Egy újonnan létrehozott (magasabb szintű) időkeret hasznosságát vizsgáló tesztmértéket – amely teszt egy pillanatra hatályon kívül helyez más kereteket – más alapokon kell keresnünk. Az egyetlen megállapítás, amit itt most tenni kívánok az, hogy a „tik-tak” jobban megjeleníti alapvető időértésünket (az átlagos világban) mint egy intervallum alatt végbemenő változást – mint mozgást, tartamot, időfolyamot -, mivel kevésbé kétértelmű, mint a „tik-tik”, amely ugyanúgy jelenthet egy intervallumot, mint egy pillanatot, sőt, azt is sugallhatja, hogy az idő visszafordítható, alakítható vagy irány nélküli. (A „tik-tik” szimmetrikus.)

Mivel egy megfelelő átértelmezés az időt bármely kívánt formára hajlíthatja, és még egyenlővé is teheti egy megfelelően újraértelmezett „térrel”, William Johnson úgy gondolja, hogy a hang lényegében szükségszerűen egyenértékű a képpel. Valójában Johnson azért mutat rá a hangnak erre a lehetőségére, hogy kijelentse, a hang szabad és független változó. Pontosabb lenne azonban azt mondani, hogy a hang elnyerheti az egyenlőségét egy bizonyos érzékelő tevékenységben, melyben megismerhetővé válik, és egy bizonyos kérdéscsoporttal kapcsolatban, amelyre választ keresünk. A hang (és az idő) akkor válik egyenrangúvá, mikor közvetetten érzékeljük („tik-tik”), egy olyan kontextushoz kötötten, amely tágabb, mint a tárgyak azonosítása illetve térbeli helymeghatározása. Az alapvető probléma nem az, hogy mi a hang, kontextustól függetlenül, hanem hogy hogyan válik hasznossá számunkra valamely érzékeléstípuson keresztül, illetve bizonyos célokkal való kapcsolatban.
Úgy vélem, Levin és Johnson megközelítései kapcsolatba hozhatók két nagyvonalakban tekintett hang- (és fény-)érzékelési móddal a filmen. Bizonyos érzékelési folyamatok a hangszórók adatait (és a vásznon megjelenő adatokat) dolgozzák fel elsősorban direkt, „lentről fölfelé” ható módon úgy, hogy az adatokat nagyon rövid időperiódusokban (kevés emlékezettársítással vagy anélkül) vizsgálják meg, és automatikusan olyan tulajdonságokká alakítják, mint a hangmagasság, a hangerő, élesség, mélység, mozgás, méret, alak, szín, minőség stb.  [33] A lentről felfelé haladó érzékelés időszakos és „adat-alapú”, és csak „rövid távú” hatása van. Ez az a perceptuális kontextus, amelyben Levin értékeli a hangot. Más érzékelési folyamatok azonban, melyek a szerzett tudáson, a memórián és sémákon (képeken, forgatókönyveken) alapulnak, nem függnek az ingerület idejétől, és elsősorban „felülről lefelé” dolgozzák át az adatokat, a néző elvárásait és céljait véve az elrendezés alapjául. A nézőnek e céljai jelentősen szélesebb skálán mozoghatnak, mint az olyan egzisztenciális kérdések megválaszolása, hogy mik a dolgok és hol vannak. Például egy kiemelt fontosságú fentről lefelé irányuló adatrendszerezési cél a filmben a „narratív” vagy történetbeli világ létrehozása; más célok összefüggésbe hozhatók érvelési módokkal, a képzelettel, a vággyal, szándékkal, várakozással, felidézéssel, feltételezéssel, kereséssel, illetve a jövő megjósolhatóvá/megjósolhatatlanná tételével.  [34] A fentről lefelé haladó folyamatoknak flexibilisnek és általánosnak kell lenniük ahhoz, hogy hatékonyan működhessenek egy sor szituációban, s eközben lehetővé tehessenek egyes esetek között fellépő (megjósolhatatlan) variációkat. A fentről lefelé haladó folyamatok „közvetettek” abban az értelemben, hogy különböző módokon átcsoportosíthatják az adatokat függetlenül az adatok kezdeti megjelenését szabályzó ingerületi viszonyoktól (pl. időtartam). A fentről lefelé haladó folyamatok gyakran induktív mintaként kezelik az adatokat, melyeket egy sor párhuzamos referenciarendszerbe vetítenek, és ott kipróbálnak, míg a lentről fölfelé lezajló folyamatok sorozatosak, nagymértékben specializáltak és atomisztikusak (pl. mozgásérzékelés). A fentről lefelé való érzékelés Johnson hangértékelésének a háttere.

A probléma az, hogy nem létezik a szükséges és elégséges feltételeknek egy olyan általános csoportja, mely meghatározná a lentről fölfelé tartó folyamatok eredményeinek megítélését és értelmezését. A perceptuális illúziók és állandóságok azt mutatják, hogy könnyen láthatunk olyasmit, ami nincs jelen, vagy nem látjuk azt, ami jelen van az adatfeldolgozás adott módozataira vonatkozó kritériumok szerint. A mozivásznon való „egymás mellé helyezés” ténye például nem hordoz szükséges implikációkat az időrenddel, az ok-okozati kapcsolattal vagy a történet világán belüli térbeli viszonyokkal kapcsolatban. Hasonlóképpen, a folyamatos vagy a megszakított vászonidő-érzékelés egyaránt vezethet folyamatos vagy megszakított történetidő megítéléséhez. Mégugyanannak a beállításnak az ismétlése sem szükségszerűen azt jelzi, hogy a történetben ugyanaz az idő újrajátszódik. Ennek oka az, hogy a film képes összetettebb eseményeket ábrázolni azoknál, mint amelyek csak a kamera (vagy a mikrofon) előtt játszódnak, és/vagy amik csak egyszer történnek meg. Ezek a példák annak illusztrálására szolgálnak, hogy bizonyosságot nem lehet a mozivásznon lévő adatok szigorú empirikus (lentről felfelé való) tesztelésével elérni, mivel bármely időbeli, ok-okozati vagy térbeli konfiguráció jelenthet bármely más konfigurációt vagy utalhat rá, a megfelelő körülmények között. Ezért olyan esetekben, ahol a tudást mérjük és értékeljük, és használjuk előrejelzések céljából, a hang az egyenlőség felé halad. A hang akkor válik a fénnyel egyenlővé, amikor a tudás egy formájaként tekintjük, ahelyett, hogy a való világ állapotaként kezelnénk, mivel, ahogyan azt Nelson Goodman mondaná, ha létezik világ, akkor sok van, és így ha létezik hang, akkor abból is sok van.

Mivel a fentről lefelé tartó folyamatok aktivizálódnak a film nézése közben, a néző nincs kötve a film vászon- vagy vetítési idejéhez, azaz a vásznon megjelenő kép szoros értelemben vett tartamához („tik-tak”). Ehelyett a néző képes előre és hátrafelé mozogni a vászon adatai között, hogy kísérletezhessen egy egész sor szintaktikai, szemantikai és referenciális hipotézissel, azaz hogy eltöröljön különbségeket („tik-tak”) annak érdekében, hogy új referenciális kereteket alkalmazzon, melyek új hasonlóságokat hoznak létre („tik-tik”) a film folyamán és azon túl. Az adatrendszerezés különböző módszereivel való kísérletezés által a néző olyan időbeli élményeket teremt, melyek nem közvetlenül a vászonidőből következnek. Ez azt sugallja, hogy a hang léte sem arra a lentről felfelé történő érzékelésre korlátozódik, mely a hangszórók rezonanciáján alapul. Ha ez igaz, akkor eszerint nincs egyértelmű válasz arra a kérdésre, hogy hova helyezzük a mikrofont a kamerához képest úgy, hogy a legjobb felvételt készíthessük egy tárgy audio és vizuális tulajdonságairól – hogy az a helyzetrealitását kiemelje -, mivel a hang nem létezik percepuális kontextuson, célon, használaton kívül. [35]

Úgy tűnhet, hogy a fentről lefelé és a lentről felfelé haladó folyamatok egész sora működik minden pillanatban egy sor különböző reprezentációt létrehozva, amelyek között a kompatibilitás és a bizonyosság mértéke változó. Így a megértést egészében véve talán olyan rendszerként lehet elképzelni, amely hiányos, kétértelmű, megtévesztő és sokszor egymásnak ellentmondó adatértelmezésnek a kézben tartására irányul. Az érzékelőnek aktívan kell kutatnia, összevetnie, tesztelnie, megkülönböztetnie, emlékeznie és gondolkodnia sok területen és képzelt kontextuson belül. Ellentmondások merülnek fel a fentről lefelé való és a lentről felfelé történő adatfeldolgozás között, a történet és a mozivászon között, a szereplők fikcionális világa (a „diegézis”) és aközött, ami azon kívülinek tűnik. Más szóval, az emberi megértés nem úgy működik, hogy progresszíven finomítja az érzékelési adatokat alacsonyabbtól magasabb fokozatokon át egyetlen gondolat kiválasztásáig, és annak az egységes Én által történő megragadásáig. Inkább arról van szó, hogy az emberi elme moduláris szerkezetűnek látszik, amelynek modulusai párhuzamosan működnek, gyakran túlspecializáltak az egymással való „kommunikációhoz” (vagy még ahhoz is, hogy „szavakat” használjanak), illetve egymást keresztező végtermékeket hoznak létre, melyek legalább annyira szemben állnak egymással, mint amennyire összetartoznak.  [36] Az érzékelés egy ingadozó, instabil egyensúlyi állapothoz hasonlít. A filmnézést így inkább úgy lehetne jellemezni, mintha több filmet néznénk egyszerre; és egy hang meghallását úgy, mintha egyszerre több hangot hallanánk. Nincs olyan tökéletes hang- vagy időfogalom, ami minden körülmények közt megállja a helyét.

4. A hang mint információ

Könnyű szem elől téveszteni a hang nem tudatos, „lentről felfelé” aspektusát, és elragadtatni magunkat a „fentről lefelé” történő érzékelés által, ami látszólag közelebb áll a tudatos cselekedeteinkhez és terveinkhez. William Johnson arra törekszik, hogy egy közös kontextust találjon a hang értékelésére azáltal, hogy a minimumra csökkenti a hang „lentről felfelé” ható tulajdonságait. Azt kívánja bebizonyítani, hogy a hang „a képpel egyenértékű ontológiai státuszt” birtokol, és így a képpel egyenlő esztétikai megítélést érdemel a filmben és a filmelemzéshez használatos terminológiában.  [37] Az esztétikai egyenlőséget Johnson az ontológiai sajátosságra és egyenlőségre alapozza.  [38] A hang episztemológiai kérdését azonban nem lehet ilyen egyszerűen elintézni. Milyen (fentről lefelé történő?) érzékelési kontextusban vizsgáljuk a hangot?

Johnson elismeri, hogy „az egyetlen fontos különbség a hang és a kép között pszichológiai eredetükből adódik”, és a fent említett ellentétre mutat, ahol a hang úgy tűnik, közvetlenül a forrásától érkezik hozzánk, míg a fény visszaverődik, és inkább különböző visszavert felületeket látszik megjeleníteni, mint a saját forrását.  [39] De azután Johnson a következőképpen zárja a gondolatsort:

“A hang hajlik arra, hogy aktív események sorozataként jelenjen meg, melyet átélünk, míg a kép inkább egy statikus megjelenési forma melyet olvasunk. Ez a különbségtétel megengedi a két csatornának, hogy kiegészítsék egymást, és hogy nagy mennyiségű információt hordozzanak általában kölcsönös interferencia nélkül.”  [40]

Valamiféle bűvészmutatvány tanúi vagyunk itt. Miért tartja Johnson a képet inkább esszenciálisan „statikusnak”, mint mozgónak, és miért kapcsolja inkább az „olvasáshoz”, mint az „átéléshez”? Az ember azt gondolná, hogy egy párbeszéd meghallgatása közelebb áll az olvasáshoz, mint a színek nézésének aktusa. Johnson látszólag felkarolja az „időfolyam” metaforát („aktív események sorozata”), de mivel óvatosan fogalmazza meg az érvelését (pl. „a hang lehet ez vagy az…”), kétségeink maradnak Johnson ontológiai következtetéseinek erejét illetően.

Ennél is fontosabb, hogy Johnson érvelése a hang és a kép közötti episztemológiai különbség elismerésére irányul (abban a kontextusban, amit én „lentről felfelé” tartó folyamatként azonosítottam), de csak azért, hogy feloldhassa ezt a különbséget egy közös nevező által, amelyet ő „információnak” nevez. Johnson szerint, amikor a hang és a fény „információ-csatornaként” szerepel, akkor valahogyan (általában) egymás tökéletes kiegészítőjeként működnek, elsimítván (fizikai?) különbségeiket. „Természetesen el lehet érni, hogy keresztezzék egymást” mondja, de ez feltehetően csupán alapvető ontológiai egyenrangúságukat bizonyítja.  [41] Johnson elemzése arra szolgál, hogy megmutassa, a hang csak két alapvető módon kapcsolódhat a képhez: az általa közvetített információ megerősítheti a kép által hordozott információt, vagy pedig szembeállítható azzal.  [42] Johnson az elemzés ilyen mérvű egyszerűségét azáltal éri el, hogy azt tartja, a hang és a kép tökéletesen különböző, és mégis egyenlő mértékben képesek azonos mennyiségű és azonos fajta „információ” szállítására. Az információegységek szemben állhatnak egymással, de a hang és a fény között nincs lényegi ellentét. Johnson így a „vezeték-metafora” mellett tesz hitet, amely szerint a nyelv (vagy a film-„élmény” vagy bármi, ami jelent valamit) „kommunikáció” („csatornák …szállítanak …adagokat …[kevés zajjal]”).  [43] Ez a feltevés lehetővé teszi, hogy a képaláírás vagy egy párbeszéd kimondott mondata (azaz koncentrált információ) mindenféle hang prototípusává váljék, míg a kép fénykijelzés, melynek a történet viszonylatairól „kommunikált” absztrakt (kevésbé közvetlen, elvontabb) információit meg kell fejteni.

Természetesen valamilyen általános szinten ezek a feltételezések igazak. Például, ha az az információ, amire egy film kapcsán szükségünk van, arra vonatkozik, hogy Kristin hazaért-e vagy sem, akkor egy olyan beállítás, amelyben halljuk, amint Kristin bejelenti érkezését a vásznon kívülről, egyenértékű egy olyan beállítással, mely Kristint mutatja, amint nyitja az ajtót. Másrészről az elemzésbizonyos szintjén egyértelműen léteznek különbségek az eseménynek e kétféle bemutatása között, gondolok itt különösen a kétféle megjelenítésből adódó lehetséges következtetések közötti különbségekre. Valóban, Johnson számára vajon miért nem lehet adott esetben a hang mégfontosabb, mint a kép? Ha az „információ” nehezen meghatározható fogalmát járjuk körbe, közelebb kerülünk egy csalóka egyenlőséghez is, ahhoz, ami a művészetet valakinek a nézővel való (intencionális) „kommunikációjával” hozza kapcsolatba. A feladó és a vevő közötti kommunikáció helyett jobb lenne arra rákérdezni, hogy milyen referencia módozatok és eszközök, illetve kapcsolódó mentális cselekvések játszanak szerepet abban, ahogyan egy néző felfog egy bemutatott eseményt. [44] Az olyan koncepciók használata, mint az információ és a „jelentés”, csak elodázzák az aurális és vizuális tárgyak érzékelését illető nehéz kérdéseket, amellett hogy redukálják a referenciális kapcsolatok összetettségét, melyeket egy adott filmszöveg kapcsán érzékelhetünk.

5. A hang episztemológiai határokon belül

Ahhoz, hogy a fentről lefelé történő adatfeldolgozás sikeresen előtérbe helyezze a hangot, és megbonyolítsa a hangnak a film látható terével való kapcsolatát, az szükséges, hogy mindez a szöveg érzékelésében létrehozott episztemológiai határok összjátékán át érvényesüljön, vagyis a különböző narrációs szinteken át, melyeket egy néző lát bele a narratívába.  [45] Valójában a narráció minden szintje új kontextust teremt, melyben a hang (és a hangnak az idővel, valamint a mozgással való kapcsolata) újraértékelődik egy átfogó stratégia szerint, amely a „történet világában” hivatott egy „jelenet” jelentőségét szembetűnővé tenni, valamint egy helyi stratégia szerint is, mely a cselekedetek és események megértésére vonatkozik. A szintek fogalma itt arra a feltevésre alapul, hogy a narratív fikció tipikusan elkülönülő és néha egymással versengő útvonalak sokaságával dolgozik, melyek által a néző megfejtheti a szöveg jelentését. Ha azt is feltesszük, hogy a narráció szintjei egyidőben működnek (még ha nem is dramatizáltan), akkor a hang és a kép igazán sosem áll egyedül, csak különböző értelmező stratégiák metszéspontjain, melyek a szövegben ismeretek után kutatnak, úgy, hogy a szövegnek sokféle, és gyakran inkompatibilis leírását hozzák létre.

A narráció különböző szintjeiről származó hang és a kép társításával például bonyolíthatjuk, és elodázhatjuk a hangnak egy forráshoz való hozzárendelését, amelyet láthatóvá kell tenni. Ilyen módon egy új tárgyat nevezhetünk ki hangforrásnak, vagy egy régi forrást lehet új tárgyként megjelölni. A referencia ezen flexibilitásának az oka az, hogy egy adott aurális narráció tanúskodhat, mondjuk az őt kísérő vizuális narrációtól eltérő nagyságú tudástartományról, kommunikativitásról vagy tudatosságról.  [46] Íme néhány példa: egy hang, amely előrejelez vagy kommentál egy diegetikus eseményt a képen; egy szubjektív hang egy objektív képpel; egy diegetikus hang egy nem diegetikus képpel; egy hang, amely nem szimultán a képpel; egy hang, amely ugyanazon esemény többszöri és különböző felvételeiből van megkomponálva, illetve közöttük váltakozik; egy hang, amelyanalóg azzal a hanggal, amit képzeletünk szerint egy tárgy létrehozhatna, ha hallható lenne; egy metaforikus hang (pl. egy eltörő tányér képe, amit ötven eltörő tányér hangja vagy cintányérok hangja vagy egy nő sikolya, vagy egy nő nevetése vagy némasága kísér; vagy egy állat rágcsálásának a hangja, vö. katakrézis, neologizmus); egy metaforikus hang, ami utólag válik szó szerintivé, egy hang ritmusokkal vagy asszociációkkal vagy más olyan jellegzetességgel, melyek túlmennek egy specifikus tárgyon, úgy, hogy szelektíve másféle tárgyakra vonatkozzanak, még a film elvont, retorikai eszközeire is; és végül, egy hangminta [sound gestalt], amely felismerhetetlen (vö. egy Rorschach tintafolt).  [47] Más szóval, a hang, olyan módon is utalhat egy tárgyra (több tárgyra, egy fajta tárgyra, több fajta tárgyra, nem tapintható tárgyra, asszociált tárgyra, ismeretlen dologra) ami nem, vagy nem csupán attól függ, hogy milyen specifikus identitást, helyet és láthatóságot tulajdonít egy hangforrásnak.

Ebben a tekintetben a hangnak nincs abszolút tulajdonsága; csupán a tudás egy (globális, lokális) fajtája szerint tekintjük. A hang így hallható egy kiejtett szó részeként, egy tárgy hangjaként (pl. egy kerék forgása vagy a szél zúgása) vagy zeneként (pl. egy kitartott magas hang egy operaáriából) vagy egy sajátos „siránkozó” hangként, tárgyhoz való kötöttség nélkül (azaz „tiszta” vagy „szabad” hangként), vagy egyáltalán nem hallható, mikor várnánk. Az azonban, hogy egy hangot teljesen kapcsolatok nélküli szabad zajként halljunk – érzékelési adatként, mely egyenértékű bármely más adattal – általában nagy erőfeszítést igényel, mert a lentről felfelé tartó folyamat szorosan illeszkedik [48] az átlagos világ fizikájához, ami a hangot átmenetinek és múlandónak fogja föl, úgy, mint valamit, ami létrejön, de semminek nem sajátja, mint ami egy (vibráló) materiális tárgyhoz vagy egy beszélőhöz kötődik, amit vagy akit a fény állandó tárgyként vagy testként tesz láthatóvá.  [49] Furcsamód egy hang egyszerű zajként való érzékelése, fentről lefelé módszert követel meg – tudatos erőfeszítést, hogy lebontsuk a hangot nem referenciális zajjá (pl. a hang komponenseinek megfordításával vagy a hang azonosképpen való megismétlésével, mint az anaforában; vö. tik-tik). [50] Ebben az összefüggésben a kapcsolat nélküli zaj olyan, mint a fény, ami a mozivászonról tükröződik, amit ritkán vizsgálunk a reflektív képernyő tulajdonságainak feltérképezése érdekében, hanem inkább azt képzeljük, hogy a vásznon lévő sugárzó kétdimenziós formák egy új térbe (és időbe) helyeződtek át, ahol egy átlagos világ ismert, háromdimenziós tárgyaivá válnak, melyek új fényt vernek vissza, és új hangokat képeznek.

A hang és a megvilágított tárgy szétválasztásának perceptuális nehézségét sugallja az a tény, hogy elenyészően ritka, hogy egy film nézője a hangot nem diegetikusként értelmezi, azaz úgy, mint ami olyan (általában nem látható) tárgyaktól érkezik, amelyek nem csak a vásznon kívül, hanem a történet világán kívül helyezkednek el. A nem diegetikus hang ritkasága a filmen (a nem diegetikus zene elterjedtségével szemben) a lentről felfelé történő működés által létrehozott vizuális térrel és látható tárgyakkal kapcsolatos erőteljes elvárásokról tanúskodik. Ezzel ellentétben a zene és a szavak olyan hangok, melyek, mint egy „narratív” szöveg felépítése, már jelentős mértékben be vannak vonva a fentről lefelé tartó működésbe, és így könnyedén alkalmazkodnak az episztemológiai határok sokféle formájához, melyek a szöveg olvasása közben létrejöhetnek.  [51]

6. A hang (különböző) leírásai

A hang megértésekor a befogadó használatba vesz egy bizonyos hangot. A hangra nagy vonalakban úgy gondolunk, mint ami melléknévként vagy főnévként működik, tik-tak vagy tik-tik. A hangot ezen kívül egy specifikus kontextus vagy a film esetében egy specifikus narrációs szint viszonylatában tekintjük. Röviden a hangnak a befogadóval való potenciális interakcióit különböző módokon fejezzük ki és írjuk le. Mit értünk itt „leírás” alatt? Ennek a kérdésnek a megválaszolása közben azt találjuk, hogy többféleképpen lehet egy bizonyos hangot „sajátosnak” nevezni.

Keith Donnellan szerint a meghatározó leírásnak két különböző használata van a beszélt nyelvben. [52] Úgy hiszem, ez a két használat segít megmagyarázni, hogy a befogadó milyen módokon értelmezheti a hangot, ahelyett, hogy csak egy, a hangról szóló mondatot értelmezne. (Feltételezem, hogy a szavak, képek és a hangok mind használhatók leíró formában, és hogy az észleleteket olyan sémák értékelik, melyeknek funkciója az, hogy megjelenítsék és rendszerezzék a tudásunkat, legyen az mentálisan szavakba vagy akár másba ágyazva.) Egy meghatározott leírás „attributív használatában” a leírás esszenciális, mivel valamit olyan módon állítunk, hogy az a leírásnak megfelelő bármely tárgyra (annak tulajdonságaira) igaz. Ezzel szemben egy meghatározott leírás „referenciális használatában” a leírást arra használjuk csupán, hogy fölhívjuk a figyelmet, vagy emlékeztessünk arra a bizonyos tárgyra, amelyről valamit állítunk. A referenciális használatban a leírásnak nem kell pontosnak lennie (még az sem fontos, hogy a hallgató vagy a beszélő pontosnak gondolja), sőt a szóbeli leírás helyett használhattunk volna más eszközöket (pl. egy nevet vagy egy mutató mozdulatot), csak az számít, hogy azok a megfelelő tárgyat juttassák az eszünkbe.

Vegyük például a következő mondatot: „A madár a fán énekel.”, vagy, hasonlóképpen, gondoljunk egyszerűen csak egy hangra, amit egy befogadó hall a mondatban leírt körülmények között. Amikor „a madár a fán” leíró kifejezést attributívan értelmezzük, a kifejezés logikailag magában hordozza (vagy legalább is azzal az előfeltevéssel jár), hogy van egy, és csakis egy madár, amelyik a fán van, amelyik a kijelentés alanya, mert ha a kifejezés nem egy fajta madárra utal (pl. nincs olyan madár, vagy két olyan madár van, amelyekre illik a leírás), vagy ha az említett madár nem jellemezhető úgy, mint ami éppen most énekel, akkor a mondatban kifejezett propozíció hamis (vagy másképpen, ha a dolgok azon állása, melyet valósnak hittünk, amikor a hang hallható volt, ezen körülmények között mégsem létezik). Az attributív használatnak ez az elemzése Bertrand Russell nyelvelméletéből származik.

Másrészről, amikor „a madár a fán” kifejezést referenciálisan értelmezzük, csak azért használjuk, hogy kiemeljünk egy bizonyos dolgot egy bizonyos szituációban, hogy egy bizonyos tárgyra utaljunk (nem pedig megjelöljük azt). A referenciális használatnak ez az elemzése Peter Strawson művén alapszik. Amikor egy leírást referenciálisan használunk, egy bizonyos dolgot külön kiválasztunk, míg az attributív használatnál kevésbé specifikus előfeltevéssel van dolgunk, ami csak azt igényli, hogy legyen egy s más dolog, amire (tökéletesen) illik a kijelentés; azaz a leírás két használata a „különlegesség” különböző fokaival áll összefüggésben. Ezért egy referenciális használat sikeres lehet (pl. észrevesszük a szóban forgó madarat), még akkor is, ha számos madár énekel, és, még ha az a madár, amelyik a leírásban szerepel, nem is énekel: például, ha egy másik madár énekel egy közeli bokorban, vagy egy teljesen más dolog adhatja ki az éneklő hangot (egy rovar, egy fiú egy madárfüttyöt utánzó síppal, a szél zúgása). Ezen kívül az utalás sikeres lehet (és ráadásul, valami igazságot is kimondhatunk), még akkor is, ha a leírás egyébként téves vagy metaforikus vagy ironikus (pl. a szélben mozgó gallyat véljük madárnak, vagy egy csacsogó mókust hiszünk egy fajta madárnak, vagy a szóban forgó éneklő madár egy bokorban és nem egy fán van; vagy a tárgy a fán egy szobor vagy jelmezes ember; vagy ironikusan: nem lehet madárdalt hallani, mert a fát és a bokrot kivágták). A referenciális használatban nem követelmény, hogy a hallgató egyetértsen a beszélő leírásával azért, hogy egyetértsen annak „igazságával”, ami elhangzott. A példáimat úgy alakítottam, hogy azt sugallják, a nyelv referenciális használatában (vagy az észleletről való referenciális gondolkodásban) valami másról, és nem a szó szerinti (denotált) tárgyról van szó. Az utalás összetettebb és közvetettebb, mint a denotáció, mert az utalás aktusa különböző fajta „hibákat” és „fikciókat” tartalmazhat, és pontos retorikai játékot kategóriákkal, míg egy tárgynak és tulajdonságainak denotálása a közvetlen empirikus igazsággal van kapcsolatban. Csupán ahol nincs semmi, amire utalni lehet, ott válik szükségszerűen sikertelenné az utalás aktusa (pl. ahol a hang, ami feltehetőleg a fa irányából jön, csak az észlelő fülének csengése).

Donnellan hangsúlyozza, hogy az attributív és a referenciális használat megkülönböztetése az észlelő egy pragmatikus szituációról való értékelésén alapul, nem egy adott mondat szintaktikai vagy szemantikai sajátosságain, sem pedig formális kétértelműségeken. Azt mondanám, hogy sem egy mondat, sem egy észlelet önmagában nem mutatja meg, hogy miképpen kellene értelmezni. Ehelyett egy bizonyos adat nyer funkciót a befogadóhoz fűződő, bizonyos körülmények között létező viszonyának a leírása és újbóli leírása által.

Ahhoz, hogy lehetővé váljon a filmi hang elemzése, én átkeresztelem Donnellan két kategóriáját a következőképpen:

1. Egzisztenciális referencia. Ez nagyon közel áll ahhoz, ami Donnellannél egy meghatározott igei leírás „attributív használataként” jelenik meg. Az egzisztenciális referencia kapcsolódik ahhoz az érvelésemhez, hogy a hang melléknév, amikor elsősorban lentről felfelé módon hallható, és az „időfolyam” metaforához kötődik („tik-tak”). Azért nevezem ezt egzisztenciális referenciának, mert az észlelő céljai a hallgatás során szorosan a leírt fizikális tárgy azonosításához és (a tárgy jelzőinek és cselekedeteinek) helyzetéhez kapcsolódnak.

2. Nominális referencia. Ez ahhoz áll közel, ami Donnellannál egy meghatározott igei leírás „referenciális használataként” szerepel. A nominális referencia ahhoz az érvelésemhez kapcsolódik, miszerint a hang főnév, amikor elsősorban felülről lefelé módon hallható, és az időfolyamon úszó „jégtáblákhoz” kötődik („tik-tik”). Azért nevezem ezt „nominális” referenciának, mert a hallgató céljai a hallgatásban csak ahhoz a névhez kapcsolódnak szorosan, amit arra használunk, hogy a leírt tárgyra utaljunk vagy a tárgy egy nevéhez vagy javasolt nevéhez (azaz a tárgyat valahogy nevezzük, vagy felidézzük a leírás által, vagy halljuk egy leíró sémában). A referenciának ebben a típusában a hang főnévszerűvé válik, és kategorikus fogalommá alakul, hogy aztán mentálisan manipulálhassuk és transzformálhassuk (sémák segítségével) olyan célok elérése érdekében, melyek nem a leírt tárgy határozott jellemzőinek egzisztenciális azonosítását szolgálják.  [53] A nominális referencia így összegyűjtheti egy tárgy szokatlan vagy nem tapintható jellegzetességeit; vagy egy másik tárgy felé terelhet bennünket, amelyik osztozik vele néhány (szó szerinti vagy figuratív) minőségen; vagy egy másik tárgyra emlékeztet bennünket egy logikai kapcsolaton (pl. ellentmondás) vagy valamilyen asszociációs láncon keresztül.

A teoretikusok szerint a film olyan alapelemekből áll, mint a hang, a mozgás, a ritmus, a vágás, a kamera, a fényképezés, a beállítások, a képek, a fényesség/sötétség, a feliratok, az idő, a tér, az ok-okozatiság. Azonban a hang episztemológiai összetettsége (az idő két érzékelése, az érzékelés két fajtája, a leírás kétféle használata, kétféle referencia) megkérdőjelez minden olyan kísérletet, mely arra irányul, hogy a hangot önmagában, mint a film egy alapegységét vagy „dimenzióját” tekintse; és egyáltalán, minden olyan próbálkozást, amely más úgynevezett alapelem felfedezésére irányul, és melynek célja a filmélmény egy általános definíciója.  [54]

Melyik leírás szerint illik ide a hang? Az idő (a ritmus, a vágás, a tér, a kép…) mely leírás szerint érvényes? Vajon a „felirat” alapvetően aurális vagy vizuális, vagy valami új? Vajon az „éneklő hang” alapvetően zene, beszéd vagy zaj? Egy hangot egzisztenciálisan vagy nominálisan hallunk? Ami még fontosabb: mennyi ideig halható egy hang inkább az egyik, mint a másik módon: például mikor célravezető egy hangot egy bizonyos narratív, narraciós vagy fiktív leírások részeként hallani, és mikor kell ezeket a leírásokat megváltoztatni úgy, hogy a hang számunkra érdekes, új kontextusban nyerjen jelentést, miközben a szöveget befogadjuk, vagy utána, mialatt a befogadás során gyűjtött tapasztalatainkat gondoljuk át? És így tovább.

Nem létezik egy üdvözítő episztemológiai átjáró a film alapvető természetéhez; és nem spórolunk időt azzal sem, ha nem keressük ezt az utat. Nem tetszőleges módokon halljuk a világot, még akkor sem, ha többféleképpen hallhatjuk, vagy ha választhatunk egymásnak ellentmondó módokat. Az érzékelésünk legalább olyan erősen kötődik az átlagos világ fizikájához, mint amennyire a történetekhez, forgatókönyvekhez, tervekhez, célokhoz és az átlagos világban folytatott cselekvésekhez. A hang egyetlen értelmezése sem fedi le az összes körülményt. Ehelyett csupán értelmezések vannak, melyek többé-kevésbé valószínűek, melyek többé-kevésbé illenek az átlagos világban kitűzött célhoz. Egy bizonyos hang csak egy vagy több leírás szerint létezik; azaz több módon is sajátos lehet. Amint azt már korábban tárgyaltuk, a hang lényegében alárendelt / kiegészítő lehet a fényhez képest („tik-tak”), amikor az észlelésben találkozik a nézőnek azzal a törekvésével, hogy azonosítsa és elhelyezze a filmen ábrázolt fizikai tárgyakat. Vagy a hang lehet lényegében domináns / egyenrangú a fényhez képest („tik-tik”), például ha felülről lefelé haladó módszer segítségével úgy jellemezzük, mint ami független, kétértelmű vagy félrevezető; vagy mikor úgy írjuk le, mint ami a fénnyel ellentétes, egybeolvad vagy párhuzamos vele. A hang filmen való megjelenésének elemzésekor ezért gondosan meg kell határoznunk az érzékelési folyamatokat és a leírásokat, melyeket annak kontextusaként tartunk számon, amire később úgy emlékezünk, hogy hallottuk.

 

Fordította: Kocsis Katalin

A fordítást ellenőrizte: Szalóky Melinda

A fordítás alapjául szolgáló kiadás: Edward Branigan: Sound, Epistemology, Film. In Richard Allen és Murray Smith (szerk.): Film Theory and Philosophy. Oxford University Press, 1997. 95-125.

A fordítást Edward Branigan engedélyével közöljük.

Jegyzetek

 1. [1] Ezen érveléseknek egy korai változatát a Society for Cinema Studies konferencián terjesztettem elő 1987 májusában, és Sound and Epistemology in Film címen jelent meg a Journal of Aesthetics and Criticism című lapban, 47:4 (ősz, 1989), 311-24. Szeretnék köszönetet mondani David Alan Blacknek, David Bordwellnek és Charles Wolfe-nak az 1989-es cikkhez fűzött értékes megjegyzéseikért. Az 1989-es cikk cseh nyelvre lefordított, Zvuk A Epistemologie Ve Filmu című változata néhány javítással és kisebb változtatásokkal újra meg fog jelenni az Illuminance-ben. A fordításban Zdeněk Böhm, Michal Bregant, Nataša Ďurovičová és Ivan Záček működtek közre. A jelen esszé a fenti érveléseknek kibővített és alaposan átírt változata. A hangnak ez az újragondolása nem jöhetett volna létre Richard Allen, Arnt Maasø, Murray Smith és Melinda Szalóky bátorítása és fontos kommentárjai nélkül
 2. [2] Annak az érvnek, hogy „a film vizuális médium”, tulajdonképpen két nézőpontja van. Az első szerint a film alapja a fényképészet és/vagy a látható vagy a nem látható vizuális élménye (például a néző vizuális élménye arról, ami nincs a vásznon, illetve nem kézzelfogható vagy spirituális; vagy annak vizuális élménye, ami valamilyen érzelmet vált ki). A második nézőpont szerint a közönség úgy értelmezi a vizuális élmény megfelelő formáját, mint az előadás és/vagy a kommunikáció ‘médium’ alapúságának szükséges és elégséges feltételét. Rick Altman úgy utalt az első nézőpontra, mint „ontológiai téveszmére”, mert előíró mintaként fejlesztették ki és használták: a film valóban fotografikus élmény, és így egy adott jelenetet vizuálisan kellene bemutatni. Lásd The Evolution of Sound Technology. In Film Sound: Theory and Practice. Szerk.: Elisabeth Weis és John Belton (Columbia University Press, 1985), 51-52. Újranyomtatva az Introduction alapján,Yale French Studies, 60 (1980) (tematikus szám, „Mozi/hang”). Ld. még Altman: Introduction: Four and a Half Film Fallacies. In Altman (szerk.): Sound Theory, Sound Practice (London, Routledge, 1992), 37-9.; és Robert Cumbow és William Johnson a szerkesztőnek írt levelei Film Quarterly 39 (1985-86), 64.
  A második nézőpontra talán úgy utalhatnánk, mint „a médium specifikusságának téveszméjére”, mivel érvelhetünk úgy, hogy egy „médium” nincs a priori meghatározva, hanem egy társadalmi kontextusban jelenik meg, és annak közös megítélését reprezentálja, hogy egy anyag az észlelés szerint milyen tulajdonságokkal bír, és hogy milyen anyagok csoportosíthatók abból a célból, hogy a diskurzus elfogadott eszközévé váljanak. (Az, hogy miként lehet az anyagokat megfelelően csoportosítani, azaz szintaktikailag vagy esztétikailag, megint más téma). Ahogyan a társadalom és annak technológiája és a mi különböző válaszaink és emlékeink változnak, úgy változik a médium „határa” is. Ld. például azokat a – történelmi feltételekhez kötött – szuggesztív elemzéseket, melyeket Kristin Thompson ad Stephen Heath azon meggyőződésének alátámasztására, hogy „A film materialista gyakorlata a látás ellenében javasolja és ellenzi az elemzést, »a kép és a hang segítségével történő elemzést«…, mely során a hang nem valamely kiegészítője a kép filmi lényegének, hanem ellenkezőleg, annak lényegi eleme, mely megfosztja a látványosságtól…. A valóságot nem a látás tükrében kell megragadni, hanem az elemzés távolságában, annak az ideológiának az eltörlésében, hogy a látás visszatükröz és igazol.” Thompson: Breaking the Glass Armor: Neoformalist Film AnalysisFilm Comment, 14:5 (1978. szept.-okt.), 38-40, és a levelét a nov.-dec.-i szám szerkesztőjéhez (14:6, 79). A „médium” más felfogásáról és elméleti fogalomként való használatáról ld. Gregory Currie:Image and Mind: Film, Philosophy and Cognitive Science (New York, Cambridge University Press, 1995), 1-16. (a hangok „véletlenszerű kinövések, amennyiben magát a mozit nézzük”, 3.o.). Ld. még a 11-es és a 12-es jegyzetet alább.
 3. [3] Vesd össze azzal a különbséggel, melyet Arisztotelész felvázol a predikátumok (állítmányok) között aszerint, hogy “jelen vannak-e”, benne foglaltatnak-e, alanyaikban, vagy pedig az alanyaik viszonylatairól állítanak valamit. Arisztotelész azt mondja, hogy a „fehér” „jelen lehet” a tárgyban, mert „minden szín testben van”, bár a szín „egy alanyról sem állítható”.Categoriae, 2. fejezet. (Magyarul: Poétika, Kategóriák, Hermeneutika. Kossuth Kiadó, 1997. 71-74.) Megjegyzem továbbá, hogy bár a színről úgy beszélünk, mint amit a tárgy birtokol, az a szín, amit a tárgy sajátjaként észlelünk, tulajdonképpen az egyetlen szín, amelyet a tárgynem birtokol, mert ez az a szín, amit a tárgy visszaver (és ami a szemünkben tükröződik) ahelyett, hogy elnyelné.
 4. [4] Egy 53 nyelv bevonásával végzett kutatásban, mely 14 különböző nyelvcsoportot képviselt a világ minden tájáról, Ake Viberg azt találta, hogy minden érzékelést kifejező ige olyan hierarchiába rendezhető, melyben a legerősebb a látás, melyet a hallás, a tapintás, az ízlelés és a szaglás követ. Számos fontos szintaktikai, morfológiai és szemantikai jellemző, mely mind az 53 nyelvnek sajátja, megmagyarázható ennek a megközelítésnek a segítségével. The Verbs of Perception: A Typological Study. In Explanations for Language Universals. Szerk. Brian Butterworth, Bernard Comrie és Osten Dahl (New York, Mouton, 1984) 123-162.Viberg azt is felfedi, hogy az az ige, melynek prototipikus jelentése a „látni”, egy adott nyelvben kiemelt pozícióval bír, mely szerint általánosságban használható kitágított jelentésben, mint egy általános keret, mellyel más érzékelő modálisok által kifejezett cselekvések írhatók le, mint az olyan általános tapasztalások, mint a „látom” az „értem” értelmében. („I see” és „I understand”). Vesd össze: „Dávid meghallgatta a felvételt, hogy lássa, jól vették-e fel.” A „látni” ige a „mutatni”, „látszani”, „tűnni” és a „hasonlítani” („show”, „shine”, „seem” és „similar”) igékkel is szoros kapcsolatban van. (141.) Ezek azon teoretikusok számára kényelmes tények, akik szerint a film alapvetően vizuális médium, és azon filmkritikusoknak, akik a látható stílusra vagy a történetre (plot) alapuló metaforákat használnak, mint pl. egy beállítás vizuális megjelenése, a látószög, a kamera nézése (camera look), szereplői látás (character vision), a látvány elvesztése (loss of sight), fotográfia mint illúzió, stb. Ahogy azonban látni fogjuk a 3. részben, ezeket a látásba való belemagyarázásokat nem lehet csak úgy ilyen nagystílű konklúziókkal lefedni. A látással és a tűnik-kel kapcsolatban ld. még J. L. Austin: Sense and Sensibilia. Szerk. G. J. Warnock (Oxford, Clarendon, 1962) 33-43.
 5. [5] A látható fény frekvenciája a 1016 ciklus per másodperc nagyságrendjegyen van, míg a hallható hanggé 10ciklus per másodperc. A fény 186.281 mérföld per másodperc sebességgel terjed, míg a hang egy-ötöd mérföld per másodperccel.
 6. [6] A hang sokkal hosszabb hullámhossza a fényhez viszonyítva megmagyarazza Balázs Béla azon kijelentését, hogy „a hang közelképeinél ügyelni kell a hang sajátos természetére, arra ugyanis, hogy sohasem választható külön akusztikai környezetétől, úgy, mint egy képrészlet a környezetétől. Mert ami nincs benne a képkockában, azt egyáltalán nem látjuk…[Ezzel szemben, amit egy közeli beállítás alatt hallunk, azok] maguk a hangok, melyek mindig az egész térben hallhatók, tehát a legkisebb részlet képében is. Hangokat nem lehet letakarni.”Theory of Film: Character and Growth of a New Art. Ford. Edith Bone (New York: Dover, 1970), 211. Ld. még 213-214, 215-216, 53, 54. (Magyarul: A film. Gondolat Kiadó, Budapest, 1961. 197.)
 7. [7] Laurence E. Marks: Multimodal Perception. In Handbook of Perception, 8. köt.: Perceptual Coding. Szerk. Edward C. Carterette és Morton P. Friedman (New York, Academic Press, 1978), 330-333.
 8. [8] Az egyes tárgyak belsejének hangzásáról ld. Don Ihde: Listening and Voice: A Phenomenologyof Sound (Athens, Ohio University Press, 1976), 70, 98-9. Az alapzajjal kapcsolatban ld. Stephen Handzo: Appendix: A Narrative Glossary of Film Sound Technology. In Film Sound, 395.
 9. [9] Metz példáit itt-ott kicsit módosítottam. Christian Metz: Aural Objects. In Film Sound. Ford. Georgia Gurrieri in Weis és Benton. Film Sound, 155-156. Újranyomtatva a Yale French Studies-ból. Az Aural Objects kivonat a The Perceived and the Named c. munkából. Ford. Steven Feld és Shari Robertson: Studies in Visual Comunication, 6:3 (1980. ősz), 56-68. Megjegyzem, az Aural Objects Metz későbbi pszichoanalitikus munkái közül való. Először 1975-ben jelent meg, ugyanabban az évben, mint a The Imaginary Signifier. Csakúgy mint Metz, Jean-Louis Comolli is arra jut, hogy a filmi hangot a kép uralja, bár az ő érvelése a domináns ideológia természetére támaszkodik, nem a nyelv természetére és az érzékelésre. Lásd: Machines of the Visible. In The Cinematic Aparatus. Szerk. Teresa de Lauretis és Stephen Heath (New York, St. Martin’s Press, 1980), 121-142. Kathryn Kalinak a hang természetének sok ideológiai és kulturális megközelítéséről beszámol a Settling the Score: Music and the Classical Hollywood Film című könyvében (Madison, University of Wisconsin Press, 1992), 20-39. Ld. még Roy Armes: Entendre, C’est Comprendre: In Defence of Sound Reproduction. Screen, 29:2 (1988. tavasz), 8-22. Az Aural Objects szokatlan kritikáját ld. Allan Casebier: Film and Phenomenology: Toward a Realist Theory of Cinematic Representation (Cambridge, Cambridge University Press, 1991), 91-9. Jean-Louis Baudry megint egy más megközelítést használ a The Apparatus: Metapsychological Approaches to the Impression of Reality in the Cinema c. írásában (In Narrative, Apparatus, Ideology: A Film Theory Reader. Szerk. Philip Rosen. Ford. Jean Andrews és Bertrand August [New York, Columbia University Press, 1986], 299-318.) Baudry azt állítja, hogy a hang a fénnyel ellentétben lényegileg kötődik a realitáshoz. Azt mondja, hogy a filmen „nem a hang képét halljuk, hanem magukat a hangokat. Még ha a hang felvételének és lejátszásának eljárásai el is torzítják a hangokat, mégis reprodukálják, és nem másolják azokat. Csak a kibocsátó forrásuk osztozik az illúzióban; a realitásuk nem. Kétségtelenül ez az egyik alapvető oka annak, hogy a hang privilegizált helyet foglal el az idealista filozófiában és a vallásban: a hang nem válik az illúzió játékává, illetve nem keveri össze a valóságot és annak ábrázolását (mert a hangot nem lehet figuratív módon ábrázolni), amire a látás hajlamosnak mutatkozik”. (304-305.) Úgy tűnhet, hogy Baudry indexikális jelként kezeli a hangot (azaz a jelentés a jel helyéből ered egy ok-okozati sorozatban). Ezzel ellentétben, Platón barlanghasonlatának jegyében, Baudry úgy kezeli a képet, mint ami csupán ikonikus (azaz a jelentés a jel valamihez való hasonlóságából, illetve annak imitációjából adódik. Ezen kívül azonban, Baudry a képet motiválatlannak tekinti, csakúgy mint egy szóképet (vagy egy elszólást vagy az álom mechanizmusát). Úgy látszik, hogy mind Metz, mind pedig Stanley Cavell egyetért Baudryval a hang reprodukciójának tekintetében, a fény másolásával szemben. Metz: Aural Objects, 7. jegyzet; Cavell: The World Viewed: Reflections on the Ontology of Film, bővített kiadás (Cambridge, Mass., Harvard Universtiy Press, 1979), 18-20; de vesd össze 186. o. Egy újabb, beható vizsgálatért lásd David Alan Black: Cinematic Realism and the Phonographic Analogy.Cinema Journal, 26: 2 (1987. tél), 39-50
 10. [10] Megjegyzem, a hang „forrása” ebben a példában nem a „szél” vagy a „fák”, hanem egy komplex tárgy: „szél-fák”. Az ilyen „kontakthang” a modellje majdnem mindennek, amit hallunk. Habár a vizuális tárgyak is komplexek ebben az értelemben (pl. az izzó fény tevékenysége egy könyv borítóján), a „forrás” szó általában másképpen alkalmazandó a fényre, amennyiben az csupán a beeső fény kibocsátására utal, a visszaverődő fényre nem. Nyelvhasználatunk itt arra világít rá, hogy milyen fontosságot tulajdonítunk a fény hatásának (a „vörös”, amely a felületről visszaverődik) ellentétben a hang okaival (pl. az a hang, amit a csizmában a padlónvaló járással hozunk létre). Vagyis a különböző módok, ahogyan a hangról és a fényről beszélünk, úgy tűnik, ok-okozati érvelésünk folyományai, ami viszont a világgal való praktikus interakciónkat testesíti meg.
 11. [11] Metz: Aural Objects, 156. Metz Louis J. Prieto: Messages et signaux c. művére hivatkozik (Paris, Presses Universitaires de France, 1966).
 12. [12] Aural Objects, 155. Metz a verbális nyelv elsőbbsége mellett érvel, mondjuk az audiovizuálissal szemben: „A nyelv el tudja mondani, még ha néha csak hozzávetőlegesen is, amit az összes többi kód el tud mondani, míg ez fordítva nem igaz… a nyelv sokkal többet tesz, mint hogy a látást [lefordítja]….A képről beszélni valójában a képet beszélni; nem igazán egy [fordítás], hanem megértés, reszocializáció….A megnevezés legalább annyira teljessé teszi az észlelést, mint ahogyan lefordítja azt; egy nem megfelelően verbalizalható észlelés nem teljes észlelés a szó társadalmi értelmében”. (The Perceived and the Named, 62-3). Metz nyitva hagyja annak lehetőségét, hogy a hang megszabadulhatna melléknévi szerepétől, ha valaki egy új (nem nyugati?) nyelv szerint élne. Ld. még Mary Deveraux: In Defence of Talking Film. Persistence of Vision, 5 (1987. tavasz), 17-27. („Hogy hogyan értelmezzük a filmi képeket, részben attól függ, hogy szerintünk mit mond a film, és ez bizonyosan részben, bár nem egészében, azon alapszik, hogy mit mondanak a film szereplői”, 26.). Ld. még az 1. jegyzetet fent, valamint a 3. részt és a 45. jegyzetet alább.
 13. [13] Feltárok néhányat a Metz-féle nyelvi determinizmus mögött húzódó összetett feltevések közül a következő cikkemben: ‘Here is a Picture of No Revolver!’: The Negation of Images, and Methods for Analysing the Structure of Pictorial Statements, Wide Angle 8, 3/4 (1986) 8-17. Úgy tűnik, Metz azt állítja, hogy hangfelismerésünk egy „fő” [fej] és „módosító” sémán keresztül történik, ahol a kifejezés „fő” [fej] része mutatja a hang forrását, ami látható (megvilágított) és/vagy tapintható tárgyként írható le, míg a „módosítók” másodlagos tulajdonságokat képviselnek, mint például a tárgy hangja vagy színe (színárnyalat, telítettség). Mindemellett léteznek más sémák is, melyek a hangélmény más koncepcióihoz vezethetnek. Ld. 11-13.
 14. [14] Amikor a hangot úgy halljuk, mint ami esetleges és valami által létrehozott (azaz egy közeli mozgáseseményhez kötött), ez a mozgásban lévő tárgyat megkülönböztetetté teszi. Így a hang „azonosító jelként” funkcionálhat egy bizonyos tárgy és a tárgy terének azonosításához egyaránt. Susan T. Fiske és Shelley E. Taylor szerint a hang megkülönböztető szerepe valójaban növeli az ember vizuális memóriájának erejét. „A vizuális memória erejének oka nem egészen érthető – mondják -, de egy lehetséges válasz az, hogy a vizuális ingerek nem vonják magukra a figyelmet olyan automatikusan, mint más ingerek. Más szóval, egy villanó fény nem biztos, hogy olyan gyorsan felhívja magára a figyelmet, mint a hangos zaj. Ezen felül a vizuális információ feldolgozása megköveteli, hogy az egyén aktívan az inger felé irányítsa a tekintetét, míg a hallható információ feldolgozása nem követeli meg azt, hogy az egyén aktívan irányítsa a fülét. Ezen gyengeségek kompenzálására a vizuális információ feldolgozásában az ember előnyben részesítheti a vizuális jelek dekódolását, mint általános stratégiát…” Social Cognition 2. kiadás (New York, McGraw-Hill, 1991), 315-16. Vö. Rick Altman „térbeli jelzés” fogalmával In Sound Theory, Sound Practice, 24., 77., 241-6., 252.Stephen Handel a következőképpen reagál a hang ezen aspektusaira: „A hallgatás [listening] helyez engem a világba. A hallgatás az érzelem, a mozgás és a jelenlét érzését adja nekem, ami hiányzik akkor, ha nézek. Jobban megijedek egy mennydörgéstől, mint egy villámlástól, bár tudom, hogy a mennydörgés ártalmatlan, a villámlás pedig halálos. Sokkal elszigeteltebbnek érzem magam, ha füldugóval élek, mint ha sötétítővel. A hallgatás centripetális; behúz a világba. A nézés centrifugális; elkülönít a világtól.” Listening: An Introduction to the Perception of Auditory Events (Cambridge, Mass., MIT Press, 1989), xi. Mindazonáltal úgy hiszem, a hangot nem kell mindig melléknéviként hallanunk (mint fent). A 3. részben úgy érvelek, hogy a hangot hallhatjuk (és a képeket láthatjuk) egy teljesen más módon is.
 15. [15] Ld. Tom Levin: The Acoustic Dimension: Notes on Cinema Sound. Screen, 25:3 (1984. május-június), 62-64 (tematikus szám a filmi hangról).
 16. [16] A hang és a kép összeillesztését a filmen „szinkronizált hangnak”, nem „szinkronizált fénynek” hívják, talán mert a hangot (kezdetben) úgy érzékeljük, mint egy folytonosságot, amely valaminek a mozgásától függ. Természetesebbnek tűnik úgy gondolni a hangra, mint változóra, amely illik, vagy nem illik egy stabil tárgyhoz, míg a fény kevésbé változónak tűnik, és jobban kötődik a tárgyhoz.
 17. [17] evin a hangi és a képi tér összehangolását „akusztikus diegetizálásának” hívja (ibid. 63). Rick Altman érvelésére hivatkozik, miszerint a hang egy „hermeneutikai” logikának engedelmeskedik, amelyben különböző aurális kérdések vetődnek fel a hang forrásával kapcsolatban, hogy azokat a kép válaszolja meg. Rick Altman: Moving Lips: Cinema as Ventriloquism. Yale French Studies, 60 (1980), 74. ld. még 69, 72, 75.
 18. [18] Hans Reichenbach: Atom and Cosmos: The World of Modern Physics. Ford. Edward S. Allen. (New York, George Braziller, 1957), 19. fejezet, Picture and Reality, 288. Az „átlagos világ” leírása megváltozik, amikor annak alapfogalmait más keretek között tekintjük. Például mivel Einstein szerint az anyag egyenértékű az energiával, a tér mint az anyag eloszlása, felfogható puszta energiamozgások és részecske-interakciók eredményének. A sebesség fogalma mint »távolság« osztva »idővel« , talán újravizsgálható. Lehet-e a távolságot és az időt mozgás nélkül mérni? Einstein szerint a távolság megbecslése a mérőeszköz sebességétől függ, az idő megbecslése pedig egy megfigyelő relatív sebességétől. Ami Einstein számára abszolút, az a fény sebessége a téri-dőben; a tér és az idő külön-külön változó. Ezen a kereten belül nincs tudomásunk másik abszolútumról. Az ilyen érvelésekben a mozgás úgy jelenik meg, mint ami legalábbis egyenértékű a térrel. A kvantumvilág is kívül esik az átlagos világon. Mivel a fizika alapvető szabályai időszimmetrikusak, az idő „nyila” nem létezik a leírás mikroszkopikus szintjén, hanem inkább csak egy (átlag-világbeli) makroszkopikus szinten jelenik meg a termodinamika második törvényében, amelyik kimondja, hogy egy izolált rendszer entrópiája (zűrzavar) mindig a maximum felé növekszik. Ld. általában David Layzer: The Arrow of Time.Scientific American, 233:6 (1975. dec.), 56-69; Stephen W. Hawking és Roger Penrose: The Nature of Space and Time (Princeton, Princeton University Press, 1996).
 19. [19] Lásd Milic Capek: Bergson and Modern Physics: A Reinterpretation and Re-evaluation(Dordrecht, D. Reidl Publishing, 1971), 8. fejezet, Bergson, Reichenbach and Piaget és 9. fejezet, The Logic of Solid Bodies from Plato to Quine, 65-80. az I. részben, Bergson biológiai elmélete a tudásról; Mark Johnson: The Body in the Mind: The Bodily Basis of Meaning, Imagination, and Reason (Chicago, University of Chicago Press, 1978).
 20. [20] Az eredetmetafora [alapmetafora] egy tapasztalattartomány magyarázatához szolgáltat keretet. Egy közös magyarázó nyelv forrásaként szolgál, míg kiszűri az alternatív filozófiai és tudományos modelleket. Ld. Stephen Pepper: World Hypotheses (Berkley and Los Angeles, University of California Press, 1942).
 21. [21] Hérakleitosz nem kifejezetten az időről beszél; az én értelmezésem sem pontos vagy teljes az ő metafizikája szerint. Megállapításának több fordítását vegyítettem. Ld. Hérakleitosz:Fragments: A Text and Translation with a Commentary. T.M. Robinson (University of Toronto, 1987), 12, 91a. töredék; vö. 6, 49a, 60, 88. töredék. Általában a Hérakleitosztól (101a, 118), Platóntól és Arisztotelésztől a tizenkilencedik századig terjedő fiziológiai elméletek a látásnak a hallással szembeni elsőbbségét hangsúlyozták; emellett a látást gyakran az intellektussal, a hallást pedig az érzelmekkel hozták összefüggésbe. Innen ered a „fiat lux” („legyen világosság”) felszólítás a „fiat sonus” helyett. Ld. Kalinak: Settling the Score, 20-39; Martin Jay: Downcast Eyes: The Denigration of Vision in the Twentieth Century French Thought(Berkley and Los Angeles, University of California Press, 1993), 1-147.; Paul Davies: The Face and the Caress: Levinas’s Ethical Alterations of Sensibility. In David Michael Levin (szerk.): Modernity and the Hegemony of Vision (Berkley and Los Angeles, University of California Press, 1993), 252-72. Don Ihde arról panaszkodik, hogy a nyugati metafizika teljes egészében a néma, mozdulatlan, közepes és átlátszatlan tárgyra épül; Listening and Voice, 3-16., 65-6., 70., 94.
 22. [22] Ld. George Lakoff és Mark Johnson: Metaphors We Live By (Chicago, University of Chicago Press, 1980) 7-9., 16., 41-45., 65-58., 118. Lakoff es Mark Turner: More Than Cool Reason: A Field Guide to Poetic Metaphor (Chicago, University of Chicago Press, 1989), 34-49., 86. Nyelvészeti bizonyítékokat használva Lakoff és Johnson kijelenti, hogy az időfolyamot (river of time) általában úgy értelmezzük, mint ami felénk látszik folyni, egyre közelebb hozva a jövőt ugyanolyan mértékben, mint amennyire a múltat magunk mögött hagyjuk. Ebben a képben az idő egyedi, egyenes vonalú (mondjuk a körkörössel szemben), folyamatos, szabályos, objektív és természetes, és az idő megfigyelője közvetlenül a jövővel áll szemben, amint előre, a folyás irányába néz. Érdekes lehet megvizsgálni más módszereket, amelyekkel az egyének vizualizálják ezt a jelenetet. Nézhetne a megfigyelő más irányba? Úgy gondoljuk el az időt, mint aminek hangja van? Milyen közel van a folyó?
 23. [23] A hang látszólagosan esetleges tulajdonsága az átlagos világban a következő megállapításra juttatta Kendall Waltont: „két szignifikáns különbség létezik a látás és a hallás között: először is a látás gyakran hatékonyabb a hallásnál a részletek azonosításának eszközeként, mint a de re nem pedig a pusztán de dicto tudás forrása. … Másodszor, a hangokra úgy gondolunk, mint amik forrásuktól könnyebben elkülönülnek, mint a látványok, mint az érzékelés tárgyai önmagukban véve, függetlenül a csengőktől vagy vonatoktól vagy a beszédtől, ami általuk válhat hallhatóvá. Egy látvány majdnem mindig valaminek a látványa tapasztalataink szerint; egy hang lehet csak egy hang.” What is Abstract About the Art of Music? The Journal of Aesthetics and Art Criticism, 46:3 (1988. tavasz), 352. (Walton kiemelése); ld. még 358-359. Megjegyzem, Walton állításai olyan szavakkal vannak teletűzdelve, mint „gyakran”, „vélt”, „majdnem mindig” és „lehetséges”.
  A hang melléknéviként való felfogásának egyik következménye (amint azt Walton teszi fent), hogy a hangalámondás (voice-over narration) egy filmen lényegében a kép egy fajta beszúrt magyarázatának vagy értelmezésének tűnik (azaz a Walton által pusztán de dicto-nak nevezett tudás megtestesítőjének), ami így, a képpel ellentétben, képes hazudni a nézőnek. Mindazonáltal úgy érvelek a 3. részben, hogy a hangot nem kell mindig melléknéviként hallanunk. 
  A hangalámondás természete fontos probléma a filmelmélet számára, mert olyan kérdéseket vet fel, melyek a „médium” lényegi alkotóelemeivel és a nem-beszélt narráció mértékével kapcsolatosak. Ld. az 1. jegyzetet fent és a 45. jegyzetet alább. A hangalámondással kapcsolatban ld. például Sarah Kozloff: Invisible Storytellers: Voice-Over Narration in American Fiction Film (Berkley and Los Angeles, University of California Press, 1988), 48-9., 69-71., 109-17., 124-6. („mikor a szavak és a képek teljes mértékben ellentmondanak egymásnak, mindig a képek tűnnek az igazmondóknak” 114.) („[a képkészítő] állandó megbízhatóságra és a tekintély birtoklására ítéltetett; nem ismerek olyan módszert, amellyel egy képkészítő komoly vagy folytonos kétséget támaszthatna saját adekvátsága vagy valósághűsége iránt”, 110.); Avrom Fleishman: Narrated Films: Storytelling Situations in Cinema History (Baltimore, John Hopkins University Press, 1992), 18. A hang melléknévisége jelenik meg számos filmelméleti útmutatóban; ld. például Dominique Nasta: Meaning in Film: Relevant Structures in Soundtrack and Narrative(Berne, Peter Lang, 1991), 26., 43-7., 89.
 24. [24] Levin: The Acoustic Dimension, 64. (az ő kiemelése). William Johnson egyetért Levin állításával, ami azt sugallja, hogy Johnson számára a hang és a kép tökéletesen elkülöníthető, de egyenlő. Habár az a probléma megmarad, hogy meghatározzuk, milyen kontextusban és milyen célból tekinthetők „egyenlőnek”. Ld. a 37. jegyzetet alább. Johnson, The Liberation of Echo: A New Hearing for Film Sound. Film Quarterly 38:4 (1985. nyár), 5. Johnson kibővíti érvelését a Sound and Image: A Further Hearing-ben, Film Quarterly, 43:1 (1989. ősz), 24-35.
 25. [25] Levin: The Acoustic Dimension, 62. Levin hangfelfogása alátámasztja Dominique Nasta állítását, hogy „A hangos dialóus valóságos időt kényszerít a vászonra, mivel itt is ugyanaddig tart egy mondat kimondása, mint a való életben …”, Meaning in Film, 45.
 26. [26] Johnson: The Liberation of Echo, 6. 22. jegyzet.
 27. [27] Noёl Burch: Theory of Film Practice. Ford. Helen R. Lane (New York, Praeger, 1973), 6. fejezet, On the Structural Use of Sound, 91.
 28. [28] Például Johnson példája az akusztikus állóképre Bellochio Fists in the Pocket [Öklök a zsebben. Marco Bellocchio, 1966] című filmjéből  nagyobb kontextusként megkövetelné, hogy a néző a hangot egy narratív diskurzus – egy „jelenet” – részeként fogja fel, melyben egy magnetofon a szereplő által hallott operaária forrása. Amint a szereplő meghal, megáll a kép, és az ária egy kitartott magas hangja hallatszik. Természetesen számos komplex metafora működik diegetikus és nem diegetikus narrációk bevonásával a narratív cselekményben. A hang és az idő „megállhat”, de csak bizonyos magyarázó kontextusokban, melyek megengedik a kitartott magas hang átalakítását egy „időpillanattá”, amelyet most egy új keretben lehet megvizsgálni egy ideig, függetlenül attól az időtartamtól, amit máshol betölt (ahol talán nem „állt meg”), ami felhatalmazza a nézőt arra, hogy a hangot a szereplő életének utolsó hangjaként hallja, a történet zárásaként és a film végeként; és/vagy a szereplő rémületének vagy szenvedésének jeleként, vagy a mi rémületünknek vagy valami más, általánosabb bénultságnak a jeleként, ami a történet egészén keresztül definiálódik, vagy abból magyarázható. Johnson: The Liberation of Echo, 6, 22. jegyzet.
 29. [29] Megjegyzem, a térnek, mint az időnek, legalább két különböző leírása van a fentről lefelé rendszerezés alapelvei ill. a lentről felfelé való kiterjedés (méret, arány, mélység) alapelvei szerint. Nelson Goodman az időtartamot egy szilárd tárgy kiterjedéséhez hasonlítja, és azt a következtetést vonja le, hogy „különösképpen nem az derül ki, hogy az idő folyékonyabb, mint (mondjuk) a tér, hanem inkább az, hogy az idő a statikusabb. … Ezért, bár nincs olyan változás, ami nem vonja be az időt, az időben nincs változás.” Ld. Talk of Time. In Problems and Projects (NewYork: Bobbs-Merrill, 1972), 219-220. Ld. még Ray Jackendoff: Semantics and Cognition (Cambridge, Mass., MIT Press, 1983), 174. (az időbeli elrendezést mentálisan térbeli kifejezésekkel kell ábrázolni) 150-151. (a „látni” igéről). Goodman valószínűleg alábecsülte a fentről lefelé tartó folyamat erejét az időtartam átdolgozásában oly módon, hogy az időt változóként érzékeljük (felgyorsul, lelassul, megismétlődik, stb.) problémáink és terveink vonzatában egy kognitív kontextusban. Úgy hiszem, a nézőnek a filmbeli időről kapott benyomása függ az adott leíró módszer által megengedett mellérendelés összetettségétől. Ezen felül, amikor új idő- és térleírást alkotunk egy új átlagos világbeli funkció betöltésere, akkor talán arra is szükség lehet, hogy újragondoljuk az „ok-okozatiság” nyelvét. Ld. Branigan: Here is a Picture of No Revolver, 10-13. ésNarrative Comprehension and Film (New York, Routledge, 1992), 20., 26-32., 39-44., 49., 50., 116., 148-9., 148., 22. jegyzet, 203. Bertrand Russell láthatólag tagadná, hogy legalább két alapvető időérzékelés létezik – időrend és időtartam – de csak mert az ő felfogása a „rendről” annyira behatárolt, hogy csak az esetleges összefüggés ismeretétőlfügg – azaz egyszerű egymásutániság vagy kronológia: mi van először, és mi követi. Russell szerint bármely pontossági fokú időbeli egymásutániság létrehozható pusztán azáltal, hogy egy fizikai esemény tartamát tetszőleges hosszúságú szegmentumokra osztunk fel. Az idő azonban nem csupán periodicitás vagy rendezett periodicitás a russelli értelemben, hanem hierarchikus periodicitás. Az utóbbi, összetettebb időfelfogás segít megérteni nyelv- es zeneértésünk bizonyos árnyalatait, ahol új sorrendek születnek azzal, hogy mentálisan kiveszünk elemeket a sorozatból a fentről lefelé tartó séma szerint. Vö. Ray Jackendoff: Consciousness and Computional Mind (Cambridge, Mass., MIT Press, 1987), 253-256. Bertrand Russell: The Problems of Philosophy (London, Oxford University Press, 1972), 32., 33., 87., 102., 146. Ld. általában Goodman: Ways of Worldmaking(Indianapolis, Hackett, 1978).
 30. [30] A kameramozgás, csakúgy mint a hang, példázhatja az időtartamot: egy tér kiterjedése, csökkentése, eltolása (mozgás parallaxis) vagy elforgatása gyakran úgy tűnhet, egy folyamatos jelen jelenlétét jelzi. Azonban a hanghoz hasonlóan, a néző által a narratívára alkalmazott más leíró sémák (és narratív kontextusok) darabossá tehetik a kameramozgást, ami így csak halványan utal egy nagyobb mátrixban lévő fix helyzetek kapcsolatára; pl. Jancsó Miklós vagy Jean-Luc Godard filmjeiben. Hasonló megjegyzéseket lehet tenni a film sok más „formai” filmparaméterére, mint a filmvetítés, a mozgás a képben, a vágás és a színészi játék. Továbbá az az általános hiedelem, miszerint a film képei gyakran vagy mindig „jelen időben vannak”, egy olyan mítosz, melynek bizonyos megszorító leírások használata, illetve az idő széles körben elterjedt metaforái adnak tápot. Ld. Alexander Sesonske: Time and Tense in Cinema. Journal of Aesthetics and Art Criticism, 38:4 (1980. nyár), 419-26; Magyarul: Idő és nyelvtani idő a filmben. Ford. Kovács Ágnes Zsófia. Apertúra, 2007. tél. Branigan, Here is a Picture of No Revolver!, 10-12.
 31. [31] A „tik-tak” kifejezés általam véghezvitt elemzése Frank Kermode értekezésének adós, amelyben a szót elemezte, The Sense of an Ending: Studies in the Theory of Fiction (Oxford University Press, 1976), 44-46. Kermode Paul Fraisse The Psychology of Time (Ford. Jennifer Leith. New York, Harper & Row, 1963) c. művére támaszkodik, de nem jelzi a megfelelő bekezdéseket; ld. például 72-73, 77-78, 81-84 (magánhangzós kifejezések, mint mérce a tartam méréséhez), 89. Szünetek érzékelésével és időmetaforákkal kapcsolatos hatásos megjegyzéseihez ld. Fraisse, 128-134, 283-287.A „tik-tak” tulajdonképpen egy nagyobb kifejezéscsaládba tartozik, melyek mindegyike két tagból épül fel, melyek között csupán egy magánhangzó eltérés van. Ezeket a kifejezéseket én „harmonikus pároknak” hívom. Ezen kifejezések – 45-öt találtam az angol nyelvben – különleges tulajdonságainak részletesebb elemzése nem illik ide, csupán azt jegyzem meg, hogy ami elgondolkodtató ezekkel a párokkal kapcsolatban az az, hogy mindegyik egy kezdeti „i” magánhangzóra épül. A három kivetel – heehaw, seesaw, és teetertotter – nem igazán kivétel, mivel a kezdeti magánhangzó csak kissé magasabb a kiejtésben az „i” hangnál, és ugyanúgy elülső és ajakréses mint az „i”. Úgy hiszem, az „i” hangnak ez a használata a harmonikus párokban alapvetőbb időreferenciákkal van kapcsolatban az angolban. Steven Pinker ír erről a szócsoportról a „fonetikai szimbolizmus” keretein belül a The Language Instinct: How the Mind Creates Language (New York, Harper Perennial, 1994), 166-8.
 32. [32] A „másolat” egy új és különálló entitás, amely minden „jelentős” vonatkozásban hasonló egy másik entitáshoz. Hogy mi számít „fontosnak” azon hasonlóságok megítélésében, melyek egy dolgot egy másik „másolatává” tesznek, az attól függ, hogy mi egy bizonyos emberi viselkedés feltehető célja vagy haszna. A másolatok elkülönülnek egymástól, de egyenlően működnek valamely kontextusban. Két tízcentes érme a zsebemben ilyeténképpen másolata egymásnak anélkül, hogy egy tízcentessé válnának vagy egy tízcentessé és egy tízcentes tökéletes utánzatává (vagy tökéletes hamisítvánnyá). Bár a tízcenteseimen szerepelhetnek különböző verési dátumok, mindegyikük tíz centet ér a forgalomban. Ha azonban az egyik bádogból készült, nem fog teljes értékű másolatnak számítani a boltban. Roger Brown megmutatta, hogy a helyileg működő nem nyelvi (azaz kulturális) szokások szorosan kapcsolódnak megnevező illetve fogalmi kategória-alkotó tevékenységeinkhez, melyek által a tapasztalatainkat rendszerezzük. A megnevezés aktusa annak felfedezése, hogy mi számít „fontosnak”. Ld. How Shall a Thing Be Called? In Psycholinguistics: Selected Papers by Roger Brown (New York, Free Press, 1970) 3-15. Social Psychology (New York, Free Press, 1965), 318-322. („Izomorfizmus áll fenn a megnevező viselkedés és más kulturálisan meghatározott viselkedésfajták között.”); és Words and Things (New York, Free Press, 1958). Ld. még George Lakoff: Women, Fire, and Dangerous Things: What Categories Reveal about the Mind (Chicago, University of Chicago Press, 1987). A nem nyelvi gyakorlatok abban is meghatározó szerepet játszanak, hogy egy entitást legitim másolatként vagy eredetiként (esetleg utánzatként) fogadnak-e el. Ld. Nelson Goodman: Languages of Art: An Aproach to a Theory of Symbols, 2. kiadás (Indianapolis, Hackett, 1976), 3. fejezet, Art and Authenticity, 99-123.
 33. [33] A lentről fölfelé és a fentről lefelé haladó folyamatok létezése jelentősen megváltoztatja a hagyományos megkülönböztetést az érzékelés és a megértés között. Jackendoff:Consciousness, 271-272. A két folyamat közötti különbségről ld. Howard Gardner: The Mind’s New Science: A History of the Cognitive Revolution, bővített kiad. (New York, Basic Books, 1987), 96-97. Ld. még Barnard J. Baars: The Cognitive Revolution in Psychology(New York, Guilford, 1986). A filmi érzékelésről szóló beszámolót néhány ilyen folyamat leírásával ld. Julian Hochberg és Virginia Broks: Movies in the Mind’s Eye. In David Bordwell és Noël Carroll (szerk.): Post-Theory: Reconstructing Film Studies (Madison, University of Wisconsin Press, 1996), 368-87; Julian Hochberg: Representation of Motion and Space in Video and Cinematic Displays. In Handbook of Perception and Human Performance, I. köt.: Sensory Processes and Perception. Szerk. Kenneth R. Boff, Lloyd Kaufman és James P. Thomas (New York, John Wiley and Sons, 1986), 22-1-től 22-64 és Virginia Books: Film, Perception and Cognitive Psychology. Millenium Film Journal, 14/15 szám (1984-5. ősz-tél), 105-26. Lásd általában David Bordwell: A Case for Cognitivism. Iris, 9 (1989. tavasz), 11-40 (a mozi és a kognitív pszichologia kapcsolatával foglalkozó különszám). Magyarul: Bordwell: Érvelés a kognitivizmus mellett. In A kortárs filmelmélet útjai. Budapest, Palatinus, 2004. 361-401. A lentről felfelé és a fentről lefelé ható folyamatok leírását a Narrative Comprehension and Film c. könyvemből idézem, ld. 37-9., 45-6., 118. Nem egyértelműen tisztázott, hogy vajon a lentről fölfelé és a fentről lefelé tartó folyamatok közötti különbség megegyezik-e azzal a különbséggel, ami aközött áll fenn, ami a „mozivásznon” van – vagyis ami a médium kiterjesztése lehet -, illetve ami a „történetben” van – vagyis ami más médiumokra is lefordítható. Ki lehetne terjeszteni a „lentről felfelé” és a „fentről lefelé” tartó folyamatok fogalmát úgy, hogy fedje a kutatás és az elméleti tevékenység két különböző megközelítését. Ld. pl. Zenon W. Pylyshyn: Metaphorical Imprecision and the ‘Top-Down’ Research Strategy. In Metaphor and Thought. Szerk. Andrew Ortony. (Cambridge, Cambridge University Press, 1979), 420-436.
 34. [34] A fentről lefelé tartó folyamatok léte megmagyarázza azt a tényt, hogy nem véletlen az, hogy mire emlékezünk, és mi fölött siklunk át egy narratív film értelmezésében. A fentről lefelé tartó mechanizmusokról, melyek bizonyos narratív és nem narratív élményünket vezérlik, ld. például Jean Matter Mandler: Stories, Scripts, and Scenes: Aspects of Schema Theory(Hillsdale, New Jersey, Lawrence Erlbaum Associates, 1984). A kulturális tudás néhány formája (mint például a moziba járás, egy születésnapi partin való részvétel, zöldségvásárlás, vacsorakészítés, utazás, éttermi étkezés, egy orvosnál tett látogatás), valószínűleg sémahalmazokba rendeződik, bár ezek nem feltétlenül narratív sémák. Ld. Roger C. Schrank és Robert P. Abelson: Scripts, Plans, Goals and Understanding (Hillsdale, New Jersey, Lawrence Erlbaum Associates, 1977); Fiske and Taylor: Social Cognition.
 35. [35] Élénk vita folyt az 1930-as években arról, hogy hol kellene lennie a mikrofonnak a hangforráshoz és a kamerához képest annak érdekében, hogy a kép és a hang tere optimálisan illeszkedjen a közönség számára. Az egyik elmélet szerint a hangerőt kell egyeztetni a kamera pozíciójával, a lencse fókusztávolságával és a környezet hangvisszaverő tulajdonságaival úgy, hogy egy látható tárgy a beállítás hátterében sose legyen olyan hangos, mint amilyen az előtérben lenne („hangperspektíva”). Megjegyzem, ami itt kockán forog, az nem csupán a hangerő és a hangvisszaverődés szisztematikus változtatása, hanem ezek szoros egyeztetése a beállítások sorozatán keresztül a különböző hangforrások helyzetére való tekintettel. Egy ezzel ellenkező elmélet szerint a mikrofont úgy kell elhelyezni, hogy az csak a jelenetben legfontosabb hangot vegye fel, és jól érthetően adja vissza , a kamera pozíciójától függetlenül („pszichológiai realizmus”, vagy talán „narratív perspektíva”). Mindkét elmélet helyes, mert a hangérzékelés két különböző módján alapulnak. Az első a lentről felfelé haladó érzékelést, a második a fentről lefelé tartó érzékelést részesíti előnyben. A második elmélet például azt mondaná, hogy amint a méret sem abszolút, hanem egy vizuális területhez képest relatív (azaz ami aprónak tűnik a távolban, nagyobb lehet, mint egy közeli tárgy), úgyanúgy a hang is relatív egy aurális területen: egy halk hang a távolban hangosabb lehet, mint a közeli suttogás. Ez lehetővé tenné, hogy a távoli (halkabb) hang a filmen kezdetben hangosabban jelenjen meg, mint a közeli hang, ha feltételezzük, hogy ami a közönség előtt megjelenik, az egy bizonyos (gyakran narrativizált) figyelem egy helyre való irányítása vagy egy bizonyos kívánság (pl. ha mindkét forrástól egyenlő távolságra helyezkednék el…; vagy bárcsak közelebb volnék ahhoz a tárgyhoz…; vagy úgy hiszem, hogy az egyik szereplő szeretné, ha közelebb lenne ahhoz a tárgyhoz). Ld. Mary Ann Doane: Ideology and the Practice of Sound Editing and Mixing. In Weis és Belton: Film Sound, 58-61, újranyomtatva de Lauretis és Heath: The Cinematic Apparatus c. művéből; és Rick Altman: Sound Space. In Sound Theory, Sound Practice, 46-64. Mellesleg találhatunk analógiákat a perspektíva két fenti fajtájára – perceptuális és narratív -, melyek kontextusként felhasználhatók más filmes eszközök leírására, mint például a szerkesztés, kameramozgás és vágás, függetlenül attól, hogy ezek az eszközök egy szereplő nézőpontjának bemutatását célozzák vagy sem.
 36. [36] Az elme moduláris szerkezetének implikációiról ld. pl. Jackendoff: Consciousness; Jerry Fodor: The Modularity of Mind (Cambridge, Bradford Books/ MIT Press, 1983); Howard Gardner: Frames of MindThe Theory of Multiple Intelligences (New York, Basic Books, 1983); Marvin Minsky: The Society of Mind (New York, Simon and Schuster, 1986); Margaret S. Livingstone, Art, Illusion and the Visual System. Scientific American 258:1 (jan. 1988): 78-85; Andy Clark: Microcognition: Philosophy, Cognitive Science, and Parallel Distributed Processing (Cambridge, Mass., MIT Press, 1989).
 37. [37] Johnson: The Liberation of Echo, 4.
 38. [38] Nem világos, hogy Johnson azt gondolja-e, hogy a hang és a kép ontológiailag egyenlő, mert ugyanazon elemekből állnak össze (pl. „információ”), vagy úgy gondolja, hogy ontológiailag különbözőek, de egyenrangúak valamely metafizikai hierarchiában. Úgy beszél a hangról, mint a kép „teljes és egyenrangú partneréről” (2.), amely „a képpel egyenlő rangot érdemel még akkor is, ha a szerepe alig észrevehető” (11.). Johnson egyetért Elisabeth Weis nézetével, mely szerinte „következetesen egyenlő fontosságot tulajdonít” a hangnak és a képnek (2.). Ezeket a megfogalmazásokat sokféleképpen lehetne értelmezni, mely értelmezések némelyike nem ontológiai. Ld. még Johnson válaszát Robert Cumbow levelére,Film Quarterly 39:2 (1985-86. tél), 64. („ontológiailag egyenértékűek”), és ld. a 23. jegyzetet fent.
 39. [39] Johnson: The Liberation of Echo, 6. A „közvetlen” és a „közvetett” terminusok használata nem egyértelmű és félrevezető, mikor a hang és a fény jelensége kapcsán használjuk őket, mivel különböző módokon érvényesülnek attól függően, hogy a hang vagy a fény mely tulajdonságát helyezzük előtérbe. Amint azt a szövegben már korábban tárgyaltuk, két alapvető fizikai különbség van a hang és a fény közt, melyek miatt különbözőképpen érzékeljük őket a lentről felfelé tartó folyamat szerint.
 40. [40] Ibid. 6. (Johnson kiemelései; a lábjegyzet nélkül).
 41. [41] Ibid. 6. 20. jegyzet (Johnson kiemelése).
 42. [42] Ibid. 7. Johnson kevés kategóriát használ a hang elemzésére. A hang lehet szinkron vagy aszinkron, a vászon terén belüli vagy azon kívüli. Ilyen állapotban a hang megerősítheti, vagy megkérdőjelezheti, erősen vagy gyengén, a kép által hordozott információt. Más írók sokkal gazdagabb sémákkal dolgoznak. Ld. Siegfried Kracauer: Theory of Film: The Redemption of Physical Reality (New York, Oxford University Press, 1960), 102-156., David Bordwell és Kristin Thomson: Film Art: An Introduction, átdolgozott kiad. (New York, McGraw-Hill, 1997), 315-54. Mivel nyitott kérdés lehet, hogy milyen fajta időt jelöl egy bizonyos hang, a hang és a kép társítása különféle tér-idő eseményeket hozhat létre. A hang és a kép időbeli és térbeli megjelenési formáinak elemzésére szolgáló módszereket találunk Branigan: Narrative Comprehension and Film, 39-44., 146-9.; és David Bordwell: Narration in the Fiction Film(Madison, University of Wisconsin Press, 1985), 74-88. és 99-130.
 43. [43] Ld. Michael J. Reddy: The Conduit Methaphor: A Case of Frame Conflict in Our Language about Language. In Ortony: Metaphor and Thought, 284-324.
 44. [44] A kommunikációs modell néhány alternatíváját ld. William Frawley: Text and Epistemology(Norwood, New Jersey, Ablex Publishing, 1987) c. művében; valamint Edward Branigan: Point of View in the Cinema: A Theory of Narration and Subjectivity in Classical Film (New York, Mouton Publishers, 1984); Bordwell: Narration in the Fiction Film. A referenciális kapcsolatok összetettségéről ld. Nelson Goodman: Of Mind and Other Matters (Cambridge, Mass., Harvard University Press, 1984), Routes of Reference, 55-71.
 45. [45] A „narráció” nem arra utal, amit egy történet elbeszél, és ami ott történik, hanem inkább az elmondás feltételeire – a tudás átfogó szabályozására és eloszlására, ami meghatározza, hogy mikor és hogyan juthat az olvasó ismeretekhez a szövegből, ide értve (a néha csak oda gondolt) beszélők, bemutatók, színészek, hallgatók, nézők és fokalizátorok figuráit, akik (térbeli és időbeli) pozíciójuknál fogva tudnak valamit. Egy ilyen személy vagy ágens használata az olvasó „helyzetét” vagy tudásallapotát leíró állításban csupán egy hasznos fikció, mely azt jelzi, hogy a tudás mezeje hogyan osztódik föl az olvasás folyamán egy bizonyos pillanatban. A narráció az olvasónak a törtenet feldolgozását szolgáló tudására vonatkozik („a hogyan tudása”), nem pedig az olvasó kijelentő módbeli tudására („a mit tudása”). Ilyen értelemben a filmi narráció sokkal több, mint a „hangnarráció” eszköze; valóban sokkal több annál, mint amit a filmi hang közvetít, vagy, ha már itt tartunk, mint amit a képen látunk. A narrációval és annak szintjeivel kapcsolatban ld. Branigan: NarrativeComprehension and Film, 63-124. Magyarul: Narráció. Ford. Füzi Izabella. In Vizuális és irodalmi narráció. Szerk. Füzi Izabella. Szeged, 2006. Megjegyzem, az a kérdés, amit a narráció fogalma vet föl, nem egy hang (vagy egy kép) valós létrehozása (felvétele, vágása, mixelése) a filmen, hanem annak a néző általi befogadása és értelmezése. Például a történet által meghatározott specifikus referenciális kereten (narrációs szinten) belül valószínűleg nem számít, hogy a hangot, amit a filmen a néző madárdalként hall, tulajdonképpen nem az a madár hozza létre, amelyet a néző lát; és lehet, hogy az sem számít, hogy a hangot talán egyáltalán nem egy valóságos madár hozta létre. Ami számít az az, hogy a néző hogyan hallja és jellemzi a hangot.
 46. [46] Itt David Bordwell néhány terminusát használom a filmi narráció elemzéséhez; ld. Narration in Fiction Film, 57-61. Egy másik megközelítést találhatunk George M. Wilson: Narration in Light: Studies in Cinematic Point of View című művében (Baltimore, Johns Hopkins University Press, 1986), 4-5. A narráció elemzésével kapcsolatos problémák áttekintéséhez ld. Susan Sniader Lanser: The Narrative Act: Point of View in Prose Fiction (Princeton, NJ, Princeton University Press, 1981).
 47. [47] Az analóg hangról ld. Burch: Theory of Film Practice, 95.
 48. [48] Mint ahogy korábban tárgyaltuk, biológiai okai vannak az átlagos világbeli környezethez való alkalmazkodásunknak.
 49. [49] A „tárgyhang” nem a legegyszerűbb és nem is a legbonyolultabb hang, amelyet tapasztalhatunk és értelmezhetünk. A tárgyhangnak belső szerkezetete van, mert úgy értelmezzük, mint egy vizuális, anyagi tárgy produktumát, amely tárgy hullámokat hoz létreegy elasztikus közegben. A tárgyhang így nem az érzékelés egyik egyszerű alkotóeleme, hanem inkább, úgy hiszem, egy úgynevezett „alapszintű kategorizáció”, amely szoros kapcsolatban áll a fizikai és a társadalmi értelemben vett világgal (lentről felfelé tartó pszichológiai folyamatokon keresztül). Az „alapszintű” kategóriák tulajdonképpen az átlagos világon belüli átlagos világot alkotnak, és mind a fölérendelő mind pedig az alárendelő kategorizációs rendszerek alapját képezik. Így például egy gyerek megtanulhatja, hogy egy tárgynak „tízcentes” a neve annak alapján, ahogyan azt a boltban használják, még azelőtt, hogy újrarendszerezné a „tízcentest” mint „pénzt”, „dolgot,” „fémtárgyat” vagy „érmét” egy fölerendelő rendszer szerint, vagy mielőtt egy alárendelő rendszer szerint „1952-es Denverben vert érmének” vagy „megkarcolt érmének” nevezné. Ld. Roger Brown és a 31. jegyzetet fent. Az alapszintű kategorizálásról ld. még Lakoff: Women, Fire,and Dangerous Things, 31-54., 199-201., 265-271., 296-297.; és Stevan Harnad szerk.: Categorical Perception: The Groundwork of Cognition (Cambridge, Cambridge University Press, 1987), különösen a 9, 16. és 19. fejezet, Perceptual Categories in Vision and Audition (287-300.), Categorization Processes and Categorical Perception (455-90.) és Category Induction and Representation (535-65).
 50. [50] Keith Donnellan (a 6. alfejezetben tárgyalt) megfogalmazása szerint ahhoz, hogy egy hangot tiszta zajként halljunk, tudatos erőfeszítéssel „nem-jelzőivé” kell változtatnunk. Egy ilyen hang végső soron utalhat egy nem tapintható tárgyra, mint egy szín, egy gondolat, egy szereplő mentális állapota vagy egy jövőbeni (talán előrevetített) esemény. Feltételezhető, hogy mind a hangot, mind a fényességet lehet „tényként” megélni anélkül, hogy akár egy „forráshoz”, akár egy „tárgyhoz” lennének kötve. Van arra is bizonyíték, hogy a mozgást lehet mindenféle mozgó tárgy nélkül is érzékelni. Ld. Hochberg: Representation of Motion, 22-8, 22-30, 22-33. Ha ez így van, a gondolkodásunkban milyen szinten van „elég” hang vagy fény (vagy mozgás, tér, idő) ahhoz, hogy egy mentális „eseményt” alkosson – olyan hang vagy fény, amit egyszerűen észleletként élünk meg? Vajon egy ilyen benyomás valóban egyszerű vagy összetett folyamatok eredménye? A közelmúlt számítógépes érzékelés-vizsgálatai azt sugallják, hogy a látszólag egyszerű észleletek igen bonyolultak. Ld. pl. David Marr nagy hatású érvelését a tér két és fél dimenziós megjelenítéséről mint a vizuális észlelés egy fokáról. In Vision: A Computional Investigation into the Human Representation and Processing of Visual Information (San Francisco, W. H. Freeman, 1982). A filmbeli mozgás érzékelése pszichológiai folyamatokon alapszik, melyeket még mindig nem értünk teljesen. Ilyenek a vibrálás összeolvadása [flicker fusion], a rövidtávú látszólagos mozgás és a maszkolás. Ld. Joseph D. Anderson: The Reality of Illusion: An Ecological Approach to Cognitive Film Theory(Carbondale, Southern Illinois University Press, 1996), 54-65, 102-3.
 51. [51] Anderson szerint a zene és a párbeszéd narrációbeli flexibilitását azáltal éri el, hogyegyidőben teremti és erősíti meg a nézőben azt a felismerést, hogy egy egységes, ökológiailag fontos esemény tanúja. The Reality of Illusion, 80-9.
 52. [52] Az attributív és a referenciális használat természetéről szóló leírásom elsősorban Keith S. Donnellan munkájának következő oldalaira támaszkodik: Reference of Definite Descriptions.Philosophical Review, 75:3 (1966. július), 285., 289., 290-1., 295-6., 297., 299-302. Saul Kripe vizsgálja Donnellan érvelését a Speaker’s Reference and Semantic Reference-ben. In A. P. Martinich (szerk.): The Philosophy of Language, 2. kiadás (New York, Oxford University Press, 1990), 248-67. („a beszélő referenciája” és „a szemantikai referencia” közel áll Donnellan „referenciális használatához” és attributív használatához”). Nem fejlesztem tovább Kripke gondolatait ebben az esszében, mert ő erősen támaszkodik az intencionalitásra és a kommunikációra; érdeklődésének középpontjában a beszélő áll, és nem a befogadó vagy a befogadás konvenciói; és úgy tűnik, azt feltételezi, hogy egy leírás „referenciális használata” csak a beszélő egyszerű hibájából származik – így nem tisztázza, hogyan kellene fikcionális, retorikai és/vagy esztétikai leírásokat elemeznünk. Olyan átfogó és kifinomult megközelítéshez, amely nem támaszkodik szerzői intencióra, beszédaktusokra vagy kommunikációs modellekre az interpretáció problémáinak kezelésében, ld. pl. David Bordwell:Making Meaning: Inference and Rhetoric in the Interpretation of Cinema (Cambridge, Mass., Harvard University Press, 1989).
 53. [53] Úgy gondolom, hogy a „fikcionális referencia” egy harmadik nagyobb referenciatípus. Úgy érveltem, hogy az ilyen referencia egyfajta meghatározatlan leírást alkalmaz, amely az érzékelő kognitív (bár nem feltétlenül emotív) szövegértelmezésére van hatással. A hang fikcionális meghallása (értelmezése) egy olyan folyamaton keresztül zajlik, amit nevezhetnénk talán „hyper fentről lefelé folyamatnak”, s amely késlelteti a denotációt (egzisztenciális referencia) azáltal, hogy a jelentést bonyolult mondatokon és leírás-rétegeken vezeti keresztül. Ld. Branigan: Narrative Comprehension and Film, 192-217. Ld. Általában Murray Smith: Film Spectatorship and the Institution of Fiction. Journal of Aesthetics and Art Criticism, 53:2 (1995. tavasz), 113-27. Néhány olyan célért, melyeket az észlelő kitűzhet, és melyek mások, mint egy tárgy egzisztenciális azonosítása ld. a fő szöveget fent, a 13. és 33. jegyzeteknél.
 54. [54] Ld. Edward Branigan: What is a Camera? In Patricia Mellencamp és Philip Rosen (szerk.):Cinema Histories, Cinema Practices (Frederick, Md., University Publications of America, 1984), 87-107. David Bordwell dokumentálja azt a hatalmas mennyiségű gondolattömeget, melyet a teoretikusok a mozi lényegéről előterjesztettek az On the History of Film Style(Cambridge, Mass., Harvard University Press, 1997) című munkájában.
Erre a szövegre így hivatkozhat:

Edward Branigan: Hang, episztemológia, film. Apertúra, 2007. tél. URL:

https://www.apertura.hu/2007/tel/branigan-hang-episztemologia-film/