In het verleden hebben we een transitie meegemaakt van mono- naar stereo-geluid, daarna van stereo- naar surround-geluid. Als gevolg van de komst van smartphones en smartspeakers zijn we zelfs weer terug gegaan naar mono-geluid. Vandaag de dag zien we een enorme opmars van de volgende stap in die transitie: 3D audio. De wondere wereld van 3D audio, een spannende golf van ontwikkelingen die nog een lange weg heeft te gaan. We zitten er middenin! In dit artikel leg ik je precies uit wat 3D audio is. Je hebt misschien wel eens gehoord van 8D audio. Ik zal je ook uitleggen wat dit is en waarom ik dit geen 3D audio noem.
Aan de hand van luistervoorbeelden gebaseerd op het nummer ‘October, Halfway July’ van A. Johanson laat ik je de verschillen horen tussen mono, stereo, binauraal en 3D. Je vindt de voorbeelden door het artikel verspreid.
Geschiedenis
Om 3D audio beter te kunnen begrijpen neem ik je kort mee door de geschiedenis van geluidsopnames en -reproductie. De geloofwaardigheid of ‘het gevoel van echtheid’ is iets wat telkens terug komt. Streven we naar echtheid, een natuurlijke weergave van geluid?
Mono, Stereo & Surround
In de negentiende eeuw werden de eerste audio-opnames gemaakt en in 1878 patenteerde Thomas Edison de fonograaf waarmee hij geluid kon opnemen. Al deze opnames waren mono, dat wil zeggen dat het geluid via één kanaal gaat. Daarmee komt al het geluid dat je opneemt en afspeelt uit één bron (speaker) terug.
Het patent van Thomas Edison voor de fonograaf
A. Johanson – October, Halfway July in mono
luister met koptelefoon
Aan het eind van de negentiende eeuw ontstond het idee voor multi-kanaals geluid: stereo. Hierbij heb je in plaats van één kanaal, twee kanalen. Deze technologie werd pas in 1931 gepatenteerd door Alan Blumlein, een Britse engineer bij EMI. Met de komst van stereo werd ‘panning’ geïntroduceerd. Hiermee bepaal je met welke intensiteit een geluid wordt gereproduceerd per speaker. Wanneer je bijvoorbeeld een geluid harder uit de linker speaker laat komen, neem je het ook waar alsof het van links komt. Een leuke ontdekking is dat als je een geluid even hard uit beide speakers laat komen, het dan lijkt alsof het uit het midden komt. Dit noemen we ook wel het ‘fantoom midden’. Plaatsing van audio begint een grotere rol te krijgen. De wil om iets te maken wat de luisteraar doet voelen alsof hij er echt bij is, is kennelijk groot.
A. Johanson – October, Halfway July in stereo
luister met koptelefoon
Hierna werd de technologie voor surround-sound ontwikkeld. De eerste film met surround-sound was Walt Disney’s Fantasia uit 1940. Het principe van surround-sound is het gebruik van meerdere speakers (meestal zes) om de luisteraar heen. Je kunt je voorstellen dat je met meer kanalen een nog betere plaatsing van geluiden krijgt. Daarmee wordt een nog betere reproductie van de werkelijkheid nagebootst. Hoe meer kanalen en speakers, des te echter het resultaat. Een groot nadeel is dat, in praktijk, niet veel mensen zoveel speakers in huis willen hebben. Daarnaast ben je ook afhankelijk van waar de speakers zijn geplaatst en van de ruimte waar ze zich in bevinden.
Binaurale Audio
Terug naar de negentiende eeuw, waar er een vrij basaal idee voor geluidsopnames wordt bedacht: binaurale audio. Al sinds 1881 wordt hiermee geëxperimenteerd, maar pas de laatste paar decennia wordt hier gebruik van gemaakt. Binaurale audio is niets anders dan een methode voor het imiteren van het menselijk gehoor. Voor het maken van binaurale opnames gebruik je twee microfoons in de vorm van het menselijk oor. Soms zelfs in de vorm van een volledig hoofd. Met deze methode kun je geluidsopnames verrassend echt laten klinken. Dit komt omdat er rekening wordt gehouden met hoe het menselijk gehoor werkt en de daarbij horende ‘Head-Related Transfer Function’ (HRTF). De HRTF omvat alles wat het menselijk hoofd doet met geluid, voordat het daadwerkelijk je hersenen bereikt. De vorm en het materiaal van het menselijk hoofd en oren, plus de afstand tussen beide oren hebben invloed op hoe geluid uiteindelijk klinkt. Omdat elk individu een uniek hoofd heeft is de HRTF per persoon anders. Meestal wordt er een gemiddelde gebruikt, maar er zijn technieken in opkomst die dit per persoon meten.
Voorbeeld: Een geluid komt van links en bereikt eerst direct jouw linkeroor en even later indirect jouw rechteroor. Het geluid moet langs de vorm van jouw hoofd voordat het je rechter oor kan bereiken. Het geluid wat je rechteroor waarneemt zal relatief zachter zijn dan wat je linkeroor waarneemt. Daarnaast zal jouw hoofd als een filter werken en de klank van het geluid aanpassen. Ook is de vorm van jouw oorschelp een belangrijke factor in het waarnemen van geluid. Een geluid weerkaatst op een bepaalde manier in je oorschelp voordat je het waarneemt. Hoe het geluid weerkaatst is afhankelijk van waar het vandaan komt.
Je kunt dus zeggen dat binaurale audio een logische en geloofwaardige manier is om geluid te representeren. Het afluisteren van binaurale audio is in vergelijking met surround-sound veel praktischer: je hebt alleen een koptelefoon nodig. Binaurale opnames gaan weer een stapje verder in de richting van echtheid en de meeslependheid van audio. Een nadeel is dat deze stereo reproducties gefixeerd zijn en niet met jou mee bewegen. Met 3D audio beweegt dit wél mee en komen we op een heel nieuw niveau in de audio wereld.
A. Johanson – October, Halfway July in binauraal
luister met koptelefoon
3D Audio
Bij 3D audio wordt er een fictieve wereld om jou heen gecreëerd waarbij verschillende geluidsbronnen als ‘object’ in de ruimte kunnen worden gezet. In 3D audio verandert het geluidsbeeld op basis van jouw kijk- en luisterrichting. Dit gebeurt allemaal in het digitale domein en er zijn verschillende methodes om dit voor elkaar te krijgen. Ik leg er twee aan je voor en ik leg je uit wat het verschil tussen 3D audio en 8D audio is.
A. Johanson – October, Halfway July in ambisonics
luister met koptelefoon, werkt in Google Chrome of in de YouTube app
Ambisonics
Ambisonics is een 3D audio formaat dat opgebouwd is uit vier of meerdere kanalen. Dit audio formaat produceert een binauraal geluidsbeeld op basis van jouw kijk-/luisterrichting. Het werkt dus het beste met een koptelefoon op. Ambisonics wordt standaard gebruikt bij 360 graden films op YouTube en Facebook. 360 graden films zijn lineaire films waarbij je als publiek volledig rond kan kijken. Wanneer je je tijdens het kijken van de film omdraait, verandert zowel het visuele- als het geluidsbeeld. Je hoort het geluid uit dezelfde richting als waar je naar toe kijkt.
In het afgelopen decennium zijn Facebook, YouTube en Unity (e.a.) ambisonics gaan ondersteunen waardoor de populariteit van dit audio formaat snel is toegenomen. Unity is een programmeeromgeving voor voornamelijk games waarbij het ambisonics beeld real-time kan worden aangepast. Dus afhankelijk van wat er in de game gebeurt wordt een ambisonics geluid geproduceerd. Dit creëert weer een binauraal geluidsbeeld voor op jouw koptelefoon.
Dolby Atmos
Een stapje verder is Dolby Atmos. Dit principe lijkt op ambisonics, maar het geluid past zich aan op waar het wordt afgespeeld. Als geluidsmixer geef je het Dolby Atmos formaat de informatie mee waar een bepaald geluid vandaan moet komen. Idealiter speel je deze audio af op oneindig veel speakers om je heen. Links, rechts, achter, voor en zelfs boven je. Wil je bijvoorbeeld een overvliegend vliegtuig laten klinken, dan hoor je deze ook door de bovenste speakers.
Het grote voordeel van Dolby Atmos is dat het een adaptief audioformaat is. Het werkt met oneindig veel speakers om je heen, maar ook in de bioscoop met een beperkt aantal speakers, of zelfs op de Apple AirPods Pro. Dolby Atmos wordt langzaam maar zeker als standaard gehanteerd voor verschillende streamingdiensten. Denk aan Netflix, AppleTV+, enzovoorts. Daarnaast zijn er ook een aantal muziekstreamingdiensten die 3D muziek aanbieden. Dit zijn muziekproducties die worden aangeboden in Dolby Atmos, al is het aanbod hiervan nog beperkt.
Wat valt onder de term 3D audio?
Waar de term 3D audio voor staat is niet vastgelegd. Het wordt op verschillende manieren gebruikt. Bij Lab³ vinden we dat je geluid pas ‘3D’ kunt noemen wanneer het geluidsbeeld daadwerkelijk verandert bij het draaien van je hoofd. Anderen noemen een binaurale opname al 3D. Een trotse eigenaar van een surround-sound set in zijn woonkamer noemt dit waarschijnlijk ook 3D, omdat het nou eenmaal helemaal om je heen klinkt.
Ik maak de vergelijking met beeld: je kunt een ultra-realistische tweedimensionale tekening maken van een banaan die zo op het oog 3D lijkt; je hebt het gevoel dat je de banaan kunt oppakken. Maar op het moment dat je de tekening omdraait, draait het perspectief mee en zie je dus dat het een 2D tekening is. Als je een echte (3D) banaan zou omdraaien, dan krijg je ook de andere kant te zien. Hierbij is de 2D tekening het equivalent van binauraal en de echte banaan het equivalent van 3D audio.
Om die verwarring te voorkomen noemen we bij Lab³ de audioformaten die zich aanpassen aan jouw kijk- en luisterrichting (zoals Ambisonics en Dolby Atmos) ‘Adaptief 3D audio’.
8D audio, wat is dat dan?
Er zijn al een aantal voorbeelden die online circuleren met de term ‘8D’ in de titel. Een bekend voorbeeld is een nummer van Billie Eilish dat nu te luisteren is in 8D. Wat is dit en waarom klinkt dit zo cool? Bij muziek in 8D hoor je eigenlijk niks anders dan een muziekproductie die vertaald is naar een binauraal geluidsbeeld. Meestal is hier nog een realistische, binaurale galm aan toegevoegd. Door het nummer heen wordt de muziek in zijn geheel ‘om je heen’ gepand in het binaurale geluidsbeeld. Het klinkt meestal alsof je in een grote hal staat waar de muziek van een grote speakerinstallatie komt. Jij staat in het midden van deze hal en de speakerinstallatie draait langzaam om je heen. Dit effect is gaaf en het voelt heel bijzonder dat dit geluid zomaar uit jouw koptelefoon komt. Toch is 8D audio niks anders dan binaurale audio en in die zin géén adaptief 3D audio. In feite is het net zo bijzonder en echt als het strand dat je in een grote schelp kan horen. In een schelp zit geen compleet strand, maar het klinkt wel een beetje zo.
A. Johanson – October, Halfway July in “8D“
luister met koptelefoon
SOORT | CATEGORIE | AANTAL KANALEN |
Mono | Mono | 1 |
Stereo | Stereo | 2 |
Surround | Surround | 6 of 8 |
Binauraal | Stereo (houdt rekening met HRTF) | 2 |
8D audio | Stereo (ronddraaiend binauraal) | 2 |
Ambisonics | Adaptief 3D | 4, 8 of 16 |
Dolby Atmos | Adaptief 3D (vertaalt zich naar waar het op af wordt gespeeld) | 128 |
Conclusie
We zien dat de ontwikkelingen in de technologie een podium bieden voor steeds natuurgetrouwer klinkende audio. Digitale audio kan steeds meer lijken op hoe wij in de natuur geluid waarnemen. Dat houdt in dat er rekening wordt gehouden met hoe je als mens (en als individu) geluid waarneemt. Dit wordt gedaan doormiddel van de eerder genoemde HRTF.
Vanaf het moment dat men audio kon reproduceren is er een drang geweest om de kwaliteit ervan te verbeteren. We willen graag dat als er in het geluid iets om ons heen beweegt, we dit ook zo ervaren. Momenteel is stereo-audio nog steeds het populairste formaat voor de meeste toepassingen, maar 3D audio is steeds toegankelijker en daarmee flink in populariteit aan het toenemen. Waar je bij 3D beeld nu nog dat bekende brilletje op moet zetten, is 3D audio af te spelen op iets wat je waarschijnlijk al in huis hebt. De wondere wereld van 3D audio, we zitten er middenin!
Deel II: wat kun je met 3D audio?
In Deel II ga ik wat dieper in op de materie. Want, wat kun je er nou eigenlijk mee? Deel II is binnenkort te lezen op de website van Lab³.
Wist je dat A. Johanson de artiestennaam is van laborant Aike? Ben je benieuwd naar nog meer mooie nummers van A. Johanson? Luister ‘October, Halfway July’ en anderen op Spotify.
- Røde, The Beginner’s Guide To Ambisonics
- Torick, E. Highlights in the history of multichannel sound. Journal of the Audio Engineering Society (1998)
- Yue, C & Planque, T. 3-D Ambisonics Experience for Virtual Reality (2017)
- Scientific American, The Telephone at the Paris Opera (1881)