Binaural innspilling - Binaural recording

Neumann KU 100 mikrofon brukes til å ta opp binaural lyd
Lautsprecherwiedergabe.svg
FrequenzgangDruckempfänger.svg
Lokalisation.svg
Lautsprecherwiedergabe-Göttingen.svg

Binaural innspilling er en metode for innspilling av lyd som bruker to mikrofoner , arrangert med den hensikt å skape en 3-D stereolydsensasjon for lytteren av å faktisk være i rommet med utøverne eller instrumentene. Denne effekten er ofte skapt ved hjelp av en teknikk kjent som dummyhodetopptak , der et mannequinhode er utstyrt med en mikrofon i hvert øre. Binaural innspilling er ment for avspilling med hodetelefoner og vil ikke oversettes ordentlig over stereohøyttalere. Denne ideen om en tredimensjonal eller "intern" lydform har også oversatt til nyttig teknologiutvikling på mange ting, for eksempel stetoskoper som lager "in-head" akustikk og IMAX-filmer som kan skape en tredimensjonal akustisk opplevelse.

Begrepet "binaural" har ofte blitt forvirret som et synonym for ordet " stereo ", delvis på grunn av systematisk misbruk på midten av 1950-tallet av platebransjen , som en markedsføring moteord . Konvensjonelle stereoopptak spiller ingen rolle i naturlig øreavstand eller " hodeskygge " av hode og ører, siden disse tingene skjer naturlig når en person lytter, og det genererer interaurale tidsforskjeller (ITD) og interaurale nivåforskjeller (ILD) som er spesifikke for deres lytteposisjon. . Fordi høyttaler-crosstalk med konvensjonell stereo forstyrrer binaural reproduksjon (dvs. fordi lyden fra hver kanals høyttaler høres av begge ører i stedet for bare av øret på den tilsvarende siden, som det ville være tilfellet med hodetelefoner), er det nødvendig med begge hodetelefonene , eller crosstalk -kansellering av signaler beregnet på høyttalere som Ambiophonics er påkrevd. For å lytte med konvensjonelle høyttaler-stereo, eller MP3-spillere , en pinna kan-mindre dummy head være å foretrekke for kvasi-binaural opptak som sfæren mikrofon eller Ambiophone. Som en generell regel, for ekte binaurale resultater, bør en lydopptaks- og reproduksjonssystemkjede, fra mikrofonen til lytterens hjerne, inneholde ett og bare ett sett med pinnae (helst lytterens eget), og en hodeskygge.

Historie

Historien om binaural innspilling går tilbake til 1881. Den første binaurale enheten, théâtrofonen , ble oppfunnet av Clément Ader . Den besto av en rekke karbontelefonmikrofoner installert langs forkanten av Opera Garnier . Signalet ble sendt til abonnenter gjennom telefonsystemet , og krevde at de hadde på seg et spesielt headset, som hadde en liten høyttaler for hvert øre.

I 1978 ga Lou Reed ut den første kommersielt produserte binaural pop -platen, Street Hassle , en kombinasjon av live- og studioopptak.

Binaural ble i bakgrunnen på grunn av det dyre, spesialiserte utstyret som kreves for kvalitetsopptak, og kravet om hodetelefoner for riktig reproduksjon. Spesielt i før- Walkman- dager, betraktet de fleste forbrukere hodetelefoner som en ulempe, og var bare interessert i opptak som kunne lyttes til på et stereoanlegg eller i biler. Til slutt har typene ting som kan registreres ikke en typisk høy markedsverdi. Studioopptak vil ha liten fordel av å bruke et binaural oppsett, utover naturlig kryss-feed, da studioets romlige kvalitet ikke ville være veldig dynamisk og interessant. Opptak som er av interesse er live orkesteropptredener og omgivende "miljø" -opptak av bylyder, natur og andre slike emner.

Den moderne tiden har opplevd en økning i interessen for binaural, delvis på grunn av den utbredte tilgjengeligheten av hodetelefoner, billigere opptaksmetoder og den generelle økte kommersielle interessen for 360 ° lydteknologi.

ASMR -fellesskapet på nettet er en annen bevegelse som har brukt mye binaurale innspillinger.

Fremveksten av Dolby Atmos og annen 360 ° lydfilmteknologi i forhold til kommersiell underholdning har sett en økning i popularitet for bruk av binaural simulering. Dette er med det formål å tilpasse 360 ​​° lydsporet for hodetelefoner og øretelefoner fullt ut. Brukere kan tilsynelatende se 360 ​​° -filmer og -musikk med den oppslukende surroundlyden som forblir intakt til tross for at de bare bruker de to hodetelefonhøyttalerne. Spesielt blir alle 360 ​​° flerkanals lydspor automatisk konvertert til simulert binaural lyd når det lyttes til med hodetelefoner.

I 2013 brukte David Cittadini , sammen med Andrew Hills, binaural innspillingsteknikker og teknologier på den australske kortfilmen The Blind Passenger . 29. august 2013 og 31. august 2013 spilte de inn The Metropolitan Orchestra ved bruk av binaural innspillingsteknikker, den første innspillingen av et orkester i Australia ved bruk av binaural innspillingsteknikker.

I 2017 ble Doctor Who- episoden Knock Knock utgitt på BBC iPlayer, og senere på DVD og Blu-Ray, med et valgfritt binaural lydspor. Episoden er sterkt avhengig av ideen om at et hus har parasittiske skapninger som bor i treverket, og den binaurale lyden brukes til å spille av de knirkende og sprutende lydene, i tillegg til andre effekter som torden og både diegetisk og ikke-diegetisk musikk.

I 2017 brukte Ninja Theory binaural innspillingsteknikker for videospillet Hellblade: Senua's Sacrifice . Dette ble gjort for å fordype spilleren i tankegangen til spillerfiguren, Senua, som er påvirket av psykose og hører stemmer i hodet hennes.

I 2020 ga den britiske filmskaperen Nicholas Cooley ut kortfilmen Rear Mirror , som var den første binaurale lydfilmen som ble vist på en video on demand-plattform ( Amazon Prime Video ).

I 2021 ga den britiske singer-songwriteren Anna Aarons ut singelen A Perfect Day i binaural format.

Opptaksteknikker

Med en enkel opptaksmetode er to mikrofoner plassert 18 cm fra hverandre vendt fra hverandre. Denne metoden vil ikke skape en ekte binaural opptak. Avstanden og plasseringen er omtrent omtrent posisjonen til et gjennomsnittlig menneskes øreganger , men det Det er ikke alt som trengs. Mer detaljerte teknikker finnes i ferdigpakkede former. En typisk binaural opptaksenhet har to mikrofoner i høy kvalitet som er montert i et dummyhode, innfelt i øreformede former for å fange alle lydfrekvensjusteringene fullt ut ( kjent som hoderelaterte overføringsfunksjoner (HRTFs) i det psykoakustiske forskningsmiljøet) som skjer naturlig når lyd vikles rundt det menneskelige hode og er "formet" av formen på det ytre og indre øret .

Opptaksteknikker

Teknikken for binaural gjenopptak er enkel, men har ikke blitt godt etablert. Den følger de samme prinsippene for Worldizing, en teknikk som brukes av filmlyddesignere der lyd spilles over en høyttaler på et sted i virkeligheten og deretter spilles inn på nytt, og tar med seg alle aspekter og egenskaper ved det virkelige miljøet med det .

Ved å bruke plass til å manipulere en lyd og deretter ta den opp på nytt har den blitt gjort gjennom bruk av ekkokamre i innspillingsstudier i mange år. I 1959 ble et ekkokammer berømt brukt av Irving Townsend under etterproduksjonsprosessen av Miles Davis 'album fra 1959, Kind of Blue . "[effekten av ekkokammeret på Kind of Blue er] bare litt søtning. På 30th Street ble det kjørt en linje fra miksekonsollen ned i et lavt tak, betongkjellerrom - omtrent 12 x 15 fot i størrelse - hvor vi setter opp en høyttaler og en god omnidireksjonell mikrofon. "

Ved binaural re-innspilling brukes en binaural mikrofon til å ta opp innhold som spilles av over et flerkanals høyttaleroppsett. Det binaurale hodet, eller mikrofonen, tar derfor teoretisk sett opptak av hvordan mennesker vil høre innhold på flere kanaler. Lydsporet til en film, for eksempel, vil bli spilt inn av den binaurale mikrofonen med alle miljømessige tegn på det gitte stedet, samt etterklang, inkludert de som vanligvis skapes av den menneskelige torsoen (forutsatt at en HATS -modell brukes). Denne metoden, som visse binaurale opptak gjort med en Neumann KU 100.

Ved hjelp av en MR -skanner samlet Brüel & Kjær og DTU geometriene til en stor befolkning av menneskelige ører. Ved å fange hele øregangens geometri, inkludert den benete delen ved siden av trommehinnen, ble disse dataene etterbehandlet for å bestemme den gjennomsnittlige menneskelige øregangens geometri. Basert på dette skaper høyfrekvent hode og torso simulator (HATS) type 5128 en veldig realistisk gjengivelse av de akustiske egenskapene, som dekker hele det hørbare frekvensområdet (opptil 20 kHz).

Avspilling

De viktigste komponentene som forårsaker 3D -stereoeffekten: timing, lydstyrke og klang . Lyd fra venstre kommer først til venstre øre og mikrosekunder senere til høyre øre. Hodet demper lyden og gjør lyden høyere til venstre øre enn til høyre øre. Hodet og andre deler av kroppen avleder lyden og endrer dermed lydens frekvensspekter underveis fra venstre til høyre side. Den menneskelige hjerne tolker disse forskjellene og forårsaker automatisk en følelse av et bestemt sted for lyden til den lytter.

Det er noen komplikasjoner med avspilling av binaurale opptak via hodetelefoner. Lyden som blir tatt opp av en mikrofon plassert i eller ved inngangen til ørekanalen har et frekvensspekter som er veldig forskjellig fra det som ville bli plukket opp av en frittstående mikrofon. Diffusfeltets hodeoverføringsfunksjon (HRTF), det vil si frekvensresponsen på trommehinnen i gjennomsnitt for lyder som kommer fra alle mulige retninger, er ganske grotesk, med topper og fall over 10 dB . Spesielt frekvenser fra rundt 2 kHz til 5 kHz forsterkes sterkt sammenlignet med gratis feltpresentasjon.

Kjente problemer

Timbral problemer

I januar 2012 jobbet BBC R&D sammen med BBC Radio 4 for å produsere en binaural produksjon av Private Peaceful , boken av Michael Morpurgo . Den 88 minutter lange dramatiseringen inneholdt en gjengivelse av et 5.1 høyttalersystem, og hadde 4 varianter. Ved starten av hver variant ville lytteren høre en rekke testsignaler som lar deg velge hvilken versjon som gir lytteren den beste romlige opplevelsen. Ved å gjøre dette har BBC R&D akseptert at det vil være variasjoner i suksessen til binaural reproduksjon, og derfor gitt forskjellige blandinger basert på forskjellige sett med HRTF -data. Utgivelsen av Private Peaceful hadde en tilhørende undersøkelse som alle lyttere ble bedt om å fullføre. Den stilte spørsmål om suksessen som binaural reproduksjon hadde med lytterne og hvilken versjon (1-4) lytteren mente var mest vellykket.

Under et intervju med Chris Pike fra BBC R&D i september 2012 uttalte Pike at "du kan få et godt romlig inntrykk, men fargen på timbral er ofte et problem". Spørsmålet om timbralfarging er nevnt i en stor mengde forskning på romlig forbedring og blir noen ganger sett på som resultatet av misbruk eller utilstrekkelig mengde HRTF-data ved for eksempel gjengivelse av binaural lyd, eller det faktum at sluttbrukeren ganske enkelt ikke vil svare godt til de innsamlede HRTF -dataene. Francis Rumsey uttaler i artikkelen fra 2011 "Hvem er hodet egentlig?" at "dårlig implementerte HRTF kan gi opphav til dårlig timbral kvalitet, dårlig eksternalisering og en rekke andre uønskede resultater". Å få HRTF -dataene riktige er et sentralt poeng for å gjøre sluttproduktet til en suksess, og muligens ved å gjøre HRTF -dataene så omfattende som mulig, blir det mindre rom for feil, for eksempel timbrale problemer. HRTF -ene som ble brukt for Private Peaceful ble designet ved å måle impulssvar i et etterklangelig rom, gjort for å fange en følelse av plass, men er ikke veldig ekstern og det er åpenbare timbrale problemer som påpekt av Pike.

Juha Merimaa's fra Sennheiser Research Laboratories i California diskuterer bruk av HRTF -filtre og EQ for å redusere timbrale problemer i sitt papir med tittelen 'Modification of HRTF Filters to Reduce Timbral Effects in Binaural Synthesis, Part2: Individual HRTFs' (2010). Forskningen hans fant at bruk av HRTF -filtre for å redusere timbrale problemer ikke påvirket den romlige lokaliseringen som tidligere ble oppnådd ved bruk av dataene når de ble testet på et panel av lyttere. Dette forklarer at det er måter å redusere effekten av timbrale problemer på lyd som har blitt behandlet med HRTF -data, men dette betyr ytterligere EQ -manipulering av lyden. Hvis denne ruten skal utforskes ytterligere, må forskere være fornøyd med at lyden blir manipulert i store mengder for å oppnå en større følelse av romlig bevissthet, og at denne videre manipulasjonen vil forårsake irreversible endringer i lyden, noe innholdsskapere er kanskje ikke fornøyd med. Det må vurderes hvor mye manipulasjon som er hensiktsmessig og i hvilken grad, om noen, dette vil påvirke sluttbrukernes opplevelse. Det er viktig å vurdere rommet som BRIR- og HRTF -dataene er samlet i, ettersom forskjellige rom vil påvirke sluttresultatene.

Når du registrerer en serie med HRTF-data, kan bare en begrenset mengde målinger tas for distribusjon, og sluttbrukerne må finne de beste resultatene selv. Selvfølgelig vil de beste HRTF-dataene for alle individer være informasjonen som vil bli samlet inn fra deres egen pinna, ikke noe innholdsskapere for mobilapplikasjoner for tiden deltar i. På grunn av dette kan timbrale problemer være uunngåelige ved bruk av ikke-personlige HRTF -data, eller forsøk på å distribuere lyd som allerede har blitt påvirket av romlig manipulasjon. Det kan være at den mest gjennomførbare ruten for å forbedre romlig bevissthet i lyd er å utforske mulighetene for hodesporing eller andre metoder for å samle inn HRTF-data i brukerenden.

Timbral -problemer knyttet til hodetelefoner

Hodetelefonene som brukes av forbrukere vil uunngåelig påvirke sluttresultatene. Et problem rundt bruk av hodetelefoner er det brede kvalitetsspekteret på hodetelefoner på forbrukernivå. Mange mp3 -spillere og nettbrett leveres tradisjonelt med lavbudsjett -øretelefoner, og disse kan forårsake problemer for romlig forbedret lyd.

Ideelle lytteforhold vil mest sannsynlig oppleves med hodetelefoner designet og kalibrert for å gi en så flat frekvensrespons som mulig for å redusere fargen på lyden brukeren lytter til. I de fleste tilfeller har dette ikke virket som et problem for sluttbrukere å foreta en investering i hodetelefoner som lar dem høre lyd nøyaktig hvordan skaperen av innholdet hadde til hensikt, og i stedet fortsette å bruke medfølgende hodetelefoner, eller i noen tilfeller foreta investeringer i hodetelefoner som er godkjent og merket av visse artister. Som tidligere diskutert, er det problemer med timbrale effekter tilstede mens du bruker BRIR- og HRTF -data til å lage romlig forbedret lyd, teknikker som brukes av Chris Pike og BBC R&D. Resultatene opplevde problemer med timbral, og derfor er denne metoden ennå kanskje ikke en vellykket måte å lage romlig forbedret lyd for hodetelefoner på, men disse timbrale problemene oppleves også med valg av hodetelefoner. "[Er timbrale problemer forårsaket av bruk av BRIR- og HRFT -data] noe verre enn forskjellen mellom noen billige hodetelefoner du får med en mp3 -spiller mot noen fine Sennheisers".

Vanlige binaurale mikrofoner

Brüel & Kjær Head and Torso Simulatorer (HATS)

Designet for bruk på stedet elektroakustiske tester på for eksempel telefonrør, hodesett, lydkonferanseapparater, mikrofoner, hodetelefoner, høreapparater og hørselsvern. I motsetning til andre modeller er dette hode- og torso -simulatorer (HATS) designet for å gjenskape menneskelig hørsel så tett som mulig.

Brüel & Kjær hode og torso simulator (HATS)

Neumann KU 100

Neumann KU 100 er en dummyhodet mikrofon som brukes til å ta opp i binaural stereo. "Det ligner det menneskelige hode og har to mikrofonkapsler innebygd i ørene" . Neumann er en vanlig binaural mikrofon og funksjoner som brukes av BBC R & D -team.

GRAS Head & Torso Simulator KEMAR (HATS)

KEMAR ble opprinnelig oppfunnet i samarbeid med den audiologiske industrien for bruk av høreapparatutvikling, og er fremdeles de facto -standarden for denne bransjen - men siden har bruken av KEMAR spredt seg til en rekke andre bransjer som: telekommunikasjon, hørselvern test, bilutvikling etc. KEMAR er designet ved hjelp av stor statistisk forskning for å være så nær gjennomsnittlige menneskelige målinger som mulig. KEMAR -modellen er også den eneste mikrofonen på denne listen som har en torso -modell. Torso -refleksjoner har blitt sett på å være en betydelig bidragsyter til å lage en vellykket binaural innspilling.

Core Sound Binaural (CSB) mikrofonsett

CSB ble introdusert i 1989 og var det første binaurale mikrofonsettet med klips. De produseres fortsatt i dag, tretti år senere, sammen med Low Cost Binaural (LCB) mikrofonsett og High End Binaural (HEB) mikrofonsett ved bruk av kapsler i DPA 4060-serien. De bruker brukerens eget hode og ører, så HRTF er riktig, i motsetning til binaural hoder som bruker en generisk pinna, hode og skuldre.

3Dio rekkevidde

3Dio -serien med binaurale mikrofoner har to øreformer av silikon (pinna) adskilt med 19 centimeter (7,5 tommer) - nær gjennomsnittlig avstand mellom menneskelige ører. Mikrofoner er plassert inne i ørene, fra Primo EM172 i Free Space og Free Space XLR -modellene til DPA 4060s i Pro II -modellen. 3Dio -serien er for eksempel betydelig billigere enn Neumann KU 100, og brukes derfor mer på forbruker- til prosumernivå. Hovedforskjellen med 3Dio -modellene sammenlignet med KEMAR eller KU 100 er fraværet av en hodemodell. 3Dio er helt avhengig av bruk på pinneformer for å oppnå en binaural effekt fra stereoopptaket.

Lyd. Koder Kaan

Kaan er en DIY binaural mikrofon for lydartister. Det er en 3D -trykt modell som gjennomsnittlig menneskelig øregang til gjennomsnittlig resonansfrekvensen som finnes i hvert menneske. På grunn av formfaktoren og vekten gjør det det enkelt å prøve miljøer som ellers ville vært vanskeligere med andre mikrofoner sammen med ADC og opptakere.

Mikrofoner er plassert nøyaktig på trommehinnen ved å bruke Primo EM 172 og 235 mm som gjennomsnittlig avstand mellom øreflipp og øreflipp. Sigmoidformen i kanalen Kaan utgjør i større grad det manglende hodet.

Sound Professionals SP-TFB-2

En bærbar stereomikrofon i øret som øretelefoner, plassert inne i den menneskelige pinna. Denne mikrofonen bruker brukerens pinna for å lage den binaurale effekten.

ZiBionic

ZiBionic One er en binaural mikrofon for ASMR -opptak. De spesifikke formene og størrelsene til en binaural registreringsenhet "påvirker oppførselen - som absorpsjon, overføring, refleksjon, interferens - av akustiske bølger". På samme måte som 3Dio har ZiBionic ingen hodemodell, men hodeskyggen og kroppsformen ble bøyd på en slik måte at ASMR-opptaksteknikk (lydkilde på nært hold, for eksempel hvisking) kan oppdages mer effektivt med de to kapslene inne i øret. formede mikrofoner.

Hooke Vers

Hooke Verse er en relativt nyere binaural enhet som er et in-ear-sett med mikrofoner som kan kobles til opptaksenheter ved hjelp av Bluetooth med tapsfri opptak. Kodeken som er utviklet lar brukeren fange lyd sammen med video. I tillegg bruker enheten mikrofonruter for å redusere vindstøy, et vanlig problem med bærbare enheter og smarttelefoner. "Smarttelefonprodusenter står overfor et dobbelt problem med vindstøy. Ikke bare er turbulens tilstede i luftstrømmen stort sett, men den rektangulære formen på en smarttelefon gir små ulemper rundt seg selv."

Se også

Referanser

Eksterne linker