Psychoacoustics
Psychoacoustics kombinerar studien av akustik och auditiv fysiologi för att bestämma förhållandet mellan ett ljuds egenskaper och den auditiva känslan som det framkallar. Loudness är det subjektiva måttet på upplevd ljudintensitet. Denna känsla, som huvudsakligen är relaterad till ljudtryck, gör att vi kan skilja mellan höga och mjuka ljud.
Loundness: egenskaper
absolut hörseltröskel
Den absoluta hörseltröskeln är den lägsta nivån av ljudtryck som krävs för att ge en hörselkänsla i en tyst miljö. Denna tröskel varierar från person till person och för varje ljudfrekvens.
Obehagsnivå
obehagsnivån motsvarar den lägsta ljudtrycksnivå som krävs för att ge en känsla av obehag. Det varierar från person till person och för varje ljudfrekvens.
normala tröskelvärden
normala absoluta och obehagströsklar bestäms av de genomsnittliga tröskelvärdena som registrerats från ett stort antal normala hörselpersoner.
Hörselfält
vid hörbara frekvenser bestämmer området mellan den absoluta hörselgränsen och obehagströskeln en persons hörselfält. Det dynamiska området för detta fält är avståndet mellan de två tröskelvärdena.
det mänskliga hörselfältet sträcker sig från ett ljudtryck på 0,02 mPa (0 dB SPL) till 20 Pa (120 dB SPL). Detta gäller för frekvenser mellan 0,5 och 8 kHz, vilket örat är mest känsligt för. Lägre och högre frekvenser kräver en mycket större ljudtrycksnivå för att nå hörselgränsen, och frekvenser närmare hörselfältets kant har mindre dynamiskt omfång.
Obs: alla frekvenser under 20 Hz är kvalificerade som ’infrasounds’, även om vissa djur (som mol) kan uppfatta ’ljud’ så lågt som några få Hertz: deras hörselområde sträcker sig en oktav eller två lägre än hos människor. På liknande sätt kallas ljud som är över 20 kHz ultraljud, även om hundar kan höra ljud upp till 40 kHz och fladdermöss en imponerande 160 kHz, vilket motsvarar två eller tre oktaver högre än hos människor.
equal-loudness contours
En Equal-loudness contour visar alla rena toner som ger samma loudness sensation i funktion av frekvens (enligt definitionen i den internationella standarden ISO 226:2003) .
den här grafen representerar de genomsnittliga likhöghetskonturerna för 50 normalhörande ungdomar, inspelade i en anekoisk kammare med bilateral freefield-ljudpresentation. Måttenheten för dessa konturer är phon, vilket motsvarar ljudnivån (i dB SPL) vid 1 khz. Till exempel, en 1 kHz ren ton presenteras vid 20 dB SPL kommer att vara lika med 20 phons, liksom en 100 Hz ren ton presenteras vid 43 dB SPL.
Obs: phon är bara lika med dB SPL för ett 1 kHz ljud.
Sones
phon är en enhet med lika känsla och inte av känsla i sig. Därför används också en andra enhet: sonen
För nivåer över 40 phons, och för medelfrekvenser är Sonen kopplad till phon med ekvationen:
Sone=2(phon-40)/10. Därför är vid 1 kHz ett ljud på 40 phons värt 2 (40-40) / 10=1 son.
Loudness utvecklas olika beroende på frekvens. Ljudstyrkan för ett 0,1 kHz-ljud ökar mycket snabbare än ljud på 1 och 8 kHz. Detta översätter tanken att det dynamiska området vid denna frekvens är mindre än det för ett 1 kHz eller 8 kHZ ljud (se ovan ’Hörselfält’).
differentialtröskeln eller bara märkbar skillnad (jnd)
jnd är den minsta fysiska intensitetsvariationen som orsakar en förändring i ljudstyrkan. Det är beroende av både ljudets intensitet och frekvens. Vid högre intensiteter kan örat skilja intensitetsskillnad på 0,4 dB. Det uppskattas att det finns cirka 150 nivåer av ljudstyrka.
ljudstyrka och kritiska band
om ett komplext ljud som består av två rena toner med olika men nära frekvenser presenteras mono, förblir ljudstyrkan densamma så länge gapet mellan dessa frekvenser är mindre än bredden på det kritiska bandet. Så snart frekvensgapet överstiger bredden på det kritiska bandet ökar ljudstyrkan.
kritiska band kan assimileras till ett batteri av bandpassfilter som har avstängningsfrekvenser som är variabla längs cochlea men fixerade jämfört med ljudets frekvenssammansättning.
maskering
uppfattningen av olika komponenter i ett komplext ljud sker inte oberoende. Faktum är att uppfattningen av vissa frekvenser av fysiologiska skäl hindrar uppfattningen av andra komponenter: Detta kallas maskering.
denna figur visar hörseltrösklar erhållna utan maskering i grönt och med en bredbandsmasker (från 1100 till 1300 Hz) över olika intensitetsnivåer.
det röda spåret visar modifieringen av hörseltrösklar erhållna med en ljudnivå på 60 dB SPL. Till exempel hörs en ren ton på 1000 Hz endast från 45 dB SPL, istället för 3 dB i avsaknad av en ljudmaskare.
denna graf visar också att maskeringseffekten av bruset ökar med intensitet och det har större effekt för högre frekvenser. Med andra ord maskerar låga frekvenser högre frekvenser lättare än tvärtom.
en annan form av maskering finns också. Känd som’ informativ maskering’, detta är modifieringen av uppfattningen av ett ljuds intensitet på central nivå. Till exempel, när en ren ton presenteras för ett öra, och en bullermaskare till den andra, förändrar den centrala effekten av bullermaskaren ljudstyrkan hos den rena tonen. På detta sätt sker maskering även när maskaren presenteras för det andra örat.
andra faktorer som påverkar ljudstyrkan
varaktighet
ljudstyrkan ökar till ett kritiskt värde mellan 50 och 400 ms innan den minskar något.
förutsägbarhet
när en lyssnare förväntar sig ett högt ljud är dess ljudstyrka lägre än om ljudet inte förväntas.
Stapedial reflex
denna reflex uppträder huvudsakligen för korta ljud av mellanfrekvens som presenteras över 80 dB. Det verkar genom att stelna den ossikulära kedjan, vilket resulterar i en dämpning av ljudvibrationen och därmed en minskning av ljudstyrkan. Denna reflex kan dock drabbas av trötthet.
trötthet
efter att örat har utsatts för ett ljud som är för intensivt kan en ökning av hörseltröskeln uppstå på grund av nervfibertrötthet. Detta är uppenbart när du lämnar en nattklubb eller efter långvarig användning av personliga MP3-spelare.