Parę słów o słuchu, akustyce i ich wzajemnej relacji

W tym rozdziale powiemy sobie kilka słów o rożnych aspektach dźwięku. Pragnę zaznaczyć, że moim celem nie jest ścisłe trzymanie się terminów naukowych. Chciałbym raczej pomóc w  wyobrażeniu sobie czym jest dźwięk  – jak powstaje, jak się przenosi (propaguje) w powietrzu oraz jakie rządzą nim prawa. Powiem również co nieco o tym, jakie cechy i parametry opisują dźwięk.

Poniższe wyjaśnienia nie mają zatem charakteru naukowego a raczej charakter poglądowy i tak powinny zostać odebrane. Ponadto, będę posługiwał się terminami, które mają swoje znaczenie zarówno w mowie potocznej jak i w nomenklaturze naukowej (np “głośność”). Z uwagi na to, że moje artykuły przeznaczone są dla osób nie posiadających fachowej wiedzy z zakresu akustyki będę posługiwał się wspomnianymi pojęciami w ich potocznym rozumieniu.


Uwaga: Dołożyłem wszelkich starań, aby niniejszy artykuł był wolny od błędów i nieścisłości, jednak może się zdarzyć że zawiera on pomyłki. Czytelnik musi zatem sam zdecydować czy zawarte tu informacje mają zastosowanie w jego sytuacji. Opierając się na zawartych tu informacjach podczas podejmowania decyzji, robisz to na własną odpowiedzialność. (patrz regulamin).

Co to jest dźwięk?

Na początek zróbmy sobie pewien podział. Podzielmy cechy (parametry) opisujące dźwięk na: fizyczne i “psychologiczne” (lub psychoakustyczne). Dźwięk bowiem, z perspektywy fizyki, jest falą mechaniczną rozchodzącą się w jakimś ośrodku (powietrzu, wodzie, metalu). Taką falę opisują rożne wielkości fizyczne. Jednak dźwięk to przecież również jakieś “wrażenie” powstające w naszej głowie. I ostatecznie dźwiękiem zwykło się nazywać właśnie to wrażenie, zaś z perspektywy fizyki, mówimy o fali akustycznej. Zatem „dźwięk jest wrażeniem słuchowym powstałym w wyniku propagacji fali akustycznej.”

Zmiana danego parametru fizycznego fali akustycznej pociąga za sobą zmianę wrażenia dźwięku w naszej głowie. Zbyt skomplikowane? Może bardziej się przejaśni jeśli po prostu omówimy sobie te parametry. Na początek skupmy się tylko na dwóch spośród nich.

“Podróżujące” zmiany ciśnienia

No dobrze, ale w końcu co to jest ten dźwięk? Jak powstaje? Co go generuje? Najprostszymi słowami: dźwięk jest generowany przez coś drgającego. Kiedy przyłożysz palec do swojej szyi i powiesz „aaaa” wyczujesz z pewnością delikatne drżenie – to drgają Twoje struny głosowe. Drgania te – w dużym uproszczeniu – są przekazywane powietrzu dokoła twojego gardła i to powietrze również zaczyna “drgać”.

Lecz jak wygląda takie “drganie” powietrza? Dokładany opis tego zjawiska wymagałby dosyć głębokiego wnikania w molekularną strukturę tego ośrodka i wprowadzenia wielu pojęć takich jak “cząstka akustyczna”, molekuła lub “bezwładność”. Nie jest to moim celem – przyjmijmy po prostu zatem że powietrze “uderzone” drganiami Twoich strun głosowych samo zaczyna drgać, a drganie to objawia się w taki sposób, że w powietrzu powstają obszary zmiennego (pulsującego) ciśnienia.

Obszar leżący najbliżej krtani zostaje sprężony drgnięciem krtani w przód. Ten pierwszy sprężony obszar przekazuje następnie to sprężenie kolejnemu obszarowi, tamten następnemu, następnemu i tak dalej. Po chwili (niezmiernie krótkiej chwili!) jednak ten pierwszy obszar (najbliżej krtani) zaczyna się rozprężać (powstaje w nim podciśnienie) i tym razem “pociąga” za sobą kolejne obszary.

Zatem ten pierwszy obszar zaczyna „pulsować” – czyli raz jest w nim nadciśnienie a raz podciśnienie – i pobudza do takiego samego pulsowania obszary sąsiadujące. W ten sposób owo pulsowanie przenosi się od osoby mówiącej “a” aż do jej rozmówcy – podobnie jak puszczone w ruch, przewracające się domino.

Spróbujmy wyobrazić to sobie przy użyciu następującej analogii: Skoro powietrze przy krtani spręża się, to możemy je przyrównać do strzykawki. Powietrze zawarte w strzykawce spręży się jeśli naciśniemy tłoczek. Teraz wyobraźmy sobie, że u wylotu tej strzykawki znajduje się tłoczek kolejnej strzykawki. Ciśnienie z pierwszej strzykawki popychnie tłoczek drugiej, ciśnienie z drugiej popychnie tłoczek trzeciej i tak dalej. Tym sposobem nadciśnienie przeniesie się od pierwszej strzykawki do ostatniej. Po chwili jednak ta pierwsza strzykawka się cofa i zasysa tłoczek drugiej, druga trzeciej itd. Tym sposobem podciśnienie również przenosi się od pierwszej do ostatniej strzykawki.

Aby to jakoś zwizualizować przygotowałem prostą animację. Naciśnij START by ją uruchomić.

Zatem najogólniej fala akustyczna jest zaburzeniem jakiegoś ośrodka w którym „przemieszcza się” raz nadciśnienie raz podciśnienie. Kiedy takie zaburzenie dotrze do naszego ucha, wtedy wprawia w drganie błonę bębenkową. (Nie muszę chyba dodawać, że dzieje się to wszystko znacznie znacznie szybciej niż na animacji)

Całkiem dobrze ilustrują to również poniższe filmiki. Przedstawiono na nich modelową propagacje fali poprzecznej. Pionowe kreski symbolizują sąsiadujące obszary powietrza (lub innego ośrodka) które raz się ściskają a raz rozprężają przez co zaburzenie przesuwa się, czyli propaguje.

I drugi filmik. Tutaj idea jest podobna, czarne kropki to molekuły powietrza sprężane i rozprężane propagacją fali akustycznej.

Częstotliwość fali a wysokość dźwięku

To, jak szybko owe obszary pulsują mówi nam o tym, jaka jest częstotliwość fali akustycznej. Jeśli pulsują szybko, to mówimy że fala ma dużą częstotliwość. Jeśli pulsują wolno oznacza, że fala ma małą częstotliwość. Częstotliwość jest parametrem fizycznym. Tak jak wspomniałem, każdemu parametrowi fizycznemu odpowiada jakiś parametr „psychologiczny” (związany z wrażeniem w naszej głowie). Częstotliwości fali akustycznej, w pewnym uproszczeniu, odpowiada wysokość dźwięku. Jeśli częstotliwość jest duża, oznacza to że dźwięk jest wysoki (np. piszczałka). Jeśli częstotliwość jest mała oznacza to, że wysokość jest mała a dźwięk niski (np. kontrabas).

Ktoś mógłby powiedzieć, że to dziwne, przecież to co nazywamy pulsowaniem samo w sobie zawiera jakąś zmienność, a my przecież słyszymy jednostajny dźwięk bez żadnego pulsowania. Ha! Sęk właśnie w tym że „słyszymy” tak naprawdę oznacza „nasz mózg słyszy”. Zaś nasz mózg wie, że takie a takie pulsowanie (częstotliwość) ma zinterpretować jako taki a taki dźwięk. Innymi słowy, naszego mózgu nie interesuje, że pulsowanie (drganie) jest czymś zmiennym. Jego tylko interesuje z jaką częstotliwością to coś (powietrze, woda) pulsuje (drga). A jak już wie z jaką częstotliwością, to zamienia to na wrażenie wysokości i słyszymy stały dźwięk.

Poziom ciśnienia akustycznego a głośność

W porządku, wiec mamy jakąś częstotliwość (wysokość) ale jest coś jeszcze prawda? Piszczałka może kwilić sobie cichutko, a możne gwizdnąć tak że aż nas zakuje w głowie. Od czego zależy wiec to, czy dźwięk jest głośny czy cichy?

Przy omawianiu częstotliwości powiedzieliśmy, że mówi nam ona o tym jak szybko “pulsują” obszary powietrza. Przez pulsowanie rozumiemy zmieniające się cyklicznie ciśnienie w sąsiadujących ze sobą obszarach powietrza. Natomiast o tym jak bardzo obszary się ściskają i rozprężają – (jak mocno pulsują) mówi nam ciśnienie akustyczne. Poprzez ciśnienie akustyczne rozumiemy te przemieszczające się nad- i podciśnienia. Im większe zmiany ciśnienia w pulsujących obszarach tym dźwięk głośniejszy, im mniejsze tym dźwięk cichszy. Ciśnienie akustyczne mówi nam więc w jakim stopniu ciśnienie wywołane przez falę akustyczną odbiega od ciśnienia atmosferycznego

Jeszcze inaczej: ciśnieniem akustycznym nazywamy zmiany ciśnienia atmosferycznego spowodowane propagacją fali akustycznej. Czyli wszystkie nad- i podciśnienia odbiegające od ciśnienia atmosferycznego a spowodowane rozchodzeniem się dźwięku.

Zatem duże zmiany ciśnienia akustycznego w obrębie danego obszaru – dźwięk głośny, niewielkie zmiany – dźwięk cichy. Więc jeszcze raz dla porządku – ciśnienie akustyczne to lokalnie pulsujące/drgające zmiany ciśnienia atmosferycznego spowodowane rozchodzeniem się (propagacją) fali akustycznej. Jeśli te zmiany są duże (obszar bardzo się rozpręża i bardzo ściska, czyli mocno pulsuje) wtedy mamy dźwięk głośny. Jeśli zmiany są małe (obszar niewiele się rozpręża i niewiele się ściska czyli słabo pulsuje [nie mylić z “wolno”] )- dźwięk cichy.

A zbierając wszystko razem –

Duże zmiany ciśnienia akustycznego i szybkie pulsowanie = duże natężenie i duża częstotliwość = dźwięk głośny i wysoki
Duże zmiany ciśnienia akustycznego i wolne pulsowanie = duże natężenie i mała częstotliwość = dźwięk głośny i niski
Male zmiany ciśnienia akustycznego i szybkie pulsowanie = małe natężenie i duża częstotliwość = dźwięk cichy i wysoki
Male zmiany ciśnienia akustycznego i wolne pulsowanie = małe natężenie i mała częstotliwość = dźwięk cichy i niski.

Na podsumowanie rozważań o generacji i propagacji fali akustycznej proponuję ciekawy filmik stworzony przez wydział akustyki Uniwersytetu Salford. Jeśli niewiele zrozumiałeś z mojej próby opisu praw rządzących generacją i propagacją dźwięku zapamiętaj po prostu tyle: dźwięk jest generowany przez jakąś drgającą powierzchnię. I w zależności od tego czy ta powierzchnia drga (wibruje) mocno, słabo, szybko, czy wolno to takie też drgania będą przekazane powietrzu a co za tym idzie dźwięk jaki usłyszymy będzie głośny, cichy, wysoki lub niski. Pokazuje to poniższy filmik na którym drgania różnych źródeł dźwięku zostały pokazane w zwolnionym tempie:

Jednostki

Jednostką częstotliwości jest 1 Hz – mówi nam o tym ile razy na sekundę pulsują obszary powietrza. Jeśli częstotliwość wynosi 1000 Hz oznacza to, że każdy obszar tej fali akustycznej “zapulsuje” 1000 razy w ciągu jednej sekundy. Innymi słowy tysiąc razy w ciągu jednej sekundy ciśnienie w tym obszarze przejdzie (rozprężając się lub sprężając) przez swoją wartość spoczynkową. Wartością spoczynkową w przypadku rozchodzenia się dźwięku w powietrzu jest po prostu ciśnienie atmosferyczne.

W porządku, z Hertzem nie ma jeszcze takiego kłopotu. Stosunkowo łatwo wyobrazić sobie o co chodzi w tej jednostce. Teraz jednak zmierzymy się z większym niedźwiedziem – z jednostką poziomu ciśnienia akustycznego czyli z decybelem – dB.

W ogólności dB mogą opisywać nie tylko dźwięk. Jakkolowiek wchodzi tu w grę cała obróbka matematyczna – logarytmowanie, całkowanie itd – to upraszaczając ostateczny sens jest taki, że dB pokazują różne wielkości fizyczne w stusunku do jakiejś wielkości odniesienia. Zamiast opisywać coś w jednostkach podstawowych (np. w Pascalach) opisujemy poziom tego czegoś w dB. W naszym przypadku, zamiast ciśnienia akustycznego mamy poziom ciśnienia akustycznego”.

Myślę że to jest dość kluczowe i może często umykać. Zapamiętajmy zatem taką nieco łopatologiczną ideę – skala logarytmiczna (czyli dB) pozwala zamienić coś na poziom tego czegoś.

COŚ (w jednostkach podstawowych) –> POZIOM TEGO CZEGOŚ (w dB)

Tak się złożyło, że z uwagi na szczególne właściwości naszego układu słuchowego, dB w szczególności spodobały się akustykom. Jakie właściwości mam na myśli? Znowu, nie chcę się w to specjalnie zagłębiać, gdyż nie to jest naszym celem. Poza tym musiałbym zacząć wprowadzać mnóstwo wspomnianych zagadnień z matematyki i fizyki. Chcąc utrzymać nasze rozważania w tonie możliwie jak najbardziej przystępnym, ograniczę się do swobodnego opisu pewnych obserwacji, zaś finalne wnioski przyjmiemy na zasadzie aksjomatu czyli “tak jest i już”.

Jak „wymyślono” decybela?

Naukowcy, którzy badali to, w jaki sposób ludzie reagują na dźwięk, poczynili pewne spostrzeżenie. Otóż uruchamiali źródło jakiegoś dźwięku – powiedzmy dzwonek (taki jak w szkole na przerwie) i kazali osobie ocenić jego głośność w pewnej skali (np 1 do 10). Osoba podawała jakąś wartość, następnie naukowcy nie wyłączając pierwszego dzwonka uruchamiali drugi – czyli dwa dzwonki dzwoniły naraz – i znów kazali osobie ocenić dźwięk.

Spodziewać by się można że dołożenie drugiego, takiego samego, dzwonka spowoduje, że badany stwierdzi, że dźwięk jest dwa razy głośniejszy. Tak się jednak nie działo. Co więcej, badani twierdzili, że dźwięk jest zaledwie nieco głośniejszy. Naukowcy doszli w pewnym momencie do wniosku, że nasz układ słuchowy reaguje na dźwięk dosyć ciekawie a mianowicie nieliniowo. Co się kryje za tym terminem? Na przykład właśnie to, że podwojenie parametru fizycznego (przejście z jednego dzwonka na dwa) nie powoduje podwojenia wrażenia głośności u osoby badanej.

Myślę, że na tym etapie wystarczy jeśli przyjmiemy po prostu że łebscy naukowcy zgodzili się co do tego, że najlepiej takie procesy związane z dźwiękiem opisać przy pomocy logarytmów. Uznali tak m.in dlatego że gdybyśmy chcięli wyrażać głośność w jednostkach podstawowych – czyli np. w Pasclach , to musielibyśmy poruszać się w ogromnej rozpiętości liczb. Ciśnienie akustyczne jakie wytwarzają dźwięki głośne jest bowiem milion (albo więcej) razy większe niż ciśnienie akustyczne wytwarzane przez dźwięki ciche. Skala logarytmiczna nam to – matematycznie – ściska i możemy poruszać się w łatwiej wyobrażalnych granicach.

Dynamika prawidłowego słuchu
Relacja pomiędzy ciśnieniem akustycznym a poziomem ciśnienia akustycznego

Przyjmijmy po prostu, że logarytmowanie to jedna z wielu operacji matematycznych, taka jak mnożenie, dzielenie czy pierwiastkowanie i że naukowcy uznali, że do opisu dźwięków właśnie logarytmy nadadzą się najlepiej. Dodajmy jednocześnie, że od razu, rzutem na taśmę wymyślili sobie co będą logarytmować i tu powoli zbliżamy się do istoty decybela.

Jak pamiętamy bowiem z opisu poziomu ciśnienia akustycznego, dźwięk rozchodzi się przy pomocy “pulsujących obszarów zmiennego ciśnienia”. Im większe zmiany ciśnienia tym dźwięk głośniejszy, im mniejsze tym dźwięk cichszy. Naukowcy w końcu znaleźli średnią głośność, którą ci wszyscy ludzie ocenili jako “dźwięk ledwo słyszalny” a następnie zmierzyli ciśnienie akustyczne, jakie powstają przy takim ledwo słyszalnym dźwięku. Tę zmierzoną wartość uznali za wartość odniesienia. Wynik w dB uzyskujemy poprzez podzielenie zmierzonej wartości ciśnienia akustycznego danego dźwięku przez wartość ciśnienia odniesienia i zlogarytmowanie. Wynik tego logarytmowania to właśnie ilość naszych decybeli.

Żeby tak już całkiem nie stronić od matematyki, poniżej podaję wzór (no i oczywiście artykuł będzie wyglądał poważniej 🙂 ):

Lp=10\cdot \log_{10}\left ( \frac{p}{p_{0}} \right )^{2}

gdzie:

Lp – poziom ciśnienia akustycznego SPL (ang. Sound Pressure Level)

p – ciśnienie zmierzone

p_{0} – ciśnienie odniesienia wynoszące 2\cdot 10^{-5}Pa

Jak wspomniałem wyżej, bardzo całą sprawę upraszczając, można powiedzieć że taka operacja zamienia nam “coś” na poziom tego “czegoś”. W tym wypadku zamieniamy ciśnienie akustyczne na poziom ciśnienia akustycznego.

Decybel Decybelowi nie równy czyli dB SPL a dB HL

No dobrze, nagadaliśmy się o tych decybelach i mogłoby się zdawać ze to koniec ale niestety nie. Bo oprócz tego, że nie jest tak znowu łatwo zrozumieć co to jest ten nieszczęsny decybel to, o zgrozo, są jeszcze rożne rodzaje decybeli.

Te decybele o których sobie już powiedzieliśmy są związane ze zmianami ciśnienia akustycznego i są nazywane decybelami SPL (od angielskiego Sound Presure Level – Poziomu Ciśnienia Akustycznego).

Te decybele po prostu mówią nam o zmianach ciśnienia akustycznego (podają suchą fizyczną wartość), jednak nie biorą pod uwagę „czynnika ludzkiego”.

Już wyjaśniam. Zauważono, że nasz słuch nie jest tak samo czuły dla wszystkich częstotliwości. Innymi słowy niektóre częstotliwości (wysokości) dźwięku są przez nas słyszane szybciej niż inne. Co rozumiem przez “szybciej”? Przykładowo. dźwięk o częstotliwości 1000 Hz, osoba dobrze słysząca jest w stanie usłyszeć, gdy Poziom Ciśnienia Akustycznego wynosi ok 5 dB SPL. Ale już np 100 Hz musi mieć poziom ok 30 dB SPL, żebyśmy go w ogóle usłyszeli.

Widać więc, że nasz słuch “preferuje” pewne częstotliwości. Z tego powodu dB SPL nie są dobrą jednostką dla opisu czułości naszego słuchu. Skoro nasz słuch każdą częstotliwość traktuje inaczej ciężko byłoby np. określić niedosłuch używając dB SPL.

Powiem w tym miejscu krótko o tym jak się mierzy niedosłuch (dokładniej ten temat zostanie omówiony w kolejnych wpisach). Wiemy jaka głośność powinna być już słyszalna przez człowieka ze zdrowym słuchem. Jeśli wiec tej głośności nie słyszy, to znaczy, że ma niedosłuch. Gdybyśmy używali dB SPL (nie biorących pod uwagę rożnej czułości słuchu dla rożnych częstotliwości) to musielibyśmy pamiętać: aha, dla 1000 Hz słuch jest w normie przy 5 dB SPL, a dla 100 Hz słuch jest w normie przy 30 dB SPL a jeszcze dla 125 Hz słuch jest w normie przy 45 dB SPL.

Byłoby to kłopotliwe szczególnie w przypadku tworzenia audiogramu. Postanowiono więc zmierzyć te normy dla poszczególnych częstotliwości i każdej z nich przyporządkować wartość 0 [zero] lecz już w innej jednostce, a mianowicie decybelu HL (od angielskiego Hearing Level).

Przykładowo:

0dB HL dla 1000 Hz = 5dB SPL lecz 0 dB HL dla 100 Hz = 30 dB SPL zaś 0dB HL dla 125 Hz = 45 dB SPL.

Najprostszymi słowami: 100 Hz musi być dużo głośniejsze (w dB SPL) niż 1000 Hz, żebyśmy je w ogóle usłyszeli.

Jeszcze inaczej: audiometr (urządzenie służące do pomiaru progu słyszalności – niedosłuchu) “wie”, że kiedy chcemy wygenerować dźwięk o częstotliwości 1000 Hz i głośności 0dB HL, to ma wygenerować dźwięk o częstotliwości 1000 Hz i głośności 5 dB SPL.

To jak próg słyszalności w dB SPL zależy od częstotliwości pokazuje poniższy rysunek:


Próg słyszalnosci w SPL
fot.1; Średni próg słyszalności w dB SPL, w zależności od częstotliwości

Krzywe równej głośności

Jeszcze jednym sposobem na graficzne przedstawienie tej zależności jest tak zwany wykres krzywych równej głośności (izofony). Tutaj niestety wlatuje nam jeszcze jedna jednostka (fon), która jest w jakimś sensie podobna do dB HL, z tym że dB HL opisują mierzalną wartość fizyczną zaś fony opisują wrażenie głośności są więc jednostką taką powiedzmy hmm…”psychofizyczną”. Nie będę za bardzo wnikał w szczegóły ponieważ mam wrażenie że zamydliłbym jeszcze bardziej i tak już dość trudne zagadnienia. Przyjmijmy po prostu że fon to jednostka służąca do tego żeby porównywać ze sobą pod względem głośności dźwięki o różnych częstotliwościach.

Poniżej prezentuję przykładowy wykres krzywych izofonicznych. Na osi poziomej jest częstotliwość w HZ, zaś na osi pionowej Poziom Ciśnienia Akustycznego w dB SPL. Wykres czytamy w następujący sposób. Najniższa linia (krzywa) mówi nam jaką wartość w dB SPL musi mieć dana częstotliwość aby została w ogóle usłyszana przez osobę ze zdrowym słuchem – czyli 0 fonów. Druga od dołu krzywa mówi nam, jaką wartość w dB SPL musi mieć dana częstotliwość aby osoba ze zdrowym słuchem słyszała ją jako 10 fonów. Trzecia krzywa mówi nam, jaką wartość w dB SPL musi mieć dana częstotliwość aby osoba ze zdrowym słuchem słyszała ją jako 20 fonów…i tak dalej.


Izofony - krzywe równej głośności
fot.2; Krzywe równej głośności / Źródło: Wikimedia Commons

Jeśli wszystkie te meandry związane z decybelami wydaja wam się wciąż czarną magią, nie przejmujcie się tym specjalnie. Powinno się wam to lepiej ułożyć w głowie przy następnych rozdziałach – np przy omawianiu audiogramu.

Bibliografia

1) Materiały własne

2) “Dźwięki i fale” – Rufin Makarewicz, Wydawnictwo Naukowe UAM

3) Understanding the Difference Between Sound Pressure Level (SPL) and Hearing Level (HL) in Measuring Hearing Loss – http://hearinglosshelp.com/blog/understanding-the-difference-between-sound-pressure-level-spl-and-hearing-level-hl-in-measuring-hearing-loss/

4) What is a decibel? – http://onlinetonegenerator.com/theory.html

5) Advanced Audiology dB HL Tutorial – http://audprof.com/classroom/tutorials/db/hl/page13.html

6) Hearing thresholds – William A. Yost and Mead C. Killion – https://www.etymotic.com/media/publications/erl-0096-1997.pdf

Źródła zdjęć / Images attribution

fot.1 – oryginał autorstwa / original image by Human_Hearing_Graph.jpg: Daxx4434derivative work: Dani CS [Public domain], via Wikimedia Commons; https://upload.wikimedia.org/wikipedia/commons/2/28/Perceived_Human_Hearing.svg

fot.2 – oryginał autorstwa / original image by By Booby at English Wikibooks [Public domain], via Wikimedia Commons; https://upload.wikimedia.org/wikipedia/commons/c/cd/Isophones.JPG

  • odpowiedz małgorzata ,

    Bardzo ciekawy wpis! filmik o drgających powierzchniach jest rewelacyjny. Pozdrawiam

    • odpowiedz Jola ,

      Bardzo przystępnie opisane, dziękuje!

      Dodaj komentarz