Na co dzień korzystamy z komputerów, które jakby nie patrzeć są cyfrowe i dźwięk, który przechowujemy na dysku twardym nie może być inny niż cyfrowy. Na co dzień jednak nie zastanawiamy się, na czym polega dźwięk cyfrowy. Dlatego też, aby uniknąć nieporozumień wynikających z niewiedzy, zachęcam do zapoznania się z tym tekstem. Dowiesz się o najważniejszych parametrach plików audio WAV, takich jak częstotliwość i liczba bitów
Aby zrozumieć różnicę w dźwięku analogowym, a cyfrowym, przytoczę dwa obrazki. Pierwszy z nich, który widać poniżej, przedstawia naturalną falę dźwiękową w kształcie sinusoidy. Jak widać jest to idealna sinusoida, to znaczy przebiega płynnie, ma całkowicie okrągły kształt bez żadnych kantów.
Rys. 1. Fala sinusoidalna.
Taką sinusoidalną falę z reguły usłyszymy jako jednostajny dźwięk chyba, że będzie to sinusoida na odpowiednio niskich częstotliwościach, kiedy okres (czas całego jednego cyklu sinusoidy – zobacz obrazek wyżej) będzie trwać dłużej i wtedy ludzkie ucho będzie w stanie wyłapać zachodzącą zmianę, którą usłyszymy w postaci wibracji. Przy wysokich częstotliwościach okres trwa tak krótko, że nie jesteśmy w stanie wyłapać różnicy – słyszymy jednostajny dźwięk. Np dla sinusoidy o częstotliwości 1000 hz czas trwania jednego okresu będzie wynosić poniżej jednej tysięcznej sekundy. Przy okazji napomnę, że im okres fali jest krótszy, tym dźwięk jest wyższy, a im okres jest dłuższy, tym dźwięk jest niższy.
Natura naturą, ale komputer myśli w systemie binarnym, czyli w systemie zer i jedynek. W jaki więc sposób maszyna zapisze falę sinusoidalną, która jest idealnie okrągła? Jeżeli komputer poświęci na to 1 bit pamięci, to owa fala zostanie tak zniekształcona:
Rys. 2. Ta sama fala sinusoidalna – tym razem zapisana przez komputer w drodze samplingu 1-bitowego.
Są tutaj jedynie 2 możliwe stany: ‘1’ oraz ‘-1’.
Aby fala sinusoidalna czy jakikolwiek inny dźwięk był zapisany na komputerze z większą precyzją, potrzebujemy skorzystać z większej rozdzielczości. To tak samo, jak z grafiką na komputerze. Możemy mieć kolory w 4 bitach i obraz będzie bardzo zdeformowany, a możemy mieć ustawione kolory w 16 bitach czy 32 bitach i obraz będzie wyglądać w porządku.
Przypatrzmy się, jak fala sinusoidalna będzie wyglądać przy rozdzielczość 2-bitowej. Daje nam ona 4 możliwe stany (22 = 4):
Rys. 3. Jeszcze raz fala sinusoidalna – teraz w rozdzielczości dwubitowej.
Jest znaczna poprawa, natomiast jeszcze sporo brakuje, by wykres wyglądał tak, jak jest zaznaczone szarymi kropkami. Gdybyśmy zapisali dźwięk w postaci 8-bit, mielibyśmy już 256 możliwych poziomów (schodków). Natomiast w dzisiejszych czasach standardem jest 16 bit, co daje nam aż 65536 możliwości… Jak w takim razie wyglądałaby sinusoida zapisana w rozdzielczości 16 bit, która potocznie mówiąc da nam 65536 „schodków”? Oko ludzkie nie zobaczy poszczególnych ‘schodków’, lecz zobaczy okrągłą sinusoidę, a ucho przeciętnego człowieka usłyszy naturalny dźwięk.
Jeżeli zajmujesz się amatorsko nagrywaniem, obróbką dźwięku, bądź produkcją muzyczną, 16 bit w zupełności Tobie wystarczy – Płyty audio posiadają 16 bit. Obecnie oczywiście jest możliwe stosowanie 24-bitowego dźwięku, z którym możemy spotkać się np. na płytach DVD. Tak wysoka rozdzielczość jest zalecana przy profesjonalnym nagrywaniu, bądź profesjonalnej produkcji muzycznej.
Na początku tego artykułu napisałem, że objaśnię dwie najważniejsze cechy dźwięku cyfrowego w formacie WAV. O ile omówiliśmy bity odpowiedzialne za dynamikę dźwięku („schodki”), nic nie wspomniałem o częstotliwości próbkowania, dzięki której komputer opisuje zmienność dźwięku w czasie. Jednostką częstotliwości jest 1 HZ, a 1 HZ odpowiada jednej sekundzie. 1 Hz oznacza, że komputer co jedną sekundę będzie pobierał informację o dźwięku. Inaczej pisząc, komputer co jedną sekundę pobiera próbkę stanu fali dźwiękowej. Stąd też określenie ‘częstotliwość próbkowania’ – częstość pobierania próbek.
Rys. 4. Fala sinusoidalna próbkowana z częstotliwością 1 Hz.
W efekcie uzyskamy następujący zapis:
Rys. 5. Ta sama fala po próbkowaniu.
Ten rysunek znowu przedstawia mocno zniekształconą falę dźwiękową, przypominającą dźwięk 1-bitowy (mimo że zastosowaliśmy 16-bitów). Widać tutaj znaczenie właściwego wyboru częstotliwości próbkowania. Im będzie ona wyższa, tym lepiej dla jakości dźwięku. Dla przykładu obierzmy częstotliwość 8 Hz (8 próbek na sekundę):
Rys. 6. Fala sinusoidalna – dźwięk 16-bitowy, częstotliwość próbkowania 8 Hz.
Widzimy poprawę natomiast ten stan jest bardzo daleki od ‘ideału’, który ma oszukać nasze uszy. Zalecane jest zapisywanie dźwięku w 16 bit i 44100 Hz – jakość płyty CD.
Mam nadzieję, że temat rozdzielczości [BIT] (oś pionowa – dynamika) oraz częstotliwości próbkowania [HZ] (oś pozioma – czas) został omówiony w sposób zrozumiały dla Ciebie.
Wykresy zapożyczone z: