Kodeki

Mp3

MP3 (ang. MPEG-1/2 Audio Layer-3) - standard (format) zapisu dźwięku poddanego stratnej kompresji




MPEG-1 Audio Layer 3

Rozszerzenia pliku .mp3

Typ MIME audio/mpeg

Typ dźwięk

Informacje o standardzie

Format ten został stworzony w roku 1991 w Niemczech we Fraunhofer-Institut für Integrierte Schaltungen.

Przy tworzeniu jego pierwszej implementacji wykorzystywany był m.in. utwór Suzanne Vegi Tom's Diner w celu dostosowania kompresji do brzmienia ludzkiego głosu. Format używa modelu psychoakustycznego. Pliki w tym formacie mają rozszerzenie .mp3.

Same formaty MPEG-1 i 2 są przeznaczone do stratnego kodowania sekwencji wizyjnych (filmu) i opierają się na zmodyfikowanej dyskretnej transformacji cosinusowej. Uwzględnia on również możliwość zakodowania dodatkowo dźwięku na trzy sposoby (Layer 1, Layer 2 i Layer3). Choć już samo kodowanie dźwięku używa innej metody kompresji.

Layer 3 jako najbardziej zaawansowana została szeroko wykorzystana do zapisu dźwięku. Wpływ na to mogła mieć elastyczność standardu - pozwala on na zapis dźwięku z pominięciem obrazu i zapewnia wyśmienitą jakość nawet przy dużej kompresji.

Należy pamiętać, że standard opisuje jedynie format zapisu. Wszystkie urządzenia i programy potrafiące zapisać dźwięk w tym formacie oraz / lub odczytać go są zgodne z tym formatem.

Sposób kompresji podany poniżej stanowi przykład podany przez autorów formatu w celu wyjaśnienia i opisania, na czym polega format.

Kompresja

Dźwięk jest falą wywołującą drgania powietrza i może być zapisany na wiele różnych sposobów. Jednym z nich jest zapis zmian tego ciśnienia akustycznego w postaci proporcjonalnie zmieniającego się napięcia elektrycznego.

Ta forma analogowa może zostać przekształcona w formę cyfrową, czyli ciąg liczb, odpowiadający wartościami wielkości tego napięcia. Przekształcenia dokonuje się za pomocą przetwornika analogowo cyfrowego.

Jeśli te liczby będą 16-bitowe i będą zbierane 44 100 razy w sekundzie, będzie to odpowiadało standardowi CD Audio. Jest to jakościowo doskonały standard, ale do zapisania wszystkich danych opisujących dźwięk potrzeba stosunkowo dużo miejsca (w przybliżeniu 1,5Mb/s dla stereo), co jest szczególnie kłopotliwe w przypadku konieczności przesyłania tych danych za pomocą sieci. Dźwięk zakodowany w tym standardzie jest zazwyczaj źródłem danych do kompresji MP3 stąd będę się dalej powoływał na jego parametry.

Aby zmniejszyć ilość danych stosuje się różne metody zakodowania tych danych, w tym MP3. MP3 opiera się na wcześniej wspomnianym modelu psychoakustycznym i jest to metoda stratna. Polega na tym, że zostają „usunięte” (stratność) te informacje o dźwięku, które są niezauważalne lub mało istotne dla człowieka (psychoakustyczność).

Aby poprawnie zapisać sygnał analogowy w formie cyfrowej należy mieć na uwadze twierdzenie Kotielnikowa-Shannona o próbkowaniu. Mówi ono, że częstotliwość próbkowania nie może być mniejsza niż podwojona szerokość pasma sygnału. Dlatego w standardzie CD-Audio mamy częstotliwość próbkowania 44,1kHz.

Dalej należy zwrócić uwagę na szum kwantyzacji dający przy 16 bitach szum na poziomie 96 dB mniejszym od maksymalnego poziomu sygnału. Aby zmniejszyć ilość danych należy zmniejszyć częstotliwość próbkowania lub ilość bitów, lub zastosować obydwie te metody. Jeśli zrobi się to w odpowiedni sposób zmiany mogą być niezauważalne i na tym polega standard mp3.

Sygnał wejściowy (do kompresji) o szerokości 20 kHz jest dzielony na 512 odrębnych pasm częstotliwości. Wszystko dzieje się za pomocą filtrów cyfrowych w procesie cyfrowego przetwarzania sygnałów.

W rezultacie otrzymujemy 512 odrębnych sygnałów.


page 1 page 2 page 3

Categorised as: Bez kategorii


Comments are closed.

Потребление памяти: 33.74MB

  • AVG Internet Security 9.0 Build 730a1834