TFeri.hu

Hangformátumok: MP3 PDF Nyomtatás E-mail
  

Tamás Ferenc: Zenei formátumok – MP3

Az MP3 egy veszteséges tömörítésen alapuló zenék tárolására használt fájltípus. Jelenleg viszonylag gyenge minősége ellenére is az egyik legelterjedtebb és legnépszerűbb, mivel így a legegyszerűbb tárolni a zenéket, illetve az internetről is a legkönnyebb ilyen fájlformátumban letölteni.

Hivatalos neve: MPEG-1 Audio Layer 3. Mint a névből is látható, az MP3 az amúgy filmek kódolására használt MPEG-1 hármas számú zenei, illetve hangkódolási rétegét használja. Ennek ellenére sokszor használják az MPEG-2 Audio Layer 3-at is, mint a név eredetijét.

Történet

Az 1970-es évek elején a német Erlangen-Nuremberg-i egyetemen tanító prof. Dieter Seitzer csapata kezdett dolgozni a telefonvonalakon való minél jobb hangátvitel problémáján. Habár a szabadalmi kérelmét elutasították, de a munka közben összeszedett egy a téma iránt erősen érdeklődő diákcsapatot. Az 1970-es évek végén az ISDN és az üvegszálas kábelek elterjedése miatt a beszéd telefonvonalakon való minőségi továbbítása vesztett jelentőségéből, így felmerült a zene minél jobb kódolása. 1979-ben Seitzer prof. csapata kifejlesztette az első zenei jelfeldolgozásra és az audio adatok tömörítésére képes processzort. A csapat egyik diákja, Karlheinz Brandenburg elkezd dolgozni a zenei kódolási sémák pszichoakusztikus elvein, hogy az emberi fül számára minél jobb hangzást tudjon létrehozni egy kódolt/tömörített fájl segítségével. Kettőjük által vezetett csoport folyamatosan javította a kódolási eljárást. Ettől függetlenül 1981-ben dobták piacra a zenei életet alaposan felforgató Compact Disc-et, azaz CD-t, ami tömörítetlen 16 bit/mintás lineáris PCM kódolást használt.

MP3 team

(A képen a CEA elnöke, valamint Prof. Karlheinz Branderburg, Prof. Dieter Seitzer és Prof. Heinz Gerhäuser, „az MP3-csapat” a Felhasználói Elektronikai Szövetség (CEA) hírességek csarnokának felavatásán. Kép eredetije: http://www.idmt.fraunhofer.de/en/references/prizes_awards.html)

MP3Az MPEG-1/2 Layer 2 a berlini Fraunhofer Intézet Digital Audio Broadcasting (digitális hangátviteli projektje) keretében indult meg. Az eredeti finanszírozó az Európai Unió EUREKA kutatási projektje EU-147 kódnéven. Az eredeti projekt 1987-től 1994-ig tartott. 1989-ben fejezte be Karlheinz Brandenburg doktori disszertációját a frekvenciatartományokon belüli optimális kódolásról. Ekkorra a 64 kbps-os kódolású zene telefonvonalon keresztüli továbbítása lehetővé vált. Az első két komolyabb eredmény 1991-ben került ki: Musicam (azaz Layer 2), illetve az ASPEC (ami az MP3-hoz hasonló). Közülük a Musicamet vitték tovább egyszerűsége, nagyobb kódolási hatékonysága és jobb hibatűrő képessége miatt. Brandenburg és csapata megalkotta a két formátumból és a csapatvezető doktorijából az MP3-at, melybe még kibocsájtás előtt beleépítették a Jürgen Herre által kifejlesztett sztereó módot is. Céljuk az volt, hogy az új formátum 128 kbps-en tudjon megközelítőleg olyan minőséget produkálni, mint az MP2 tudott 192 kbps-en. Karlheinz Brandenburg a Susan Vega által kiadott Tom's Diner c. CD-t használta a munkájához. (CD borító eredetije: http://rateyourmusic.com/release/single/suzanne_vega/toms_diner___left_of_center/buy).

1992-ben piacra dobták az MPEG-1 (videó)kódolót, amely akkor még 3 audió réteggel rendelkezett. Mivel a 3. réteg lett a leghatékonyabb, ezért annak használata rohamosan elterjedt az akkor még viszonylag kicsi merevlemezeken, valamint az akkor jellemző otthoni 28.8 kbps-os internetes modemeken. Az új zenei formátum (egyelőre még az MP2) 1993 októberében jelent meg az interneten és rohamosan terjedni kezdett. 1995-ben a Fraunhofer Intézet munkatársai egy belső szavazáskor az MPEG Layer 3 rövidítésére egyhangúlag az „MP3”-ra szavaztak. Még ugyanazon évben a Fraunhofer Intézet shareware-ként levédette az MP3 szabadalmát.

Számítógépes lejátszóként akkoriban főleg a Xing MPEG Audio Player volt megtalálható. Az audio CD-k gépre vitelére a CDDA2WAV programot használták, míg átalakítóként még csak a Xing Encoder volt az egyetlen, amivel MP2-vé (hamarosan már MP3-má is) lehetett alakítani a zenéket. 1995 elején az MP3 fájlok elkezdtek tömegével az internetre kerülni, többek között a Nullsoft cég 1997-ben népszerűvé váló Winamp c. lejátszó szoftvere és az 1999-től beinduló Napster fájlcserélő programjának népszerűsége által. Érdekes adalék, hogy az MP3 fájlok jogosulatlan megosztása már akkor is sok problémát okozott az akkor még eléggé tisztázatlan jogsértések miatt.

MP31996-ban a Worldspace Radio hivatalos formátumává választotta az MP3-at. 1997-ben Michael Robertson elindítja az MP3.com-ot, ahol minden technológiát, jeladót, játékot, illetve zenészek által feltöltött ingyenes számokat, valamint bármilyen más MP3-hoz kapcsolódó információt közzétett. Nem sokkal ez után az MP3.com lett a legnagyobb legális MP3-as zenéket megosztó weboldal. 1998-ban az mp3-as lejátszók korszaka elkezdődött az USÁ-ban a Diamond Multimédia „RIO100”-as hordozható lejátszójával (bal oldali képen a RIO100-as; képe forrása: http://www.iis.fraunhofer.de/), valamint Dél-Koreában a Saehan Information System „MPMAN” lejátszójával. Ezek voltak a legelső hordozható lejátszók, amelyek memóriájukban tárolták, valamint korrektül lejátszották az internetről letöltött, tömörített MP3-as fájlokat.

 

Technológiai részletek

Veszteséges tömörítéskor a kiváló minőségű audió CD-ből a kódoló kiemeli az emberi fül által jól hallható frekvenciatartományt és főként ezt a területet tömöríti le, míg a többit lényegében elhanyagolja. A kitömörítés utáni visszajátszáskor a dekódoló megpróbálja visszaállítani a teljes hangzás-élményt, de mivel a lényegtelennek ítélt tartományokból alig van adat, ezért ez a művelet teljes egészében nem lehetséges. A tömörítés jellemzője a bitráta, amely meghatározza, hogy a forrásfájlból másodpercenként hány kilobit kerül tömörítésre. A nagyobb bitráta általában nagyobb fájlméretet és jobb minőséget generál. A túl alacsony bitráta tömörítési hibákat is generálhat, vagyis olyan hangok is bekerülhetnek a zenefolyamba, amik az eredeti fájlban nem voltak hallhatóak. Mivel az MP3 szabvány kicsit engedékeny a kódolási algoritmusok tekintetében, ezért a különböző algoritmusok eltérő eredményt hozhatnak mind minőség, mind fájlméret szempontjából. Másrészt viszont a dekódoló elég pontosan van szabályozva, így a legtöbb dekódoló „bitfolyam-kompatibilis”, azaz a bemeneti MP3 állományból kitömörített kész fájl bizonyos matematikailag meghatározott hibatűrési határok mellett behatárolt eredményt kell produkálnia. Így például egyes MP3 fájlok a CPU komolyabb számítási mennyiségét igényelik.

A legegyszerűbb módszer az állandó bitrátájú kódolás (Constant Bit Rate = CBR). Ez a legegyszerűbb és leggyorsabb eljárás. Azonban az MP3 szabvány megengedi a fájl kódolása közbeni bitráta-váltást. Ez változó bitrátás kódolásként ismert (Variable Bit Rate = VBR). Alapvető ötlet ennél az eljárásnál, hogy a zene egyes részei alig tartalmaznak kódolandó információt (például ilyen lehet egy sima dobszóló) így ezt a részt igen egyszerű tömöríteni; míg a zene másik részei túl sok kódolandó adatot tartalmazhatnak (például amikor a teljes nagyzenekar minden hangszere egyszerre játszik), ezt a részt persze meglehetősen nehéz helyesen és jó minőségben kódolni. Éppen ezen megfontolás miatt néhány kódoló algoritmus megengedi a tömörítés minőségének beállítását, így a kódolási minősége és persze a szükséges hardver-erőforrások mennyisége is változhat.

Megjegyzés: az eredeti MPEG-1 Audio Layer III szabvány számos bitrátát határoz meg. Ezek: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 és 320 kbit/s. A rendelkezésre álló mintavételezési frekvenciák: 32, 44,1 és 48 kHz. Az MPEG-2 Audio Layer III számos újabb bitrátát határoz meg: 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 kbit/s. Az új generációs mintavételezési frekvenciák: 16, 22,05 és 24 kHz. A zenei CD-k alapértelmezett mintavételezési frekvenciája: 44,1 kHz, melyek az MP3 fájlok fő forrásának tekinthetők. A bitráták nagyobb választéka található meg az interneten. A 128 kbit/s frekvencia általánosan használt, melynek eredményeképpen hozzávetőlegesen 11:1 tömörítési arány jön létre; ráadásul ez az eljárás egy meglehetősen jó hangminőséget produkál egy hozzávetőlegesen kis helyen. Mivel az internet átlagos sávszélessége nagyot nőtt, valamint ezzel együtt növekedett a merevlemezek tárhelye, ezért egyre inkább kezd elterjedni a 320 kbit/s-os sebesség.

Amúgy üzletileg is igen sikeresnek bizonyult az MP3, mivel a szabadalom a Fraunhofer Intézetnek (és Társaságnak) 2005-ig hozzávetőleg 100 millió Eurót hozott. Ez leginkább azon szoftver- és hardvergyártóktól származik, amelyek MP3-mal kapcsolatos termékeket gyártanak, illetve forgalmaznak.

Egyéb adatok

Az MP3 fájlok a szigorú zenei minta mellett rengeteg információt is tartalmaz(hat)nak. Ezek az ún. ID3-tagok. Ilyen lehet például a zeneszám címe, előadója, műfaja, hossza, zeneszerzője, az album neve, kiadója, a kiadás éve, a kódoláskor használt bitráta, a kódolt fájl mérete, valamint számtalan egyéb adat. Azonban számos ID3-szabvány létezik. Jelenleg a legelterjedtebb az ID3v1 és ID3v2, de igen népszerűvé kezd válni az APEv2 is. Ezek a bejegyzések általában az MP3 fájlok elején vagy a legvégén vannak elválasztva az MP3-as zenei adatoktól. Az MP3 dekóderek általában kiolvassák az ID3-tageket, de néha nem képesek ezen információkat feldolgozni. A lejátszó és szerkesztő szoftverek gyakran tartalmaznak ID3-tag szerkesztési funkciókat is, de léteznek kifejezetten erre a célra kifejlesztett alkalmazások is. Egyes MP3-fájlok képesek tárolni a DRM-információkat is. (DRM = Digital Rights Management = Digitális jog-védelem) A hagyományos módon rippelt MP3-ak esetén a digitális jogvédelem mind a mai napig nincs korrektül megoldva.

A zenei CD-k forgalmának drasztikus esése miatt egyre kevésbé jellemző a zenei számok rippelése, helyette a zenék digitális letöltése lett jellemző. Ez egyrészt az on-line zeneoldalakról (pl.: Youtube.com) letöltött zenéket jelenti, melyek sokszor bizonytalan minőséget eredményeznek. Másrészt viszont a megbízható oldalakról, áruházakról letöltött kiváló minőségű zeneszámokat jelenti. Ezek jellemzően fizetősök, pl.: Apple iTunes, Google Music, …

 

Felhasznált irodalom:

 
Ulti Clocks content

Egyebek

Hirdetés