Smrt MP3: Stručná historie světově oblíbeného audio formátu

Smrt MP3: Stručná historie světově oblíbeného audio formátu

Německá nadace, která vlastní patent na úctyhodný „starý“ hudební formát MP3, nedávno oznámila, že nechá patent zaniknout. Sdílení zvukových souborů MP3 spustilo široce otevřené v devadesátých a na počátku dvacátých let minulého století. Kombinace komprese dat, velikosti souboru a zachované kvality zvuku zajistila, že zvukový formát se stal známým na obou stranách argumentu pirátství.





V titulcích je napsáno „MP3 je mrtvý“, ale každý skutečný audiofil ví, že skutečná smrt je velmi nepravděpodobná. Nicméně je načase podívat se na historii světově proslulého zvukového formátu a na to, co může v blízké budoucnosti přijít.





Jak přesně MP3 funguje?

V závislosti na věku a zneužívání, které vaše uši utrpěly, se váš frekvenční rozsah sluchu pohybuje mezi 20 Hz a 20 000 Hz. Naše uši jsou navíc nejcitlivější na zvukové frekvence mezi 2 kHz a 5 kHz. Náš sluch je také omezen naší schopností filtrovat a zpracovávat zvukové signály, jakmile dorazí.





Image Credit: flatvector přes Shutterstock

Maskování frekvence - klíč ke kompresi MP3 - se spoléhá na neschopnost mozku rozlišovat mezi určitými signály.



Představte si, že máme dva zvuky. Mají velmi podobné frekvence (např. 200 Hz a 210 Hz), ale hrají se při různých hlasitostech. Slabší zvuk je slyšet sám, ale silnější je rozeznatelný pouze tehdy, když jsou přehrávány současně. Proces pokrytí jedné frekvence jinou blízkou frekvencí se nazývá „maskování“. Maskování frekvence funguje efektivně v horní a dolní části zvukového spektra.

Kopírování CD

Předpokládejme, že kopírujeme CD do vašeho počítače. Hudba na disku CD je vzorkována 44 100krát za sekundu (44,1 kHz). Ukázky jsou dlouhé 2 bajty (1 bajt je 16 bitů). MP3 podporuje několik rychlostí, ale obvykle používá standard CD 44,1 kHz.





jak zjistit, co bylo soukromé video na youtube

Jednotlivé soubory MP3 se skládají z rámců MP3 se záhlavím a datovým blokem. Každý snímek obsahuje 1 152 vzorků. Technicky se jedná o dva „granule“ z 576 vzorků. Vzorky jsou vedeny přes filtr, který dále rozděluje zvuk do specifické sady 32 frekvenčních rozsahů. Algoritmus MP3 pak dále dělí těchto 32 frekvenčních pásem faktorem 18, čímž vzniká 576 ještě menších pásem. Každé pásmo obsahuje 1/576. Frekvenčního rozsahu původního vzorku (když jsme začali kopírovat CD do počítače).

Obrázek kreditu: Kim Meyrick prostřednictvím Wikimedia





V této fázi fungují dva složité matematické algoritmy: Upravená diskrétní kosinová transformace (MDCT) a Fast Fourier Transforms (FFT). Každý provádí jiný proces rozebraného zdrojového materiálu.

FFT analyzují každé frekvenční pásmo pro zvuky, které lze snadno maskovat, a ujistěte se, že maskování frekvence zachovává důležité zvuky ve stopě.

Vzorky jsou poté tříděny a předány do MDCT. MDCT mění každé pásmo na sadu spektrálních hodnot. Spektrální hodnoty přesněji vyjadřují způsob, jakým náš sluch interpretuje zvuk. Mnoho kodérů komprimovaného zvuku proto používá k odstranění zvukových dat spektrální hodnoty. Jakmile jsou spektrální informace a analýza granulí dokončeny, začíná vlastní proces komprese.

Stručná historie MP3

Pamatujete si svůj první MP3 přehrávač? Měl jsem štěstí na originální iPod - dokud ho muž s nožem neosvobodil z mého vlastnictví. Mini disky každopádně byly mnohem chladnější.

Bez ohledu na to, v době, kdy původní iPod rychle eskaloval touhu po MP3 (v roce 2001), byl formát již osm let starý. Kromě toho MP3 již dělalo vlny na internetu a dalších přenosných digitálních hudebních zařízeních.

Odkud pochází MP3?

MP3 bylo a M pečení P iktura A xperts G roup (MPEG) design, jako součást původního standardu pro kompresi zvuku a videa MPEG-1. MP3 je zkratka MPEG-1 Audio Layer III, schválená pro použití v roce 1991 a nakonec publikovaná v roce 1993.

Myšlenka MP3 je docela skvělá.

Algoritmus MP3 využívá percepčních omezení lidského sluchu, označovaných jako sluchové maskování. Zvukové maskování nastává, když je vnímání jednoho zvuku ovlivněno přítomností jiného. Každá skladba navíc obsahuje zvukové prvky nepostřehnutelné pro celkový zážitek z poslechu. Manfred R. Schroeder poprvé navrhl kodek psychoakustického maskování v roce 1979. Společná iniciativa za globální standard však začala až v roce 1988, kdy byl vytvořen MPEG (jako podvýbor ISO/IEC).

V historii MP3 je další důležité jméno: Karlheinz Brandenburg. Brandenburg začal pracovat na kompresi digitální hudby v osmdesátých letech, doktorskou práci dokončil v roce 1989. The různé způsoby komprese, na kterých pracoval našel omezení jak v tehdejších dostupných technologiích, tak v návrhu raných kódovacích procesů. Spolu s dalšími zakládajícími členy MPEG si uvědomil, že bude stačit pouze nový systém.

Fraunhoferův institut

V roce 1990 se Brandenburg stal odborným asistentem na univerzitě v Erlangenu-Norimberku. Pokračoval ve své práci na kompresi s Fraunhoferovou společností (nakonec by se připojil k Fraunhoferovi 1993).

'Měli jsme zvukovou podskupinu v rámci skupiny filmů [MPEG],' vysvětlil Brandenburg NPR rozhovor . 'Nakonec jsme všichni společně měli kompromis, který měl různé režimy, takzvané vrstvy I, vrstvy II, vrstvy III.' . . A většina našich nápadů přešla do režimů komprese zvuku MPEG. . . který byl nejsložitější a který poskytoval nejlepší kvalitu při nízkých přenosových rychlostech - tomu se říkalo Layer III. '

Brandenburg použil píseň „Tom's Diner“ od Suzanne Vega k vylepšení algoritmu komprese a poslouchal ji znovu a znovu, aby zajistil, že jeho cinkání nebude mít nepříznivý vliv na záznam Vegova hlasu.

MP3 exploduje

MP3 bylo několik let po oficiálním vydání v útlumu, kodek byl považován za „příliš komplikovaný“ pro široké použití.

V roce 1997 se však věci změnily - rychle.

Nejprve si „australský student“ koupil profesionální kódovací software l3enc od německé firmy. Zpracoval software zpět, zkompiloval jej a nahrál na FTP americké univerzity s příponou README soubor se slovy: „Toto je freeware díky Fraunhoferu.“ Tento malý akt okamžitě změnil přístup ke kódování a dekódování MP3. Náhle vložení disku CD do počítače poskytlo vysoce kvalitní zvuk v malých velikostech souborů.

Za druhé, Nullsoft vydal ctihodný zvukový přehrávač Winamp. MP3 zkopírované z disku CD lze snadno přehrát na počítači.

Internet se současně rozšířil do milionů domácností po celém světě. Miliony pevných disků se zaplňovaly MP3 , a formát se stal preferovaným formátem sdílení zvukových souborů pro rané služby sdílení souborů peer-to-peer, jako je Napster, Gnutella a eDonkey (Gnutella byl další projekt Nullsoft). Hudební pirátství bylo živé a nekontrolovatelné a nijak mu nepomohl vzestup MP3.

MP3 přehrávače

Jako další výhoda zavedeného audio průmyslu se objevily přenosné MP3 přehrávače. Na počátku devadesátých let se Fraunhoferův institut pokusil vytvořit obchodovatelný přehrávač MP3. Na široké přijetí bylo prostě příliš brzy. Aby přenosné MP3 přehrávače dostaly impuls, potřebovala výše zmíněná kombinace sdílení souborů, šíření internetu a softwaru pro kopírování.

Jihokorejská společnost Elger Labs představila MPMAN F10 v hodnotě 250 $, doplněný o neuvěřitelných 32 MB paměti. Nebyla to jiskřivá jiskra v průmyslu, jak ji známe. Toto ocenění spočívá na modelu Diamond Rio PMP300, který má také 32 MB.

Úspěch Diamond Rio vzbudil nechtěnou pozornost. Americká asociace nahrávacího průmyslu (RIAA) zažalovala Diamond Multimedia Systems (výrobce) - a prohrála. RIAA však správně předpokládala, že to byl začátek endemického hudebního pirátství, které pokračuje dodnes.

Ptáte se, co se stalo potom?

No, málo známé zařízení s názvem iPod zasáhly trhy, zcela legitimizovaly MP3 jako de facto zvukový formát své doby a RIAA zahájila svou (pokračující) křížovou výpravu proti pirátům po celém světě.

Zbytek, jak říkáme, je historie.

Proč tedy MP3 umírá?

Fraunhoferův institut vlastnil patent MP3. 23. dubna 2017 vypršela platnost jejich zbývajících patentů. Společnost Fraunhofer proto již nemůže vydávat nové licence MP3. Přesně jsme vysvětlili, co se s těmito „apokalyptickými“ titulky děje, a také to, jak vás to ovlivní.

Chcete TL; DR? MP3 není mrtvé a nikam nevede.

Jedním z hlavních důvodů, které Fraunhofer uvedl pro upuštění od MP3, byl věk. Už nemůže soutěžit se svými novějšími a lesklejšími bratranci kodekem. Jejich návrh? Místo toho použijte Advanced Audio Coding (AAC). Shodou okolností má Fraunhofer také (pokračující) patent na AAC, takže níže máme několik alternativ MP3, ze kterých si můžete vybrat.

Alternativy MP3

Vaše sbírka MP3 se najednou nespálí, stejně jako stávající kodéry a dekodéry budou nadále vytvářet soubory MP3. To znamená, že MP3 je nyní trochu zastaralé. Je jich několik bezplatné alternativní zvukové formáty nyní můžete svou digitální hudbu ukládat.

  • AAC - Advanced Audio Coding, jak bylo uvedeno výše, je nástupcem MP3. Jediným problémem je, že samotný formát nyní vypadá trochu zastarale. Nicméně AAC obecně dosahuje lepší věrnosti zvuku než MP3, s podobnými přenosovými rychlostmi a velikostmi souborů. AAC je také ztrátový formát.
  • Ogg Vorbis - Formát Vorbis, běžně používaný ve spojení s formátem kontejneru Ogg. Je to lepší, o něco mladší bratranec s otevřeným zdrojovým kódem pro MP3. Přestože Ogg nabízí lepší kompresi, vyšší přenosové rychlosti a obecně lepší kvalitu zvuku, Ogg kvůli nedostatku podporovaných zařízení nikdy nevzlétl stejným způsobem jako MP3. Ogg je také ztrátový formát.
  • FLAC - Free Lossless Audio Codec je nejoblíbenější formát bezztrátového zvukového kodeku. Proč? FLAC nabízí přesnou zvukovou kopii zdrojového materiálu, o polovinu menší než tradiční CD. Zvuky nejvíce ovlivněné MP3 (např. Kytary, činely, reverb atd.) Zůstávají ostré, přestože jsou výrazně komprimované. FLAC je bezztrátový formát.

MP3 není mrtvé

Nemáš se čeho bát. Můžete pokračovat ve kopírování do formátu MP3 a vaše zařízení budou i nadále přehrávat vaši hudbu. Z dlouhodobého hlediska by stálo za to alespoň prozkoumat novější zvukový formát pro vaši sbírku. Kompresní techniky postoupí a velikost souborů přesných kopií se zmenší.

Kromě toho stojí za zvážení skladovací kapacita. Když dorazily první přenosné MP3 přehrávače s 32 MB úložištěm, bylo to tak chladný , ale evidentně ne dost. Největší úložiště pro iPod Classic bylo 160 GB. Že lze narazit na upgrade vlastního úložiště na neuvěřitelných 240 GB - více než 1 000 000 jednotlivých skladeb MP3. Jde o to, že jak se velikost úložiště zvyšuje a fyzická velikost klesá, dokážeme více s méně.

A konečně, internet i nadále mění způsob, jakým posloucháme hudbu. Kdysi jsem pirátskou hudbu používal, protože jsem si nemohl dovolit zaplatit 12 až 20 dolarů za každé nové album, které vyšlo. Nyní mám účet rodinného plánu Spotify s přístupem k milionům skladeb a účet Amazon Prime s dalšími miliony. Jediné, co mě omezuje, je moje internetové připojení a i tak mají oba možnosti offline stahování ve vysoce kvalitních formátech.

Není to tak důležité jako kdysi, ale MP3 není mrtvé.

Jaký je váš preferovaný formát zvuku? Potřebujete ostrou realitu bez ztráty? Nebo extrémní komprese ztrátového formátu? Změnilo se používání vaší hudby od doby, kdy se rozšířily streamovací služby? Zanechte mi řádek v komentářích a já se vám ozvu.

Uznání: Ti Santi přes Shutterstock.com

Podíl Podíl tweet E-mailem Průvodce pro začátečníky k animované řeči

Animační řeč může být výzva. Pokud jste připraveni začít s přidáváním dialogu do svého projektu, proces za vás rozdělíme.

Číst dále
Související témata
  • Technologie vysvětlena
  • Zábava
  • MP3
  • Komprese souborů
  • Převodník zvuku
O autorovi Gavin Phillips(945 publikovaných článků)

Gavin je juniorský editor pro Windows a vysvětlenou technologii, pravidelný přispěvatel do Skutečně užitečného podcastu a pravidelný recenzent produktů. Má BA (Hons) Contemporary Writing with Digital Art Practices drancované z kopců Devonu, stejně jako více než deset let zkušeností s profesionálním psaním. Má rád velké množství čaje, deskových her a fotbalu.

Více od Gavina Phillipse

Přihlaste se k odběru našeho zpravodaje

Připojte se k našemu zpravodaji a získejte technické tipy, recenze, bezplatné elektronické knihy a exkluzivní nabídky!

Kliknutím sem se přihlásíte k odběru