Cosa sono gli MP3

L'uso degli MP3 ha rivoluzionato il modo di distribuire la musica nel mondo. Incredibilmente però questa rivoluzione non è partita dalle case discografiche o dall'industria musicale ma dagli utenti di internet appassionati di musica.

Il formato MP3 infatti ha permesso una distribuzione di massa e soprattutto gratuita della musica tanto che le case discografiche hanno dovuto fare i conti con una diminuzione clamorosa dei loro profitti.

Fino a poco tempo fa un minuto d'audio stereo poteva occupare fino ad una decina di megabytes. Oggi, invece, grazie al formato MP3 è possibile memorizzare file audio di dimensioni estremamente ridotte ( circa 12:1 rispetto ai brani muiscali in formato CD standard), senza perdite di qualità apprezzabili!

Tutto nasce nel 1988 nei laboratori Cselt di Torino, il nome MP3 proviene dallo standard MPEG, acronimo di Moving Picture Experts Group. Questo gruppo è stato creato appositamente per lo sviluppo di sistemi e standard usati nella compressione video. Films in DVD e trasmissioni satellitari (DBS) usano infatti lo standard MPEG per comprimere in modo efficente le informazioni video.

La compressione MPEG include un sottosistema per la compressione del suono con tre differenti livelli di compressione ( Layers ) dipendenti dalla qualità delle informazioni. Il Layer-3 è quello usato per lo standard MP3 che quindi è l'acronimo di MPEG Layer-3.

Le caratteristiche principali della sezione audio:

A queste proprietà generali sono poi associati tre diversi livelli di compressione detti tecnicamente Layer. Layer 1 poco complesso e a un bit-rate superiore a 192 kbit\s il segnale audio viene compresso poco e le perdite di qualità sono praticamente nulle.Layer2 la complessità degli algoritmi cresce notevolmente e la compressione aumenta molto con un bit-rate compreso tra 128 e 192 Kbit\s (praticamente gli MP3 che si confezionano con un Pc) e una perdita minima di qualità. IL Layer 3 è il più complesso che utilizza un data-rate inferiore hai 128 Kbit\s comprimendo moltissimo il flusso causando anche gravi perdite in qualità sonora.Allora cosa significa la sigla MP3 ? Mpeg 1 Layer3 a indicare la massima possibilità di compressione audio dell'Mpeg. Il Layer 3 non venne sviluppato allo Cselt di Torino ma da: Fraunhofer IIS(Institut Itegrierte Schaltungen ) in Germania 1991.

Prendiamo ad es. un brano musicale di qualità CD audio,con campionamento a 44.1 Khz 16 bit stereo della durata di 10 minuti in forma non compressa il file in questione occupa circa 100 Mbyte di spazio,mentre con la compressione MP3 si può ridurre il tutto a meno di 10 Mbyte di spazio senza perdite percettibili di qualità.

Nei file Wav (che sono un ottimo esempio di musica digitale), ogni secondo di una canzone viene digitalizzato a 44.1 KiloHertz (ovvero 44100 volte al secondo). Ogni valore viene memorizzato in 2 bytes (16 bits) e su due canali per riprodurre l'effetto stereo. In pratica quindi un file Wav occupa su Hard disk uno spazio di 44100 x 16 bits x 2 = 1141200 bits al secondo (o se preferite 176400 bytes). Considerando che mediamente un brano musicale ha una durata di 3 minuti e mezzo, lo spazio necessario per memorizzarlo sul pc è di 176400 x 210 = 37044000 o se preferite 37 Megabytes!

Esaminando questi numeri capirete come mai i files MP3 hanno avuto un così grande successo negli ultimi anni. Con questo formato infatti è possibile memorizzare un brano musicale con qualità identica a quella appena vista per un file Wav, usando solamente 3 o 4 Mega!

MPEG Layer-3 è uno schema di codifica audio di tipo percettivo che analizza i segnali ed applica dei modelli piscoacustici, la scienza che studia il modus operandi della percezione sonora da parte dell'orecchio umano tenendo in considerazione come obbiettivo principale la conservazione della qualità del suono.

Come è possibile che un flusso audio venga compresso e ridotto a un decimo dell'originale senza perdite sensibili di qualità?Se provate a comprimere un file Wav con Winzip o Winrar otterrete un fattore di compressione di circa 1:2 ben lontano dall'1:10 dell' Mp3.Dietro gli Mp3 che ascoltiamo tutti i giorni ci sono complessi studi scientifici sulla psicoacustica cioè il modo in cui gli uomini sentono i suoni e i rumori I n primo luogo l'algoritmo di compressione Mp3 è stato disegnato per gestire appositamente file audio che sono caratterizzati da determinati aspetti acustici infatti è possibile trovare in un brano musicale una certa corrispondenza più o meno marcata tra campioni adiacenti ,segnale di ridondanza statistica.Questi dati possono essere tranquillamente eliminati utilizzando particolari codifiche senza modificare la qualità del segnale audio dimezzandone la dimensione. Un'osservazione importante fatta dai ricercatori riguarda lo spettro sonoro udibile dall'orecchio umano,che grossomodo varia dai 20Hz ai 20 Khz,con particolare risalto per le frequenze comprese tra i 2 e i 5 Khz.Tutto quanto si trova all'esterno di queste frequenze viene eliminato dalla compressione Mp3, consentendo quindi una seconda riduzione del flusso sonoro. Un'altra importante riguarda il fenomeno del mascheramento:se una sorgente emette un suono di una determinata frequenza l'udito umano non sarà in grado di rilevare le frequenze immediatamente vicine,anche di volume appena inferiore.Ecco quindi che un'altro spazio viene guadagnato.Altre operazioni molto più sofisticate vengono poi effettuate dall'algoritmo,come la suddivisione del segnale audio in 32 sottobande,la quantizzazione e codifica di segnali in sotto-bande e infine il multiplex e l'incapsulamento dei frame:è quindi facile intuire la complessità dell'algoritmo Mp3 ma anche il perché delle sue enormi capacità di compressione.

 

L'Encoder MP3 è quel programma che analizza il file digitale non compresso (ad esempio un file Wav) e lo trasforma in un file MP3.
Il segnale audio viene filtrato e suddiviso in 576 aree ( dette sottobande) mediante un processo che utilizza la DCT ( Discrete Cosine Transformation ) e che riesce ad eliminare tutte le frequenze non necessarie.

L'orecchio umano è uno strumento pressocchè perfetto ma anche esso ha dei limiti. La banda passante dell'orecchio umano si estende dai 20 Hz ai 20.000 Hz, ma esso risulta molto più sensibile a quelle della gamma media, dai 700 ai 6.000 Hz, nelle quali si concentra la maggior parte delle informazioni.
La
Soglia minima udibile. per l'orecchio umano non è lineare. Infatti la curva di Fletcher e Munsen, ne esprime le caratteristiche con un picco tra 2Khz e 5Khz. Non è perciò necessario "codificare" suoni al di sotto di questa soglia, perchè non sono percettibili.

A questo punto il segnale risultante viene fatto passare attraverso il modello psicoacustico in cui vengono individuate le soglie di mascheramento . Questa operazione viene effettuata utilizzando la trasformata discreta di Fourier (DFT, Discrete Fourier Transformation). Durante il mascheramento delle 576 sottobande, vengono determinate le frequenze che devono essere mascherate e che quindi possono essere eliminate. La mascheratura. Questo sistema si basa sulle caratteristeche proprie dell'orecchio umano, ovvero un suono forte i suoni deboli. facciamo un esempio: Durante un concerto parte un fortissimo assolo di chitarra. Molti dei suoni emessi dagli altri strumenti, saranno coperti dal suono del solista, anche se la band continuerà a suonare normalmente. Quindi non è necessario codificare tutti i suoni. Per fare questo vegono applicati modelli psicoacusti che rispettao i comportamente dell'orecchio umano.
Dopo il mascheramento viene applicato il processo definito di Joint Stereo. Al di sotto di una certa frequenza, l'orecchio non riesce a percepire la posizione spaziale dei suoni per cui essi possono essere registrati su un singolo canale solamente ( quindi nel formato mono ) con un significativo risparmio di spazio.
Una volta che il file è pronto, i dati vengono analizzati nuovamente e compressi utilizzando la codifica di Hufmann che permette una riduzione dei dati (senza perdita di informazione) di circa il 20%. Infine, i file MP3 utilizzano l'algoritmo di Huffman. Questa è una operazione di compressione su dati, non sul suono. Il lavoro svolto da questo algoritmo serve sopratturro ad ordinare correttamente i dati che compongono i file, e si attiva in chiusura della compressione MP3. Il lavoro svolto da questo algoritmo è quello di ordinare e codificare le ricorrenze consecutive dei simboli. Naturalmente, più ci sono ricorrenze consecutive e più i dati saranno compressi! Questa tecnica di compressione è il complemento perfetto per la codifica percettiva MP3! Infatti se un brano è ripetitivo, (tipo TRANCE-POP e simili), ci saranno un mucchio di dati perfettamente codificti per l'orecchio umano, ma eccessivi, inutili o ridondanti, perchè la musica è ripetitiva. Ed è in questo contesto che la codifica Huffmann ha le maggiori possibilità i "comprimere i dati".
A questo punto, raccolti tutti i dati l'encoder provvede a creare il flusso dei bits che formerà il file MP3 finale.

Questo tipo di compressione quindi analizza lo spettro del segnale acustico e, applicando il modello psico-acustico, calcola il rapporto dei dati superflui, eliminandoli definitivamente. Da ciò possiamo dedurre che la decompressione dal formato mp3 a wave non porterà alla stessa forma d'onda del segnale utilizzato per la codifica, ma in termini di ascolto del file audio il risultato è lo stesso.

Per capire meglio come funziona la compressione MP3 analizziamo ora i grafici della forma d'onda compressa e della forma d'onda normale di una stessa canzone:

Il primo grafico si riferisce ad un segnale compresso con MP3 con bitrate di 128 Kbit/s, mentre il secondo è il segnale non compresso (.wav). Come si può facilmente notare l'MP3 taglia tutte le frequenze troppo alte per l'orecchio umano, eliminando inoltre suoni che verrebbero coperti da picchi di suoni a frequenze elevate. Il risultato è un tipo di segnale dall'andamento molto più dolce rispetto al segnale non compresso. Tutto ciò si traduce in un notevole risparmio di spazio su disco nella memorizzazione dei dati.

Il formato MP3 ha cambiato in questi ultimi anni il modo di diffondere la musica nel mondo.

Il successo ovviamente non è derivato solamente dal fatto di poter comprimere un file Wav in pochi Mega ma anche da altre componenti:

 

Questa pagina riassume i contenuti di documenti raggiungibili ai seguenti link:
mp3.IT
http://www.mp3.it/
Megalab.it
http://www.megalab.it/articoli.php?id=1
Come funziona.net
http://www.comefunziona.net/articolo.asp?ogg=MP3
MP3 ..... un pò di storia
http://www.p2pforum.it/forum/archive/index.php/t-421.html
 
Approfondimenti
 
Aspetti tecnici degli MP3
http://www.euro2001.com/mp3/mp3/asptecn1.htm

Sanremo al tempo di Internet
http://www.diario.it/index.php?page=cn03051316
MP3 FAq
http://www.winmxitalia.it/mp3faq.htm
Il sito di riferimento
http://www.mp3.com/