Extras din proiect
1. Standardizari. Comprimarea fisierelor sunet
MPEG (Moving Picture Experts Group) împreună cu Comitetul Internaţional pentru Comprimare Audio de Inaltă Fidelitate, a adoptat la sfârşitul anului 1992 un algoritm MPEG Audio, ca parte a standardului general de comprimare audio-video sincronizat. El urmăreşte defmirea procesului de codificare/decodificare, la o rată medie de transfer de 1.5 Mbits/sec, stabilind o plajă largă de încadrare în parametri, a producătorilor de codificatoare/decodificatoare de semnal audio.
MPEG Audio nu restricţionează gama surselor audio. Sunt utilizate tehnici de compresie pe diferite tipuri de semnale audio, asigurând în acelaşi timp şi facilităţile de direct access, reverse şi fast forward.
Reţele de eşantionare sunt cuprinse între valorile de 32.44 - 48 KHz, şi lucrează cu unul sau două canale, astfel:
• Monofonic pe un singur canal;
• Monofonic pe două canale independente, realizând o funcţionalitate comparabilă cu modul stereo;
• Stereo pe canale stereo ce partajează semnalul, dar nu codifică stereo simultan;
• Stereo simultan.
Se poate lucra cu rate de transfer predefinite, între 32 şi 224 KB/sec/canal cu un factor de comprimare între 2.7 şi 24, dar şi cu rata de transfer liberă. Pentru comprimare se pot utiliza trei nivele independente de comprimare, ce permit o corelare mai strânsă între complexitata codificării şi calitatea semnalului comprimat. Toate nivelele sunt implementate pe un singur chip, cu decodificare în timp real şi pot utiliza opţional detecţia erorilor.
2. Activitatile de standardizare pentru codarea audio Hi-Fi
In acest capitol va fi descris algoritmul de codare pentru semnalele audio pentru standarul international ISO/IEC. Au fost stabiliti trei algoritmi standard pentru a fi utilizati in functie de numarul de canale si de frecventa de esantionare: MPEG-1 audio, MPEG-2 si MPEG-2 LSF. In functie de complexitatea si de calitatea realizata fiecare este clasificat in Leyer I/II bazat pe codarea pe sub-benzi si Leyer III bazat pe o combinatie intre codarea pe sub-benzi si codarea adaptiva a transformatei.
Transmisia eficienta si stocarea semnalelor audio sunt importante pentru citeva aplicatii cum ar fi audio digital, radiodifuziunea digitala prin satelit (DSB – Digital Satellite Broadcasting), stocarea semnalelor audio, conferinta la distanta si multimedia. ISO/IEC JTC 1/SC 29/WG 11 (the International Organization for Standardization/the International Electrotechnical Commission, 1st Joint Technical Committee, 29th Subcommittee, 11th Working Group) a studiat caile pentru proiectarea unui standard international pentru compresia semnalelor audio impreuna cu semnalele video sub 1,5 Mb/s. Rezultatul studiului, pentru doua canale de semnal cu frecventa de esantionare intre 32 kHz si 48 kHz, au fost publicate de ISO/IEC pe 1 august 1993 dupa aprobarea prin vot de tarile participante.
Acesta este cunoscut ca MPEG/audio faza 1, sau MPEG-1/audio. O parte a standardului MPEG-1 a fost stabilit ca standard ITU-R. De asemenea, au fost efectuate studii pentru extensia standardului MPEG-1 audio si pentru sisteme multicanal si multilingvistice si pentru o viitoare reducere a ratei de bit prin adoptarea unei frecvente joase de esantionare. Acestea reprezinta faza 2 a standardului si este denumit MPEG-2 audio. MPEG-2/audio a fost aprobat prin consens international la conferinta de la Singapore in noiembrie 1994 dupa care a fost publicat ca standard in 1995.
3. Structura algoritmului MPEG audio
Algoritmul MPEG audio este constituit din trei algoritmi diferiti: Layer I, Layer II si Layer III. Complexitatea creste de la Layer I la Layer III, cu o imbunatatire corespunzatoare in calitatea sunetului. Acestea pot fi in plus clasificate in MPEG-1, MPEG-2 MC (multichannel) si MPEG-2 LSF (low sampling frequency), in functie de numarul de canale codate si de frecventa de esantionare. Deoarece Layer I si Layer II sunt foarte asemanatoare, ele vor fi prezentate impreuna.
Partea comuna intre Layer I/II si Layer III este aceea ca algoritmii lor au la baza codarea pe sub-benzi cu 32 de benzi. Numarul de canale este doi, iar frecventa de esantionare este de 32, 44,1 sau 48 kHz. Aceste caracteristici reprezinta algoritmul MPEG-1/audio care reprezinta baza pentru toate codurile. Plecind de la algoritmul MPEG-1/audio, avind frecventele de esantionare 32, 44,1 si 48 kHz, a fost elaborat standardul MPEG-2 LSF care foloseste frecventele 16, 22,05 si 24 kHz. Crescind numarul de canale la 5 si prin imbunatatirea canalului de joasa frecventa a fost elaborat standardul MPEG-2 MC. Numarul de canale care pot fi manipulate de standardul MPEG-2/audio este denumit uneori 5,1, considerind ca imbunatatirea canalului este 0,1. Cind se compara MPEG-2/audio cu MPEG-1/audio ca standard, MPEG-1/audio ar putea fi numit MPEG-2 2C (doua canale) sau MPEG-2 HSF (frecventa mare de esantionare). In Fig. 3.1 este prezentata structura de baza a algoritmului MPEG audio. Din figura se vede clar ca MPEG-1/audio este nucleul algoritmilor MPEG-2/audio.
In Fig. 3.2 este data schema bloc care descrie algoritmul MPEG-1/audio. Algoritmul se bazeaza pe codarea pe sub-benzi, iar impartirea pe sub-benzi este obtinuta cu ajutorul unui banc de filtrare polifazat (PFB – polyphase filter bank) cu un filtru in cuadratura in oglinada (QMF – quadrature mirror filter). Un semnal de intrare cuantizat liniar PCM pe 16 biti este translatat in domeniul frecventa in 32 de benzi. In acelasi timp limitele benzilor (denumite nivele de mascare) sunt calculate printr-o analiza psihoacustica pentru a obtine eroarea de cuantizare permisa. Semnalul divizat in sub-benzi este cuantizat si codat conform schemei de alocare a bitilor bazata pe modelul psihoacustic, este constituite in cadre, impreuna cu date auxiliare (ancillary data). Aceste date suplimentare nu sunt folosite pentru operatia codare si decodare, utilizatorul le poate folosi in alte scopuri. Pentru decodare, intii sunt separate datele suplimentare si apoi este dezasamblat cadrul.
Apoi este efectuata decodarea si decuatizarea pe bzaa bitilor alocati pentru informatie. Este refacut apoi semnalul temporal prine reunirea benzilor. In practica au fost definite trei tipuri de algoritmi, Layer I, Layer II si Layer III, pe baza structurii din Fig. 3.2 (vezi Fig. 3.3). Codarea pe sub-benzi, ponderarea psyhoacustica, alocarea bitilor si intensitatea stereo este folosita de toati algoritmii. Layer III foloseste in plus codarea transformatei cu lungime adaptiva a blocului, codarea Huffman imbunatatirea calitatii codarii pentru stereo.
Preview document
Conținut arhivă zip
- Compresia Audio - Algoritmul MPEG 1 Layer 3.doc