Компресија аудио записа и формати аудио записа

Компресија аудио-записа

За запис једног минута звука у стерео техници са тзв. CD квалитетом звука потребно је: 44100Hz*2бајта*2канала*60s=10,5MB
Ако узмемо у обзир да просечна музичка нумера траје око 4 минута потребно је 40MB за њено смештање. Класичан CD има капацитет од 700MB што значи да на њега може да стане петнаестак песама.
Због тога се примењије поступак сажимања записа звучног сигнала — компресија. Постоји компресија без губитака и компресија са губицима. Обрнут поступак назива се декомпресија. Програм за компресију и декомпресију назива се кодек.
Компресија без губитака даје квалитет сигнала идентичан оригиналном, а степен компресије је 1:2 или 1:3. Компресија са губицима сажима аудио сигнал 10 пута, али опада квалитет звука.

Компресија без губитака

Компресија без губитака компресује аудио садржај на такав начин да се приликом његове декомпресије добија сигнал који је потпуно идентичан почетном сигналу. Иако има својих предности, ова врста компресије није постигла већу популарност у дигиталној аудио компресији, првенствено због малог степена компресије који се за звук CD квалитета (16 бита, 44.1kHz) креће између 30% и 50%. Технике компресије без губитака се углавном разликују по брзини аудио компресије и декомпресије док квалитет компресованог садржаја нема никакву улогу.

Компресија са губицима

Звук који се сматра „мање важним“ је кодован са смањеном прецизношћу или није у опште кодован, због тога компресија са губитком смањује тај схватљиви вишак. Да би се одредило које информације у аудио сигналу су „мање важне“, већина алгоритама компресије са губитком користе трансформације као што је модификована дискретна косинусна трансформација (MDCT) да конвертује временски домен семплованог звука у домен фреквенције. Компонентама фреквенција могу се доделити битови на основу њихове звучности. Звучност фреквенцијске компоненте се дефинише тако што се прво израчунава праг за који се претпоставља да је звук изван граница људског осећаја. Неки алгоритми компресије са губитком користе LPC (Linear Perceptive Coding) да конвертују временски домен семплованог звука.
Пошто код компресије са губитком долази до опадања квалитета аудио звука, ова компресија се сматра неодговарајућом код професионалних аудио апликација као што је мењање звука и снимања више канала (односно трака) звука. Међутим, ова компресија је веома погодна за пренос и складиштење аудио података.


Формати аудио записа

Формати звучних записа се деле на:

1. некомпресоване формате (MIDI, WAV, AIFF)
2. компресоване податке без губитака (WMA, FLAC)
3. компресоване формате с губицима (MP3, Ogg Vorbis, AAC)

MIDI, скраћеница од Musical Instrument Digital Interface, је електронски интерфејс који се користи при компоновању или обрађивању музике. MIDI је веза за комуникацију између синтисајзера и друге опреме, као што су рачунари, звучне картице и ритам машине. MIDI у себи не садржи звук већ команде за инструменте и наведену опрему. MIDI је врло популаран код музичара а користи се од 1983. године. Скоро сви синтисајзери направљени после те године користе овај индустријски стандард за комуникацију. Овај стандард даје детаљан опис музичке нотације (нотни запис), дефинише 127 музичких инструмената. Заузима мало простора, брзо се учитава и репродукиује, али не може се користити за репродукцију говора.

WAV је формат развијен за коришћење у Windows окружењу. У овом формату се најчешће врши снимање за каснију репродукцију. Фајлови у овом формати имају наставак .wav.

Audio Interchange File Format (AIFF) је аудио формат стандард који се користи за чување звучних података за персоналне рачунаре и друге електронске аудио уређаја. Формат је развио  Apple Computer 1988, на основу Format Interchange File (IFF, коришћен на Амига системима) и најчешће се користи на Apple Macintosh рачунарским системима.


Windovs Media Audio (WMA) је технологија аудио компресије података коју је развио Microsoft. Име може да означава аудио формат датотеке или аудио кодек. Оригинални WMA кодек,  био је замишљен као конкурент форматима MP3 и RealAudio

FLAC (Free Lossless Audio Codec) је кодек који омогућава да дигитални аудио сигнал буде компресован без губитака тако да се величина фајла смањи без икаквог губитка информација. FLAC обично смањи величину фајла на 50-60% почетне величине и при декомпресији даје оригинални аудио фајл! FLAC је отворени формат, подржава metadata, омот албума и брзу претрагу.


MP3 или MPEG-1 Audio Layer 3 је најраширенији аудио формат записа фајла у коме је примењена компресија са губитком. Постао је широко распрострањен употребом интернет сервиса, почевши од Napster-a до разних P2P програма за размену датотека путем мреже. Упркос томе, MP3 је заправо затворени (closed-source) формат, заштићен патентом. Алтернатива MP3 формату је Ogg формат, отворени формат, с вишим степеном компресије, али и мањом распрострањеношћу.

Ogg је производ пројекта софтвер отвореног изворног кода за дигиталну мултимедију. Разне компоненете пројекта су намењене да буду алтернативе власничким кодецима као што су:
– Mp3 и Mpeg
– RealAudio и RealVideo
– QuickTime формат тока и његови кодеци
– Riff формати и његови деривати као што су Wav и Avi и њихови респективни кодеци
– ASF са Windows Media Audio и Windows Media Video кодецима
Главна Ogg компонента је Vorbis – за аудио податке. Остале компоненте су Theora – за видео; Speex – за говор; и FLAC – за велику веродостојност аудио-записа.

AAC (Advanced Audio Coding) је стандардизована кодна шема за компресију са губицима за дигитални аудио. Пројектован као наследник mp3 формата, уопштено постиже бољи квалитет звука од mp3 при сличним битским брзинама.


Постоје још неки формати аудио записа који се најчешће користе у комбинацији са видео записима како би се добио комплетан видео фајл. Поред .mp3 и .aac формата користе се и:

AC-3 (Dolby Digital) је један од најчешће коришћених формата аудио записа на DVD Video дисковима. Дозвољава употребу до 6 канала. Најчешће се AC-3 употребљава као формат за такозвани 5.1 surround звук. Постиже сличну компресију и сличан квалитет као mp3, па се може користити и за DivX филмове.

AMR (Adaptive Multi-Rate) – формат аудио записа првенствено намењен за говор. Користи се као формат записа за снимање говора на мобилним телефонима. Такође се користи као један од аудио формата код мобилних телефона који могу снимати видео у 3GP формату.

Advertisements

Оставите одговор

Попуните детаље испод или притисните на иконицу да бисте се пријавили:

WordPress.com лого

Коментаришет користећи свој WordPress.com налог. Одјавите се / Промени )

Слика на Твитеру

Коментаришет користећи свој Twitter налог. Одјавите се / Промени )

Фејсбукова фотографија

Коментаришет користећи свој Facebook налог. Одјавите се / Промени )

Google+ photo

Коментаришет користећи свој Google+ налог. Одјавите се / Промени )

Повезивање са %s