數(shù)字音頻信號(hào)壓縮技術(shù)的兩大操作方案
更新時(shí)間:2018-3-22 14:09:49 編輯:臧成 文章來(lái)源:音響網(wǎng) 調(diào)整文字大小:【
大中小】
[導(dǎo)讀] 音頻信號(hào)經(jīng)數(shù)字化編碼后,面臨的最大難題之一是海量數(shù)據(jù)存儲(chǔ)與傳輸?shù)膯?wèn)題。數(shù)字音頻信號(hào)的壓縮技術(shù)是數(shù)字電視廣播系統(tǒng)中非常重要的一個(gè)環(huán)節(jié)。壓縮效率和壓縮質(zhì)量直接影響著數(shù)字電視廣播的傳輸效率和音視頻的傳輸質(zhì)量。
音頻信號(hào)經(jīng)數(shù)字化編碼后,面臨的最大難題之一是海量數(shù)據(jù)存儲(chǔ)與傳輸?shù)膯?wèn)題。數(shù)字音頻信號(hào)的壓縮技術(shù)是數(shù)字電視廣播系統(tǒng)中非常重要的一個(gè)環(huán)節(jié)。壓縮效率和壓縮質(zhì)量直接影響著數(shù)字電視廣播的傳輸效率和音視頻的傳輸質(zhì)量。本文主要對(duì)數(shù)字音頻壓縮技術(shù)做了淺要的分析。
相比模擬信號(hào),數(shù)字信號(hào)具有很明顯的優(yōu)勢(shì),但數(shù)字信號(hào)也有自身相應(yīng)的缺點(diǎn),即對(duì)存儲(chǔ)容量需求以及對(duì)傳輸時(shí)信道容量要求的增加。音頻壓縮技術(shù)指的是對(duì)原始數(shù)字音頻信號(hào)流(PCM編碼)運(yùn)用適當(dāng)?shù)臄?shù)字信號(hào)處理技術(shù),在不損失有用信息量,或所引入損失可忽略的條件下,降低(壓縮)其碼率,也稱(chēng)為壓縮編碼。它必須具有相應(yīng)的逆變換,稱(chēng)為解壓縮或解碼。一般來(lái)講,可以將音頻壓縮技術(shù)分為無(wú)損數(shù)據(jù)壓縮及有損數(shù)據(jù)壓縮兩大類(lèi)。
無(wú) 損 數(shù) 據(jù) 壓 縮
使用無(wú)損壓縮方案可以在解壓縮后逐位恢復(fù)原始數(shù)據(jù)信息。他們通過(guò)預(yù)測(cè)過(guò)去樣本中的值,消除存在于音頻信號(hào)中的統(tǒng)計(jì)冗余?梢詫(shí)現(xiàn)小壓縮比,最好大約2:1,取決于原始音頻信號(hào)的復(fù)雜性。時(shí)域預(yù)測(cè)編碼技術(shù)使無(wú)損壓縮成為可行,要?dú)w功于時(shí)域預(yù)測(cè)碼技術(shù)。他們是:
1.差分算法
音頻信號(hào)包含重復(fù)的聲音,還有大量的冗余和感知的不相關(guān)聲音。重復(fù)的數(shù)據(jù)信息在編碼過(guò)程中被刪除,在解碼時(shí)又被重新引入。音頻信號(hào)首先分解為若干包含離散音調(diào)的子頻帶。然后使用合適于短期定期信號(hào)的預(yù)測(cè)器應(yīng)用DPCM。這種編碼是自適應(yīng)的,它查看輸入信號(hào)能量以修改量化步長(zhǎng)。這就引出了所謂的自適應(yīng)DPCM(ADPCM)。
2.熵編碼器
利用量化子頻帶系數(shù)表示形式中的冗余來(lái)提高熵編碼效率。這些系數(shù)以逐漸增加的頻率順序發(fā)送,在低頻產(chǎn)生較大的值,在高頻產(chǎn)生較小后接近零值的長(zhǎng)行程。VLC取自與低頻值和高頻值的統(tǒng)計(jì)最一致的不同的哈夫曼表。
3.塊浮點(diǎn)系統(tǒng)
來(lái)自A/D轉(zhuǎn)換過(guò)程的二進(jìn)制值分組為數(shù)據(jù)塊,要么是在時(shí)域內(nèi),通過(guò)在A(yíng)/D轉(zhuǎn)換傳輸出端采用相鄰的樣本;要么是在頻域內(nèi),通過(guò)在FDCT輸出端采用相鄰的頻率系數(shù)。然后數(shù)據(jù)塊中的二進(jìn)制值按比例增大,以使最大的值僅低于完全換算值。該換算因子稱(chēng)為指數(shù),對(duì)塊中所有的值都通用。
因此,每個(gè)值都可用一個(gè)尾數(shù)(一個(gè)樣本值)和指示正數(shù)決定。位分配計(jì)算從HAS模型派生,實(shí)現(xiàn)數(shù)據(jù)速率壓縮的方法是每個(gè)數(shù)據(jù)塊發(fā)送一次指數(shù)值。編碼性能很好,但噪音與信號(hào)內(nèi)容有關(guān)。屏蔽技術(shù)有助于減少這種聽(tīng)得見(jiàn)的噪音。
有 損 數(shù) 據(jù) 壓 縮
實(shí)現(xiàn)有損數(shù)據(jù)壓縮的方法是,將兩個(gè)或更多的處理技術(shù)相結(jié)合,以利用HAS的無(wú)法檢測(cè)到其他高振幅中的特定頻譜分量這一特性。這樣一來(lái),就可以獲得高性能數(shù)據(jù)壓縮方案和從2:1到20:1的高得多的壓縮比,具體取決于編碼/解碼過(guò)程的復(fù)雜性和音頻質(zhì)量要求。
有損數(shù)據(jù)壓縮系統(tǒng)使用感知編碼技術(shù)。基本原理是,放棄低于閾值曲線(xiàn)的所有信號(hào)以消除音頻信號(hào)中的感知冗余。因此,這些有損數(shù)據(jù)壓縮系統(tǒng)還稱(chēng)為感知無(wú)損。感知無(wú)損壓縮之所以可行,歸功于若干技術(shù)的結(jié)合,如:
1.信號(hào)分量的時(shí)間和頻域屏蔽。
2.量化每個(gè)可聽(tīng)得見(jiàn)的音調(diào)的噪音屏蔽
通過(guò)分配足夠的位,確保量化噪音級(jí)別總是低于屏蔽曲線(xiàn)。在接近聽(tīng)得見(jiàn)的信號(hào)的頻率下,20或30DB的SNR是可以接受的。
3.聯(lián)合編碼
該技術(shù)利用了多通道音頻系統(tǒng)中的冗余。已發(fā)現(xiàn)在所有通道中存在大量的相同數(shù)據(jù)。因此,通過(guò)一次編碼這些相同的數(shù)據(jù)可以得到數(shù)據(jù)壓縮,并向解碼器指示在其他通道中必須重復(fù)這些數(shù)據(jù)。
音頻解碼過(guò)程的實(shí)現(xiàn)
最重要的屏蔽效果出現(xiàn)在頻域內(nèi)。為了利用該屬性,音頻信號(hào)頻譜按照與HAS臨界帶寬匹配的時(shí)間和頻率分辨率分解為多個(gè)子頻帶。
感知編碼器的結(jié)構(gòu),由以下幾個(gè)部分組成:
1.多帶濾波器
通常稱(chēng)為濾波器組,其作用是將頻譜分解為子頻帶。
2.比特分配器
用于估算屏蔽閾值并以音頻信號(hào)頻譜能量和心理學(xué)模型為依據(jù)來(lái)分配比特。
3.換算和量化處理器
4.數(shù)據(jù)復(fù)用器
用于接收已量化的數(shù)據(jù)和添加解碼過(guò)程的副信息(位分配和換算因子信息)。
3.1 濾波器組 (有三種類(lèi)型的濾波器組)
。1)子頻帶組。信號(hào)頻譜被分為等寬頻率子頻帶。這類(lèi)似于頻率分析的HAS過(guò)程,后者將音頻頻譜分為臨界頻帶。臨界子頻帶的寬度可變。低于500Hz的帶寬為100Hz,在10KHz,在10KHz以上的帶寬增加到幾KHz。低于500H在的子頻帶包含若干臨界頻帶。子頻帶濾波器有小重疊,通常用于相鄰時(shí)間樣本。每個(gè)子頻帶信號(hào)然后用該子頻帶的位分配統(tǒng)一量化,以保持正的屏蔽噪音比(MNR)。當(dāng)屏蔽曲線(xiàn)在噪音曲線(xiàn)之上時(shí),該比率為正。
。2)轉(zhuǎn)換組。已修改的DCT(MDCT)算法通常用于將時(shí)域音頻信號(hào)轉(zhuǎn)換為大量的子頻帶(256到1024)。這種濾波器組中也存在一些重疊。
(3)混合濾波器組。它們由子頻帶濾波器后跟MDCT濾波器組成。這種組合提供了更精細(xì)的頻率分辨率。
3.2 感知模型、屏蔽曲線(xiàn)和位分配
輸入PCM信號(hào)的精確心理學(xué)分析是就其頻率和能量?jī)?nèi)容執(zhí)行的,使用的工具是快速傅里葉變換的算法。從聽(tīng)力閾值和HAS的頻率屏蔽屬性計(jì)算出屏蔽曲線(xiàn)。該屏蔽曲線(xiàn)的形狀和級(jí)別與信號(hào)內(nèi)容有關(guān)。頻譜信號(hào)封裝與屏蔽曲線(xiàn)的差值確定了編碼音頻信號(hào)的所有頻譜分量所需要的最大比特?cái)?shù)(以每位6dB為基礎(chǔ))。這種比特分配過(guò)程確保了量化噪音低于聽(tīng)得見(jiàn)得閾值。
從屏蔽曲線(xiàn)中導(dǎo)出了每個(gè)子頻帶的屏蔽閾值。每個(gè)閾值確定了每個(gè)子頻帶中可以接受的最大量化噪音能量,在閾值處于對(duì)于感知無(wú)損壓縮系統(tǒng)噪音開(kāi)始能夠聽(tīng)見(jiàn)。
3.3 換算器和量化器
來(lái)自每個(gè)子頻帶濾波器輸出樣本通過(guò)兩種方法換算和量化:
。1)塊浮點(diǎn)系統(tǒng)。該系統(tǒng)將數(shù)據(jù)塊中的最大值標(biāo)準(zhǔn)化為完全換算值。此塊換算因子在數(shù)據(jù)流內(nèi)傳輸,解碼器使用它向下?lián)Q算塊中的所有數(shù)據(jù)值。在MPEG第一層中,數(shù)據(jù)塊由12個(gè)連續(xù)樣本組成音頻時(shí)間由384個(gè)樣本組成(32個(gè)子頻帶,每個(gè)子頻帶12個(gè)樣本)。所有數(shù)據(jù)塊的值然后被量化量化步長(zhǎng)值由比特分配器來(lái)確定。
(2)噪音分配和標(biāo)量量化。前面方法中,每個(gè)子頻帶有不同的換算因子。
第2種方法對(duì)于具有大約臨界帶寬的幾個(gè)頻帶采用相同的換算因子。此換算因子的值不從標(biāo)準(zhǔn)過(guò)程中導(dǎo)出,而是噪音分配過(guò)程的一部分。這里不執(zhí)行位分配。估算每個(gè)子頻帶屏蔽閾值后,用換算因子來(lái)修改換算因子頻帶中所有的量化步長(zhǎng)值,以便修改量化噪音結(jié)構(gòu),更好地與閾值的頻率線(xiàn)相匹配。不統(tǒng)一的量化處理用于使量化噪音以?xún)?yōu)化的方式與信號(hào)幅度相適應(yīng)。接下來(lái)是用哈夫曼編碼對(duì)音頻頻譜值進(jìn)行編碼,并得到更好的數(shù)據(jù)壓縮。
3.4 數(shù)據(jù)多路復(fù)用器
來(lái)自每個(gè)量化器輸出的12個(gè)數(shù)據(jù)樣本的塊與其他相應(yīng)的換算因子及比特分配信息多路復(fù)用,以形成已編碼位流中的音頻幀。也可以將可選的輔助數(shù)據(jù)插入到該位流中。MPEG標(biāo)準(zhǔn)沒(méi)有指定能夠傳輸?shù)臄?shù)據(jù)類(lèi)型以及這些數(shù)據(jù)類(lèi)型在位流中的格式化方式。
文章來(lái)源:音響網(wǎng) ©版權(quán)所有。未經(jīng)許可,不得轉(zhuǎn)載。
網(wǎng)友評(píng)論
編輯推薦