成長日誌belong屁屁: 數位訊號處理

音訊壓縮技術的種類

音訊壓縮技術是將數位的聲音訊號以更少的0與1表示，使檔案變小，節省儲存檔案時所需要的時間與傳送資料時所需要的通訊頻寬，音訊壓縮技術的種類很多，包括：MP3、WMA、WAV、AAC、AC-3等

失真資料壓縮

即將次要的資訊捨棄，犧牲一些品質來減少資料量，使壓縮比提高。這種方法經常用於網際網路尤其是串流媒體以及電話領域。它是與無失真資料壓縮對應的壓縮方法。而他根據各種格式設計的不同，失真資料壓縮都會有損失——壓縮與解壓檔案都會帶來漸進的品質下降

常見的無失真壓縮演算法

ABO

遮蔽效應

在心理學中這是一種聽覺模型，也就是說當你聽音樂時某個感覺特別強烈時，會漸漸感覺不到其他的聲音

位元儲存槽

— CBR 好處是壓縮速度快，缺點就是每秒鐘的流量都相同，很容易造成空間的浪費。
用途是當波型簡單時不要用那麼大的流量，把多餘的空間保留下來儲存將來比較複雜的波性資料，維持流量的大小

— VBR每秒鐘的流量是可以變化的，好處是在訊號複雜時用比較多的容量去紀錄，波型簡單時就用比較低的流量，以有效利用空間。

Huffman編碼

他可以節省約20%的空間，但我們可以發現用WinZip、WinRAR之類的壓縮軟體並沒有辦法把MP3檔縮小多少，理由就是因為這些壓縮軟體也是利用類似Huffman編碼的技巧，因此壓縮程度有限。

＞脈碼調變(PCM)

如＜圖9-7(a)＞所示，圖中的虛線代表脈碼調變取出的數位訊號，可以看出如果X軸為時間，則低頻的聲音振動較慢，高頻的聲音振動較快。

>時域/頻域轉換(Time/Frequency mapping)

要將X軸由時間轉換為頻率最簡單的方法是使用「傅利葉轉換

時域轉頻域的原因，當時域為X軸時，所有頻率的聲音都會混在一起，就會很難將高頻與低頻的訊號濾掉或減少

>聲音心理學量化

但是人類的耳朵對極高頻與極低頻的聲音並不敏感，就算將它去除也不會被聽出來

而聲音心理學模型就是剛剛提到最小聽覺門檻的原理

成長日誌belong屁屁