2015年6月26日 星期五

數位訊號處理

音訊壓縮技術的種類
音訊壓縮技術是將數位的聲音訊號以更少的01表示,使檔案變小,節省儲存檔案時所需要的時間與傳送資料時所需要的通訊頻寬,音訊壓縮技術的種類很多,包括:MP3WMAWAVAACAC-3

失真資料壓縮
即將次要的資訊捨棄,犧牲一些品質來減少資料量,使壓縮比提高。這種方法經常用於網際網路尤其是串流媒體以及電話領域。它是與無失真資料壓縮對應的壓縮方法。而他根據各種格式設計的不同,失真資料壓縮都會有損失——壓縮與解壓檔案都會帶來漸進的品質下降

常見的無失真壓縮演算法

遮蔽效應
在心理學中這是一種聽覺模型,也就是說當你聽音樂時某個感覺特別強烈時,會漸漸感覺不到其他的聲音

位元儲存槽
  CBR 好處是壓縮速度快,缺點就是每秒鐘的流量都相同,很容易造成空間的浪費。
用途是當波型簡單時不要用那麼大的流量,把多餘的空間保留下來儲存將來比較複雜的波性資料,維持流量的大小
  VBR每秒鐘的流量是可以變化的,好處是在訊號複雜時用比較多的容量去紀錄,波型簡單時就用比較低的流量,以有效利用空間。

Huffman編碼
他可以節省約20%的空間,但我們可以發現用WinZipWinRAR之類的壓縮軟體並沒有辦法把MP3檔縮小多少,理由就是因為這些壓縮軟體也是利用類似Huffman編碼的技巧,因此壓縮程度有限。




>脈碼調變(PCM)
如<圖9-7(a)>所示,圖中的虛線代表脈碼調變取出的數位訊號,可以看出如果X軸為時間,則低頻的聲音振動較慢,高頻的聲音振動較快。
>時域/頻域轉換(Time/Frequency mapping)
要將X軸由時間轉換為頻率最簡單的方法是使用「傅利葉轉換
時域轉頻域的原因,當時域為X軸時,所有頻率的聲音都會混在一起,就會很難將高頻與低頻的訊號濾掉或減少

>聲音心理學量化
但是人類的耳朵對極高頻與極低頻的聲音並不敏感,就算將它去除也不會被聽出來
而聲音心理學模型就是剛剛提到最小聽覺門檻的原理


沒有留言:

張貼留言