A. 音頻有損壓縮技術
音頻壓縮:音頻編碼,不進行壓縮,每秒產生的數據大小是1M多,數據太大了
有損壓縮 :當我們把數據進行壓縮之後,無法還原回跟原來一模一樣的信息了
無損壓縮 :是對文件本身的壓縮,和其它數據文件的壓縮一樣,是對文件的數據存儲方式進行優化,採用某種演算法表示重復的數據陸坦信息,文件可以完全還原,不會影響文件內容,對於數碼圖像而言,也就不會使圖像細節有任何損失。
感謝分享
有損壓縮
無損壓縮
音頻壓縮技術是在保證信號在聽覺方面不產生失真的前提下,對音頻數據信號進行盡可能大的壓縮
壓縮的主要方法: 是取出採集到的音頻冗餘信息。所謂冗餘信息包括人耳聽覺范圍外的音頻信號以及唄。
信號的遮蔽 可以分為 頻域遮蔽 和 時域遮蔽 。
圖片1
現實生活中,聲音是一種復合聲音(各種聲音參雜在一起),在與人對話的時候,聽到對方說的,我們聽到的,是對方說話的聲音和好多環境的聲音,比如關冰箱、水壺響,其實是參雜在一起,但是我們為什麼能聽見對方說的話,而聽不見這些聲音呢?是因為對方說的聲音,覆蓋早大桐掉了例如水壺響啊、關冰箱聲音等,遮蔽掉了,如何遮蔽的呢?2種技術, 一種是頻域遮蔽,另一種是時域遮蔽 。
頻域遮蔽 和 時域遮蔽 這個太深奧,在這里不做解釋了,設計到的內容太深了,本人掌握的一點,不敢誤導人,所以就不寫了。
感謝分享
時域和頻域轉換 傅立葉變換
轉換之後,我們只關心我們需要的波形,不要的就要替換掉,那些數據應該保留,那些數據應該扔掉呢?
圖片1就給我們做了解釋,橫軸是它的頻率范圍,到0.02單位是khz,0.02也就是20hz,20hz一下的,人也不感知,縱軸是聲音的強度,有一條靜音門檻,這條曲線之下的聲音都是被屏蔽掉的,人都是聽不到的, 曲線之上的還有一個遮蔽效應,就是在不同的頻域上,它會有一個范圍,在這個范圍之內的聲音,也是被屏蔽掉的,2個女生說話,在相同頻域范圍內,聲音高的 會把聲音低的這個人的聲音屏蔽掉,這也是為啥2個女生吵架的時候,聲音高的很容易讓人聽見,男生和女生說話,雖然女生的聲音高,但是男生的聲音不一定被屏蔽掉,男生的聲音在橫軸0.25khz范圍上,縱軸在30dB上,沒在遮蔽源范圍內,還是可以聽見男生說話的。
時仿轎域遮蔽:隨著時間的推移,它是如何產生遮蔽效應的。橫軸是時間,縱軸是聲音強度,圖2所示,0-200,同時有很多聲音進來,聲強的會壓住聲弱的。聲強之前的聲音也會被屏蔽掉。在50毫秒內,越靠近這個人說話,越會被屏蔽掉。對於後面的屏蔽更長了,達到了200毫秒,你超過它,你就把前面的聲音給屏蔽掉了,就看圖2後屏蔽這。