EN

核心技術

所在位置:首頁 > 核心技術

去混響技術總結

時間:2022-05-23   來源:原創(chuàng)    人氣:1850

  混響(reverberation)是相對封閉空間如房間中,產(chǎn)生的一種典型聲學現(xiàn)象。聲波在房間中傳播時,遇到墻面、地面、天花板或其他物體表面時,會被阻礙并反射回來,反射聲波在傳播過程中再次遇到障礙物時,會形成二次反射,如此反復。在傳播以及反射的過程中,聲波不斷被壁面吸收會慢慢衰減。聲波在各個方向來回反射,而又逐漸衰減的現(xiàn)象稱為混響。
  對于房間中的人來說,從聲源處直接到達人耳的聲波叫直達聲,而經(jīng)過壁面一次或多次反射到人耳的聲波,聽起來像是直達聲的延續(xù),叫做混響聲。

  下面兩段音軌,左邊的是在消聲室中錄制的直達聲信號,沒有混響;右邊模擬房間環(huán)境處理后得到的有混響的信號;混響聲聽起來像是無混響聲的延續(xù)和拖尾。

   

  混響時間是度量房間內(nèi)混響程度的基本指標之一?;祉憰r間用來描述房間內(nèi)聲音衰減快慢的程度。它的定義為:聲源停止后聲音在房間內(nèi)較初始聲壓級衰減60dB所經(jīng)過的時間,一般用T60表示。計算混響時間有一個有名的公式,叫“塞賓公式”,定義如下:

  其中,V為房間體積,S為房間的表面積,為平均吸聲系數(shù)。一般的,房間越大,室內(nèi)越空曠,混響時間會越長。因此,像銀行營業(yè)大廳、金庫,這種空間較大、壁面光滑的空間里,混響時間明顯較長。
  混響的作用:
  合適的混響時間,對于房間的聽音效果有重要的作用,能使人聲聽起來豐滿立體,有空間感?;祉憰r間太短,聲音聽起來會干澀、空曠、不飽滿。過長的混響時間會使人感到聲音渾濁不清。一般房間的混響時間在1s以內(nèi)較為合適。
  對于音頻監(jiān)控來說,房間混響往往是清晰拾音的一個重要挑戰(zhàn)。當人距離拾音設備較遠時,直達聲和混響聲的比值較小,即使聲音較大,在一般的混響環(huán)境中,仍然較難聽清楚。實際的音頻監(jiān)控場所中,如銀行營業(yè)大廳、中型會議室等,往往未做聲學處理,混響時間較長,要在這樣的場合里,遠場清晰的拾取聲音,仍然存在比較大的困難。
  混響除影響拾音的音質(zhì)外,也明顯的影響自動語音識別(ASR)的識別率。如上面的語譜圖所示,沒有混響的語音,其聲紋清晰可辨,而有混響的語音,聲紋模糊不清。因此,如何消除錄音中的混響,也是提高語音識別率需要解決的問題。
  去混響技術

  混響影響拾音音質(zhì)和語音識別率,因此需要從拾音信號中去除混響聲,這種技術就是去混響技術。一般去混響主要有三種技術:第一種方法,麥克風拾取的信號可以看作聲源信號與房間沖擊響應的卷積生成的信號,通過這種數(shù)學模型來消除混響,在估計房間聲學模型參數(shù)之后,形成對原始信號的估計。第二種方法,通過將混響視為一種噪聲,通過適用于混響的降噪過程來抑制混響,事實上,一般的語音降噪算法都具有一定的去混響效果;第三種方法,采用深度學習的方法去混響,經(jīng)過神經(jīng)網(wǎng)絡后,得到頻域的濾波系數(shù)。混響信號經(jīng)過濾波后,輸出去混響信號。這樣的網(wǎng)絡經(jīng)過大量數(shù)據(jù)訓練后,用于去混響處理,就能得到較清晰的信號。

  上圖為混響產(chǎn)生與去混響的過程模型,為語音信號,經(jīng)過房間響應卷積后,形成混響信號,加上引入的房間噪聲或其他噪聲,形成麥克風處拾取的信號。信號經(jīng)過濾波器后,獲得去混響的信號?!硐肭闆r下,關系如下:

  多通道去混響技術,采用麥克風陣列(多個麥克風),可以較為準確的預測房間的沖激響應,從而估計逆濾波器,經(jīng)逆濾波后形成去混響的信號;

  下圖左邊為去混響前的信號,右圖為去混響后的信號

        

    

  引用:
  《聲學基礎》,杜功煥等,南京大學出版社
  https://en.wikipedia.org/wiki/Reverberation
分享到:
微信客服二維碼

掃一掃加好友咨詢