服務熱線:0755-26751199
音響網(Audio160.com) > 行業資訊 > (專業音頻) > Dirac 聲學論文:關于對聲音系統的室內修正和均衡
Dirac 聲學論文:關于對聲音系統的室內修正和均衡
更新時間:2023-12-5 8:51:36 編輯:溫情 Dirac 調整文字大小:【

出處:https://www.dirac.com/wp-content/uploads/2021/09/On_Equalization_Filters_Chinese_final.pdf

作者:馬賽厄斯·約翰遜, 狄拉克研究公司 (Mathias Johansson, Dirac Research AB)。

大綱

1、有限沖激響應(FIR)和無限沖激響應(IIR)濾波器

2、關于相位的概念

3、傅里葉變換和頻率的概念

4、真實的立體聲再現

5、有些反射好,有些不好

6、總結和建議

7、致謝

 

本文將討論若干有關均衡聲音系統的濾波器設計問題。討論的重點將放在基本原理上而不是在實驗上,我將聚焦幾個常見的誤解。我先簡單介紹聲均衡所需的幾個基本概念,例如有限沖激響應(FIR)和無限沖激響應(IIR)濾波器,最小和線性相位;和幾個基本數學論據以及《狄拉克現場修正方法》的哲學背景。為了限制本文的長度我假定對在此所談的話題有些基本了解。但我會避免在某些工程期刊中常出現的傾向,即把一些不好的想法隱藏在看似復雜的方程式 中。誠如開篇所言,討論的重點將放在不同均衡法的邏輯上,而非實驗。實驗總會讓人質疑其實驗條件,而本文的邏輯則可任由讀者檢驗。正如概率論所教導我們的那樣:一個幸運的實驗揭示不了其中的基本原理,但基本原理卻能夠更多地推測出未來的實驗結果。

附注:本文的某些部分在紐約市第 123 屆音頻工程學會會議上已介紹過。會議討論的議題是“有限沖激響應還是無限沖激響應?那就是問題!”

有限沖激響應(FIR)和無限沖激響應(IIR)濾波器

一個有限沖激響應(FIR)濾波器的輸出是 N 個最近的輸入采樣的加權平均。因此濾波器的階數或長度表示對濾波器的記憶長度。無限沖激響應(IIR)濾波器也是如此,只是它把以前的輸出采樣的加權平均加到第一個平均。當然權重可任意設置,但如果對應于以前的輸出的權重太大,顯而易見這將會導致輸出呈指數增長。這時的濾波器被稱為不穩定的。在經濟學上,常用一個更生動的術語稱之為“爆炸的”。一個 IIR 濾波器會制約于定點運算處理器的精度而變得不穩定,F有不同的方法實現一個高階 IIR 濾波器以減少這些問題所帶來的風險。最常見的方法是把 IIR 濾波器改寫成幾個串聯的二階濾波器,稱之為雙二階濾波器。用這種方法,數字誤差的影響能夠得以減少。由于 FIR 濾波器本身就是非遞歸的,所以不會變得不穩定,因此也更容易實現。

由于 IIR 濾波器固有的遞歸性,其沖激響應是無限(長)的。因而稱之為無限沖激響應濾波器。相比之下,FIR 濾波器(其階數小于無窮大)則有有限長的沖激響應。因此 IIR 濾波器似乎更靈活。這在某些意義上是對的,但IIR 濾波器有其局限性。首先,在實際當中搭建一個線性相位IIR 濾波器是不可能的(更多關于相位響應的概念見下文),因為一個線性相位系統必須有一個對稱的沖激響應,也就是說,用主脈沖做參考,響應的左邊和右邊的尾部是鏡像對稱的版本(準確地說,響應可能也會是逆對稱的,即一個負鏡像版本)。但對于一個因果 IIR 濾波器來說,顯然不是這樣,其右邊(記憶所有過去的輸入)有一無限長的尾巴而其左邊被截去了(它不能預見將來)。但在實際當中,如果我們想要一個線性相位濾波器我們也能用一個IIR 濾波器得到一個很好的近似。

下面一個問題有其不同的特點。當人們按照最小化(濾波器響應和所需響應之間的)均方誤差的準則設計一個優化的 IIR 濾波器時,數學式會變得很“難看”。這是一個非線性問題, 找到其正確的響應在數學上是很難地。雖然“很難”并不意味“不可能”。但這或多或少地為很多“懶漢”數學家們提供了遠離IIR 濾波器的借口(但這借口在用一個具有有限能力處理器來設計濾波器時是有道理的)。

那么為什么最簡單的音頻均衡器仍用 IIR 濾波器?一個原因是濾波器往往通過手工配置, 并且有閉型公式用于構建幾個簡單的濾波器類型,比如峰式/陷波濾波器,低通/高通濾波器, 傾斜型濾波器,等等。你能容易地實時調節 Q 值,然后聽其差別。不僅如此,IIR 濾波器與FIR 濾波器相比還具有另一優點:即在給定的低通濾波器的斜率下需要相對較少的系數。其原因就是 IIR 濾波器具有的遞歸性,這就像讓幾個濾波器接連地為同一個目標工作。

FIR 濾波器更容易實現(能在定點結構上運行),能更靈活地進行數學操作,可以有任意相位響應,但對一給定的濾波器的陡度,FIR 濾波器則需更多系數。這一點對于低頻范圍的分辨率來說是非常重要的。直觀地說,FIR 濾波器的長度與其處理的信號的波長有關。但只要可以采用具有足夠長度的FIR 濾波器,許多人就會更主張用FIR 濾波器而不是在數值計算上更復雜的 IIR 濾波器。

總而言之,在一個很好的近似范圍內,我們可用IIR 濾波器和 FIR 濾波器達到同樣的目的。選擇那一種濾波器更多地與其實現方式有關,并在某種程度上與其應用有關。于是為了對一組聲傳輸函數進行適當的沖激響應校正,則需要一個較長的濾波器,而用 IIR 濾波器似乎得不到更多益處。從另一方面來說,如果我們處理器的能力僅夠一個低階濾波器(比如 10 個雙二階濾波器或 20-40 個抽頭的 FIR 濾波器),那么沖激響應校正就不可能進行。此時更明智之舉是把注意力放在幅度響應上和使用最小相位雙二階濾波器。

最后應該指出,如果沖激響應校正要求一個非因果部分,那么 IIR 模型就不能較好地模擬了。而 IIR 濾波器對于設計得很好的均衡濾波器的因果部分來說可以作為一個好模型,這意味著最有效率的混合相位均衡器的實現方法之一是 IIR 和 FIR 濾波器的結合。

關于相位的概念

一個濾波器的相位響應表示一個純正弦波的輸入在輸出時其周期位移了多少。因此它是對頻率變量延遲的一種表示方法。

對群延遲的誤解

相位響應對頻率的導數叫群延遲。它有時被誤認為是在某一給定頻率的延遲。事實上群延遲只是測量以那個頻率為中心的窄帶信號的包絡(即形狀)。把它解釋成一個物理延遲是沒有意義的。為了得到在某一頻率的準確延遲,我們只要給相位響應一新的刻度,把角度量變成秒(如果我們更喜歡,也可以用米)。

例如:36 度相移指的是 1/10 周期的延遲。如果所說的頻率是 1000 赫茲,一個周期就是 1 毫秒,那么 1/10 周期的延遲就是 0.1 毫秒。

回到相位來

對于一個線性相位響應系統,其相位響應作為頻率的函數(在線性頻率刻度時)是一直 線。這意味著該系統在所有的頻率上引入了一固定延遲。但如上所說,一個線性相位濾波器總有一個對稱(或反對稱)的沖激響應。這意味著如果這樣一個濾波器的幅度響應不平坦,那么它將會在時域中引入前振蕩和后振蕩。其危險性有時會被在該領域的工作人員中被夸大。在實際中,如果一線性濾波器的幅度響應是平滑的(一均衡濾波器應該如此),其前振蕩則可忽略不計。

現在,我們也必須討論一下最小相位系統的概念。這是一個非常特殊的系統,它在所有的具有給定幅度響應的系統中具有最小能量延遲(在復平面中,一個最小相位系統的所有零極點都在單位圓內)。但必須強調,這絕不是指其沖激響應是所有的具有給定幅度響應的系統中是最短的,而是指它是最早的。這個差別是很大的!八窃绲摹睂τ谛枰WC延時最小的應用來說是一個有用的特征。對于聲音質量而言,沒有證據顯示最小相位均衡器聽起來比線性相位均衡器更好。事實上,線性相位濾波器的沖激響應一般比最小相位濾波器的短!白钚∠辔弧 這個術語容易誤導人,而如果在音頻界采用“最小能量延遲”這個術語的話就會好很多。確切的定義如下:考慮一個最小相位沖激響應和一個其他任意的具有相同幅度響應的線性系統,比較在任意時刻 t 上兩個系統輸出的累積能量,最小相位系統的(從時間零到 t 的)累積能量總比其他系統的大。這意味著其響應必須開始得早,否則我們總能建立另一系統,其在時間 t 接近零時比最小相位濾波器傳遞更多的能量。注意:最小相位系統,只是延時小于其他濾波器, 而并不意味著零延時。

根據眾所周知的復分析中的定律闡述,任何線性時不變系統可以因式分解成兩個系統:一最小相位系統和一全通系統。如果我們設計一個能完全可逆的最小相位系統的均衡器,就可以使得幅度響應變得平坦(這或許不是我們的最終目的,但我們可以暫且這樣假設,因為在此情況下這不會導致任何差別)。這時沖激響應發生了什么事情呢?有時我也會聽到能干的人說:我們至少沒有把它弄差,因為我們關心最小相位部分(最小相位系統的逆轉本身還是一個最小相位系統。因為對任何一個幅度響應只有一個最小相位部分,所以我們已經自動地考慮了它)。這個敘述的謬誤是顯然的:全通系統的沖激響應可能比整個系統的沖激響應差很多。如果你拿掉最小相位因子你可能會去掉在全通因子中抑制嚴重振蕩的特征。我們所選擇的因式分解方式完全是任意的,沒有任何物理解釋。我們只是選擇了一個不同的分解方式。

我們需要做的是看一看總的系統響應。如果我們因式分解它,我們最好是保證所用的因式分解具有物理聲學或心理聲學意義,并能根據其總響應評估最終結果。一個有很好物理動機的常用模型就是把室內不同位置的傳遞函數模擬成有一共同極點集和一個只有零點組成的位置變量傳遞函數。到現在為止,一直都還不錯。下一步就是說:行,我們要進行魯棒校正,因此只需要反轉極點。誤差就在這里產生了:即使它們(共同極點)對所有位置都的確相同,但拋開與位置相關的零點來看,它們將是沒有意義的。如果你只是去掉在低頻區域靠近單位圓的那些極點,這并不意味著你已經改善總體響應。首先,那些極點影響的并不只是它們碰巧最靠近的單位圓區域。它們也有助于減小在遠離那個區域的頻率的增益。類似地,靠近單位圓高頻范圍的那些與位置相關的零點會提升低頻范圍的能量。

從以上兩個例子中可學到的是:即使某一因式分解有物理意義或是便于數學考慮,但如果把每一個因子看成一個孤立的系統且認為只要能改進那個因子就會改善整個系統,那么這將是危險的愚蠢行為。但是正如基本邏輯教給我們的:一個假的前提意味著任何一個命題,即假的或真的。因此你也許能給出這樣一些例子,它們有時聽起來很好但基本原理有紕漏,但這并不意味著,有一個更好的基本原理你不能做得更好。

傅里葉變換和頻率的概念

正如丹尼斯·蓋伯(Dennis Gabor)于 1945 年所注意到的,一個信號的傅里葉的表達與人對頻率的感覺有明顯的不同。傅里葉變換是對一個時間序列在一個無限時間窗口上進行積 分。這會帶來一些有趣的結果。例如,一個變化的頻率就是一個矛盾措辭,按定義來說這是不可能的事情,因為時間已經排除在方程式以外。因此汽笛就有一個看似很有趣的傅里葉頻譜, 但這不容易表明其“本質”。如果我們根據蓋伯框架,或短時傅里葉變換,或其他時頻基底來分析時間序列,我們就能容易區分在某一時刻的某一頻率,在連續地變化音調。這種時頻表示法也能更好地描述人類的聽覺。對于人來說,頻率是與時間相關的。傅里葉表示法和知覺印象之間有明顯差別。

這對聲均衡有某些重要的含義。當我們讀到幅度響應的估計值時,我們用一個非常簡單的方法估計被感覺的頻譜,完全不考慮時間概念。比如,取一最小相位沖激響應然后將其反轉。前者在時刻 0 開始,然后隨某一時間常數衰減,直至其消失。而后者有大的前振蕩但沒有后振蕩。所有對人們感覺瞬態的研究表明,前回聲和后回聲聽起來完全不同,但它們的幅度響應卻是相同的。當然從這一點也同樣可看到,如果我們說一件事,然后以相反的方向回放此事。這兩個樣本都有相同的傅里葉幅度響應。這表明相位響應或者沖擊響應的確影響對聲音的感覺, 甚至對非立體聲源也是如此。顯然存在一個我們對相位有多敏感的閾值。但有關這方面的文獻(從 20 世紀 30 年代起,已有很多)已得出結論,這個閾值或積分時間常數是自適應的并隨我們所聽的東西的不同而不同。我們所能肯定的是,我們的確可以聽出絕對相位,但頻率越高我們就越不敏感(波傳播物理學指出,用聲學的方法在高頻時只能發射很少的相關信息,原因是高頻聲傳輸函數的混沌特性)。這意味著一個好的均衡器也應考慮相位而不僅僅幅度。

現在用一個例子來更清楚說明這一點?紤]在一房間里有一個揚聲器。A 先生測量了某一收聽容積中的沖激響應,喪氣地發現在所有的空間位置上其幅度響應在某一低頻處(比如說是300 赫茲)有一很寬的衰落。他先校準一峰值濾波器,然后去彌補該幅度響應的衰落。這被以后的測量所證實是對的。此時 B 先生進來了。B 先生是一位音樂家,他來聽被均衡的系統。他說:“這聽起來很糟糕。你們對這個系統做了什么?!聽起來很奇怪!”A 先生有點緊張不安起來,因為 B 先生是一位重要的顧客,于是 A 先生趕緊給他的一個朋友 C 先生。C 先生回答說:“啊,當然是的。衰落確實是因為反射造成的。你永遠不要去提升任何衰落。因為他們一般是由反射造成的!庇谑 A 先生拆掉了他的均衡器,讓 B 先生再來聽。但 B 先生仍然不滿意,說:“好一些。但還不夠好。這聲音有一些虛!边@時 D 女士進入交談。她一直靜靜地坐在角落里聽著。她說:“A 先生錯了,因為他忘記了時域。他只是看一看傅里葉變換的幅度然后解釋其與我們的頻率概念極為相關,便認為他能提升這個區域而得到更好的聲音。問題在于他用了最小相位濾波器,因此早些時間在那個頻率增加了能量。但如果我們只看直達波,在頻響中就沒有洞需要填滿。如果我們看任何時刻的一個窄時窗,這個洞根本就不存在!盉 先生皺皺眉頭地說:“C 先生說地對,我拿它沒辦法。但如果是這么回事,為什么在我的錄音中仍然聽到一個聲音奇怪雙簧管?”D 女士認真地看著他并說:“C 先生也不對。這問題的確是因為時域性質引起的,也就是由是反射引起這個問題。這只能用時域的方法來校正。如果我們設計一個減小反射的濾波器,你最終就會得到一個有趣的結果,即這個洞會消失、雙簧管聽起來會更自然!薄暗,”D 女士補充道,“不要把這個例子作為證明,說明你總能用此方法校正這些衰落!只是在當前這種情況下是可能的,因為所有的位置都有同樣的問題!

當論及一個好的聲學幅度響應應該是什么樣子的時候,不加批判地認為傅里葉變換的幅度是對我們的感覺(并因此忽視時間)可以準確描述顯然是種誤解。其答案取決于被測房間的時域特性。一個在大房間聽起來好的幅度響應可能在汽車內聽起來很糟,因為它們的混響比完全不同。

提升衰落的基本問題是:通常用一個最小相位均衡器來實現。因此,這在一個錯誤的時間注入能量。這對一個線性相位濾波器或任何一個其他的沒有考慮整個系統脈沖響應是什么樣的濾波器來說同樣也是對的。教訓是:不要把傅里葉變換和被感覺的頻率響應混起來。被感覺的頻率響應是與時間有關的。因此設計一個好的均衡器需要進行時頻聯合分析。除此以外,隨空間變化的問題必須認真地考慮。在某一測量點上一個零點可能正好在單位圓內;但移動麥克 風,它就可能會跑到在單位圓外去。在這種情況下,觀察其平均效果(一個零點在單位圓上) 然后優化那個響應可能會很糟糕。一個適合平均響應的校正非常不同于在總體上適合任何被測響應的校正。位于單位圓外但在近似同樣地點(不管麥克風的位置如何)的一些零點是魯棒可逆的,而其它的就不是這樣(再請注意:這并不意味我們考慮一個與響應的其他部分相隔離的零點)。下面放大的零點圖顯示了這些特點。測量是在一個好的收聽室的不同位置用很好的Genelec 揚聲器進行地。圖中所畫的零點采用了不同的尺寸,用來對應不同的測量位置,其目的是為了便于看這些零點怎樣隨空間的變化而移動。

圖片圖中橫軸-Re(z)和縱軸-Im(z)分別表示 z 的實部和虛部。

就在 200 Hz 以上我們可以看到一個零點從最小相位向混合相位移動。其平均值正好在單位圓內,于是粗心地進行最小相位逆轉可能會在此導致許多嚴重的振蕩。在 150 和 200Hz 之間我們可以看到一個零點在單位圓外,它隨位置變化地很多。因為它靠近單位圓并且在移動,所以魯棒校正似乎不會改變這一特性。但是在 100 和 150Hz 之間位于單位圓外的一零點是有可能被去除而不會在任何位置引起任何問題(到單位圓的距離相當大并隨位置的變化。。

基于這些測量,設計了兩種不同的均衡器。下圖顯示對于三個系統(原系統、用最小相位校正的系統和混合相位校正的系統)的脈沖響應,該圖描述了被轉換的總累積能量隨時間的變化。該圖是根據在不同收聽位置進行新的測量而不是根據用于設計濾波器的原來測量數據來畫的。應該強調的是,最小相位校正基本上是采用與混合相位逆轉相同的魯棒原則。其中上圖顯示的是全頻帶的結果,下圖顯示的是響應到 300Hz 的結果。這些基本上是能量階躍響應。因此一個更好的系統就會有一個更快的上升時間,理想的情況是立刻達到 1。很清楚,即便是在一個本身具有優質揚聲器的高級收聽室,采用細致的混合相位設計仍能得到實質性的性能改善。最小相位濾波器雖不及混合相位設計,但它能改善時域性能,所以顯然也能勝任。在一個大 的、設計得很好的收聽室中,其沖激響應近似最小相位更加合適;這對前面的收聽室同樣如 此。因此我們只要用一些普通的最小相位濾波器就能得到改善。不幸地是這不能用于像汽車廂這樣較難處理的環境。最后應提到的是:使用混合相位濾波器所引起的前震蕩,其最高幅度應低于沖激響應中峰值的 60dB。(再請注意:其他收聽位置用真實的測量數據。)因此,我們能放心地得出結論:混合相位逆轉是用的,它能改善音響系統的性能且不會損失魯棒性。

圖片到時間 t 的能量轉換(全頻帶)在總能量中所占分數。圖中橫軸為時間(毫秒)和縱軸為總累積能量被轉換率(被轉換的能量在總能量中所占分數)。

我們已經闡釋:與最小相位濾波器相比,混合相位均衡器在增加魯棒性的同時能改善原先就已較好的狀況。即使是在這個具體例子中被感覺的差異對于一個一般的聽眾來說不是很大, 這個例子的重要性在于它反映了這樣一個事實:混合相位均衡器比最小相位均衡器更魯棒(因為最小相位濾波器沒有考慮整個脈沖響應)。同時這也顯示脈沖響應的衰減時間能通過避開最小相位響應來減小。當然其唯一的缺點是存在延時。但如果這不是問題,那么我推薦使用混合相位逆轉法,畢竟它是一個較為安全的方法。(作為一個旁注:在以上的例子所用的方法中, 一個參數控制前振蕩的量,其與后振蕩的量相關。因此,如果收聽測試顯示人們對于直到- 30dB 的前振蕩不敏感,那么我們就能達到一個更好的系統響應。)

真實的立體聲再現

立體聲再現是基于這樣一個事實,即人類對來自不同聲源的聲音的相關性具有敏感性。即使在一個房間里有兩個真實的聲源,我們在某些時候能感覺一個聲源位于兩個真實聲源中間。如果這兩個聲源播放同樣的聲音并且與我們相隔同樣的距離,一個在左、一個在右,我們就會感覺一個虛擬的聲源在這兩個真實聲源的中間。當這兩個聲源不是完全相關,其空間印象就會被改變。如果一個聲源的聲音被延遲足夠多,那么我們甚至會聽不到那個聲音;所有聲音會被感覺是來自較早的聲源。這是有大量文獻顯示的優先效應。優先效應的一個有趣方面是,感覺不僅取決延時而且取決兩個聲源的空間間隔。比如說,如果兩個聲源位于一條直線上,聽者在該直線的延伸線上,這樣對于兩個聲源的收聽角度是相同的,所聽到的聲音是“有色的”。如果使用同樣的延時但兩揚聲器從水平方向分開,就沒有有色化的感覺,我們聽到的只是第一個聲源。但是,如果我們放一個全向麥克風在聽者的位置,以上兩個實驗設置會給出兩個完全相同的錄音結果(假設房間有良好的衰減性能),兩個錄音聽起來都很糟。第二聲源與第一相 干。取兩個錄音的傅里葉變換的幅值我們會發現兩者完全相同,都呈梳狀;許多深的波谷遍布頻譜。我們會再次發現傅里葉變換不是一個表達我們聽覺的好方法。其主要原因是:基本的傅里葉變換不會區分不同的入射角。

現在我們考慮在收聽室中一個傳統的立體聲音響的設置。如果兩個聲源有不同的傳遞函 數,那么它們就會改變左右聲道信號的相關性,于是到耳朵的信號也就不再會以錄音時的方式而相關。如果左右聲道信號相差特別大,它們就有可能會完全解相關。在這種情況下,即使是左右聲道信號相等,我們也能聽出兩個截然不同的聲源,而不是預想的位于它們中間的一個虛擬聲源。例如,隔音場/電影棚的聲場會是漫反射的,如果我們對左右喇叭各自的傳輸函數進行一個合理的沖激響應校正,那么我們就能從它們的錄音中重建原來的相關特性并且使得隔音場/電影棚中的聲場會變得清晰和相干。遺憾地是,在上述使用高階濾波器的房間校正系統 中,相反的情形有時也會發生。這些校正系統無意中使聲場解相關,而不是改善左右聲道信號的相關性。

原因是一個高階濾波器有一個長沖激響應,該響應需要合理地控制。如果我們基于一個(對在不同收聽位置測量的原來的傳遞函數進行)過分簡單化的平均模型搭建一個逆轉濾波 器,我們最終會校正與感知不一致(在那個模型尾部)的這些問題?紤]下面的圖,該圖是基于一個性能較差、但較大的收聽室,使用了非常好的揚聲器,在 12 個不同的位置(對應于一個沙發的兩個不同的座位)的測量。圖示的是一個傅里葉幅度響應,它是基于簡單的“延遲和平均”響應,即在傅里葉變換之前,所有的脈沖響應按時間對齊,然后進行平均(也即波束成形)。

幅值響應。圖中橫軸-Frequency (Hz)和縱軸-Magnitude (dB)分別表示頻率和幅度。

注意紋波的大小,特別是在高頻區域(如果我們用分倍頻程平滑,我們就不會看到這些紋波(如果我們不細心),但它們仍然存在,而且會影響最終的濾波器)。紋波的問題在于,它不是我們所能感覺的頻率響應的特性,而只是傅里葉頻率響應的特性。傅里葉響應既沒考慮空間角度也沒考慮時間。紋波是聽不見的,因為它只是在房間中后期反射的特性(能被認為是 “后期的”當然是與頻率相關的)。假設我們現在搭建一個逆轉傅里葉變換的均衡器。不管它是不是最小相位,它在高頻區域仍然有相似的變化性,這在時域中表現為沖激響應中的附加的高頻垃圾(隨時間傳播開)。如果我們現在對左右喇叭使用不同的均衡器,我們最終會有兩個截然不同的傳輸函數,它們會產生任意的空間效應,通常是弱的解相關的形式。幼稚的平均法致使我們去補償(a)在任何單一的收聽位置不存在的東西和(b)在心理聲學上不相關的東 西。非常值得注意的是:校正某個聽不見的東西可能會導致某個東西可聽見。

基于我們用來制作上圖的同樣的 12 個測量,我們用不同的類型的時頻分析來進行一些對與心理聲學更相關的表示方法的估計。下面兩張圖顯示兩種不同的表示方法;兩者都在頻域中,但在心理聲學上與兩個不同的目的相關。第一種表示方法采用了一種處理,它設法效仿人對混響室內的瞬態聲音的感覺。我們可以看到高頻紋波消失了但有一些相當強的衰落點出現在1kHz 一下。出于某種簡化,我們已經去除了那些與直達波不同方向的后期反射。

幅值響應。圖中橫軸-Frequency (Hz)和縱軸-Magnitude (dB)分別表示頻率和幅度。

但此圖并沒有適當地描述出我們在聽某一演奏(比如弦樂四重奏)時所感覺的東西。后期反射仍然加進了聲染色效應,它影響著我們對穩態和聲信號的聽覺感受。因為這個原因,一個圖能給我們對穩態頻域聲染色效應的理解有一個合理的估計,該圖看上去就像如下描述的。

幅值響應。圖中橫軸-Frequency (Hz)和縱軸-Magnitude (dB)分別表示頻率和幅度。

我認為:以上二圖都有意義地描述我們在收聽室中實際感覺到的。前者描述我們怎樣感覺瞬態聲,后者描述我們怎樣感覺穩態和聲信號。也就是說,我們即不應該基于前者進行幅度響應校正,也不應該基于后者進行沖激響應校正。

在用混和相位校正時所得到的一些重大改進在于立體聲和多聲道的再現。在左右聲道傳遞函數不同時,空間信息就失真了。因為房間響應是非最小相位的,我們需要混合相位逆轉從而重建正確空間圖像。合適的混合相位逆轉與最小相位逆轉之間的差別在糟糕的收聽空間中會變得更大;比如說在汽車中,其左右聲道的傳輸函數就有些不同。應該注意,聲音質量的差別通常很大。雖然差別小的時候一定存在(比如說當主要的房間響應的變化可以用最小相位濾波器來校正時),但通常的差別都很可觀。然而,如前所警示的,進行一個合適的沖激響應響應是不容易的,因為人們很容易以一個解相關濾波器(和/或前回聲)而了之。但這是可以被發覺的:在收聽測試中,空間圖像變得模糊(與清晰相對),聲音被感覺是來自兩個喇叭之間的某個區域,這是相位校正變壞的清楚跡象;畫一個高分辨率的濾波器頻率響應,濾波器在高頻區域不應該有任何快速變化,這是一個設法校正沖激響應中后期尾部特性的清楚跡象。幅度響應中的快速變化表示相位響應中有類似的快速變化;一個非常不太可能的事是,對房間響應的相位校正在高頻應該是有用的(因為根據波的傳播規律,在某一物理位置的校正一定會在離該位置幾個厘米遠處就變壞)。

最后的建議是,混合相位校正是絕對有用的,并且在我的心目中是一條改進聲源重現的正確的前進方向,但是它比去閱讀過去二十年關于沖激響應校正的研究要困難得多,這值得人們思考。

有些反射好,有些不好
在這個領域似乎有一個共識,某些早期反射實際上有助于使演講更容易理解。但是,也有大量文獻顯示,在通常的收聽室中,主要脈沖在 5-10ms 內的反射會高于主聲源移動或傳播的聲級(即使在聽一個單獨的主聲源時)。從前面和后面(±40º 以內)的反射感覺起來是不利于聲音質量的,然而來自側面的反射(在合理的聲級以內)常常會改善被感覺的聲音質量。

這可以從信息論的觀點來理解。來自前面的反射一般很難與主聲源區分開,原因在于我們的耳朵的位置。一個單獨的前方反射的傳遞函數在左耳和右耳幾乎是一樣的,就像主聲源的響應。的確,這就是為什么一個濾波器能夠魯棒地校正這些反射的原因。它們在相當大的收聽空間中是恒定的。這一點與來自側面的反射形成對比。這些(側面的)反射會隨位置變化很大, 原因是有入射角。在左耳和右耳之間總存在很大差別,因此側面反射能帶來分集增益。分集是信息論的概念,它使可分辨通信信道的數量定量化。分集越高,信息傳遞的香農容量就越高。這在移動無線通信系統中被用到;在該系統中,獨立的直接路徑反射實際上被用來增加無線通信系統的比特率。有一個令人感興趣的推論,它反映出前方和后方反射對人聽覺的不利影響。因為這些信道不能跟主聲源區分開(兩者幾乎是常數),所以這些信道就會造成自相干擾。在容量的表達式中,這直接解釋成較低的信噪比和較低的信息傳遞容量。

因為在此所談的影響會降低聲源質量,它相對位置來說是近似不變的,所以這意味著,這些也是一個非因果混合相位濾波器能夠校正的影響。類似地,攜帶信息的反射是不可能被改善的,就是因為它們攜帶信息的原因是它們隨位置而變化。如果它們在兩只耳朵總是一樣,就沒有辦法讓我們從反射中分離出聲源,所以聲音的逼真度就會降低。這的確是一個令人感興趣的事實,是因為漸進而可以預料的,人的聽覺系統是有能力利用房間提供給我們的附加信息。同時我們都會直觀地知道,這種推理取決于這樣的假設,即反射實際上攜帶可分辨的和附加的信息。當然這只是一個相當特別的情況,顯然大多數的反射只會降低聲音的質量。

總結和建議

FIR 和 IIR 濾波器有幾乎相同的可能性。在許多情況下,如果調節正確,最小相位均衡能夠達到相當不錯的效果。但是為了提高空間清晰度和達到真正好的聲音質量,必須對整個系統響應仔細評估。為達到最佳性能,混合相位均衡是必需的。在不同的收聽環境中(比如汽車) 用混合相位逆轉法能達到很明顯的不同效果。但是進行混合相位逆轉,會引入延時,所需的濾波器的長度一般會相當長。在延時必須最小或濾波器階數受限(比如在 44.1Hz 的采樣頻率小于 100 階)的應用中,我的建議是采用合理設計的最小相位 IIR 均衡器。即使如此,人們也必須認真,設法達到針對位置的魯棒設計。

如果你的 DSP 預算允許你使用高價濾波器,我的建議是采用仔細的混合相位設計。一個設計得好的混合相位濾波器能提供快于最小相位或線性相位濾波器所能達到的系統響應。注意: “仔細”一詞是很重要的。一些設計高階濾波器(不管是最小相位或是混合相位)的算法總有困難的時候,例如試圖擺脫在脈沖響應尾部加進一個高頻紋波。這對立體聲的感覺有負面影響(即虛擬聲源傳播)。如果算法設法做的太多,就會引入前回聲。簡言之,混合相位設計從性能和魯棒方面來說有更好的潛力,但此潛力更難達到(但是對于超低音箱聲道,最小相位逆轉一般就夠了,因為房間與超低音箱相結合的傳遞函數在這些低頻范圍可以很好地用一個最小相位系統來模擬)。

一個混合相位設計可以用一個 FIR 或一個 IIR 濾波器來實現,但最有效的實現方法一般是兩者的結合。

如上所述,一個合適的混合相位濾波器設計類似于去掉揚聲器附近的反射面。此外,它在喇叭本身的設計中使線性缺陷最小化。因此數字混合相位濾波器在設計音響系統和房間時,對通常的電聲性考慮是一個強有力的、劃算的互補。

致謝

本文僅代表作者本人的觀點。但它確實是多年來在狄拉克研究公司內部討論中所得到的見解的積累。它包含有幾個人的貢獻。拉爾斯-約翰·布然馬克(Lars-Johan Brännmark)提供了本文中所用的實驗數據。我與他及狄拉克其他人的討論很大地影響和豐富了對我對該問題的理解。

 

 網友評論
 編輯推薦
  • 2022視聽行業高峰論壇 音響行業金孔雀“開屏”揭榜了
  • 專題:2021視聽行業高峰論壇
  • 2021 SIAV上海國際高級HiFi演示會展會_聯合HiFi專題
  • 獨家專題:第十四屆全國運動會·專業擴聲幕前幕后
加載推薦品牌
  • 諾音曼KH 810單10寸有源超低音音箱
  • Wharfedale Pro(樂富豪)90周年:鑄就品質,成就經典
  • SEEBURG acoustics line丨袖珍揚聲器 i-series :小身材,大能量
  • 加拿大XILICA(聲麗佳):專注于一流的數字音頻處理系統
加載推薦品牌資訊
設為首頁 | 商務信息 | 音響資訊 | 本站動態 | 付款方式 | 關于音響網 | 網站地圖 | 網站RSS | 友情鏈接
本站網絡實名:音響網 國際域名:www.chaoji169.com 版權所有.1999-2023 深圳市中投傳媒有限公司 .
郵箱:web@audio160.com  電話:0755-26751199(十二線) 傳真:0755-86024577  粵ICP備05041759號
在線客服:點擊這里給我發消息    視聽學院-商家論壇群: 視聽學院-商家論壇
free性欧美xx69|日本变态强奷中文字幕|亚洲人成啪啪网站