淺談 32bit floating 與它的盲點、優缺點
圖文/游士昕 Ted Yu
當每次談到 Dynamic range 就一定常提到 16bit 與 24bit 動態範圍的差異,然而在之前上一篇文章當中稍微提到了 32bit floating point,沒想到就收到好多私訊的詢問有關 32bit floating 的問題,說哪套 DAW 也有這選擇,這是什麼意思呢?這能不能使用呢?這差異在哪呢?
今天特別寫篇短短文章來聊一下,相較於上篇的內容這篇談的較深些,原因是因為這之間牽扯到計算機演算的概念,但是士昕還是試著用比較簡單和白話的方式來討論,希望能夠讓大家瞭解。
為何是 -18dBFS?
如果你還沒看前一篇錄音介紹文章"錄好、錄滿?如何設置數位系統中的錄音音量? ”,就請先撥點時間回頭複習閱讀一下吧!然而,許多閱讀過後的讀者詢問,為什麼是 -18dBFS?
在 VU 表頭上接近 0VU 的數值對應到 EBU Digital 的數值正是 -18dBFS,這正是一個不同表頭與不同系統的數值對應表而以,因此當你提出為何不是接近 0 時,其實最先需要解析的,是當下你工作所面對的系統類型與何樣的表頭是什麼。
圖/Reference Levels - Analog and Digital system
雖然說在聲音的領域裡,並沒有一個一定該怎麼做才能得到好聲音的結果,只要最終得取到的聲音素材是好聽好處理好後製的,即便錄製在 -12dBFS 左右其實也不會被抓去關的,只要後續處理聲音素材的混音師能夠處理的話…… 但在一般聲音工程的認知當中, -18dBFS 的確會是一個不錯的開始錄音方式。
附註閱讀: 錄好、錄滿?如何設置數位系統中的錄音音量?
為何爭論高 Bit 取樣位元?
在早期或者是較初階的錄音器材使用上,其實還是都有著非常高的 Noise floor 聲音底噪,因此在那個環境下進行錄音的下意識動作,往往會試圖拉高錄音的聲音訊號,在不破音的狀況下會嘗試想要蓋掉聲音底噪,這樣的行為通常會連帶影響後續處理時的 Headroom 的空間。在數位錄音的世界裡以 1bit 容許範圍約 6dB 的理論值來計算,16bit 為 96dB 容許範圍, 24bit 為 144dB 容許範圍,32bit Fixed point 就為 192dB。這個我們已經聽爛的公式讓我們得知越大的 bit depth 不僅增加了聲音的取樣解析度,同時也增加了聲音動態的範圍。因此開發高 Bit 數取樣的爭論是一直都存在的。
附註:在此先不談及理論值的動態範圍在實際上器材所能實現的數值為何。
Fixed point 定點數運算與 Floating point 浮點運算
在數位訊號的運算組合過程當中可以細分為兩類,分別是 Fixed point 定點數運算 與 Floating point 浮點運算。
由以下圖的 Fixed point 定點數運算來看,可以發現 24bit 的 ADC(Analog to Digital Converter)所轉換進來的聲音訊號,在 32bit 的 Fixed point environment 裡擁有著非常大的 Headroom 空間與極低的 Noise floor 聲音底噪,因此以理論值來說,32bit Fixed point 的確是可以供給聲音一個更棒的空間。
在 32bit Floating point 浮點運算的狀況下,理論值的動態範圍增廣為一個無法置信的 1680dB 這個誇張,一輩子都不太可能會接觸到的動態。在 24bit 的入口後 32bit 與 24bit 之間的 8bit 差異值成為了一個浮動懸浮的蓋子,這個蓋子會隨著聲音訊號在整個動態範圍當中來向上或向下移動,最終再從 24bit 出口輸出。
目前以現今技術而言,聲音工程當中較常見的方式來辨別兩種技術為「軟硬體之分」
一般來說,Fixed point 定點運算較常使用在聲音訊號的轉換器 AD/DA 核心架構運算,而 Floating point 浮點運算較常被架構在各廠牌的 DAW 的選擇運算基礎上。
Floating point 在錄上工程上的盲點與優缺點
優點:
一, Pro Tools 10 以上的軟體在 Floating point 浮點運算的環境下,能夠較有效的避免使用 AudioSuite 即時運算效果器運算過程當中造成的破音與不必要的雜音。
二,在 32bit float 的運算環境裡「理論」上,的確是能夠在處理聲訊階段擁有 1680dB 這個誇張 headroom 的空間(注意,是處理而不是錄製)
附註:這個理論值 ,大部份的人類一輩子都不太可能會接觸到的聲音極限......
缺點:
一,在運算上極度吃資源,容易造成電腦過度負擔。
如果搭配的 Sampling 取樣位元為 96kHz 或更高就需要極度考量電腦本身的效能,否則將造成效能不足的窘態。
二,佔據太大電腦的容量空間。
以容量的計算來看,一分鐘的雙聲道 16bit / 44.1kHz 的 5 分鐘 CD 音質曲目而言約 50MB,而 24bit / 48kHz 的5 分鐘錄音室基本錄音品質約為 82 MB,而 32bit float / 48kHz 的 5 分鐘為 109MB 左右。想像一下,整個 Pro Tools session 裡的所有聲音檔,將會儲存在 Audio file 裡,再加上現今的專案動不動就都是 50, 60 軌以上,如果是開設在 32bit float 的環境下,專案檔的大小隨便計算就為就好幾十 GB 起跳,不僅對於電腦容量空間的佔據,也容易造成拖垮電腦效能的原因之一。
盲點:
一,以目前全世界錄音室主流的設備而言,即便在 32bit float 環境下工作,所有聲音的進與出都還是建立在 24bit 的運算架構上,換言之,在 32bit float 環境進行聲音工程工作「並不會改變或影響最原先錄製的素材聲音。」
再者,現今主流的錄音工程硬體設備所支援的最高階等級大部份還是為 24bit / 192kHz(過往是有音響廠商試著推出 32bit 的 ADC 機子,但是都是天價。)在硬體與軟體無法達到對等的狀態下,使用 32bit floating 也是很難發揮最大功效,也是沒有意義的。(感謝 陳維翰老師 還特別提醒,在聲音工程裡,還需要考量類比電路理論值與實際值之間的運算差異。)
二,Bit depth 的選取在 16bit 與 24bit 之間有著極為明顯的差異,原因是在於彼此之間的解析度與動態範圍。
但是在 24bit 的環境下,其實動態的範圍已經足夠,若單純焦點放置在 24bit 定點運算與 32bit 浮點運算上來談,士昕其實可以直接的下一個定論,那就是「在 32bit float 環境下錄音,其實並沒有一個可以很直接明白聽見與 24bit 極大差異的地方。」
三,依據人類物理學,大家都知道人耳能接收的頻率範圍為 20Hz 至 20kHz,但比較少被提及的部份為人類平均動態範圍約為 130dB。
目前錄音工程的實際硬體技術上,礙於類比技術的設計,要做到完全支援的機器單價都非常昂貴,再加上目前全世界的主流 24bit AD/DA 以實用值而言,絕對足夠應付聲音工程的需求。
附註:相關物理反應與人類聲學的部份,要是有興趣的讀者可以去翻翻這本書,裡面有蠻詳細的物理與聲學關聯性,但… 是英文only…… Physics and Music: The Science of Musical Sound
圖/Physics and Music: The Science of Musical Sound
(本來真的只想打一小篇而以說...... )
大概解釋了一下何謂 32bit floating point,大家也比較瞭解我們所熟悉的 16bit 與 24bit 之間的差異,對於一個熟練掌控 dynamic range 的資深錄音師來說,在還未擁有可匹配的硬體問世之前(還要夠便宜!)在聲音工程上使用 32bit floating point 並不會改變太多工作習慣與最終結果的差異,在現階段也是無必要的。
<重要公告>
你喜歡平衡音訊實驗室的繁體中文介紹文章嗎?
現在你可以直接擁有更詳細更具系統化的書輯整理,藉此來表示你對平衡音訊實驗室的支持!「催生音樂:混音工程與製作 The Audio Mixing and Production」7/22~7/28博客來預夠,7/29正式出版上架!
混音,在聲音工程中不被世人注意,卻肩負著聲音作品成敗的重責大任。混音師,安於寂寞伴隨,用聲音編織著一段又一段動人故事的魔術師!
延伸閱讀:
Dynamic control,瞭解你對於音訊在幹麻,是一個得到好聲音的鑰匙。
此內容文章為Ted個人的經驗與長時間閱讀相關書籍綜合結果之撰寫,此部落格之用意是在於分享與推廣聲音工程的重要性與宣傳些屬於聲音的基本概念;歡迎來信指教或者幫忙轉貼宣傳與私訊相聊相關資訊以供教學助長!