<menuitem id="9rd9n"><font id="9rd9n"><sub id="9rd9n"></sub></font></menuitem><p id="9rd9n"></p>

    <em id="9rd9n"></em>

      <noframes id="9rd9n"><address id="9rd9n"></address><address id="9rd9n"></address>

            <address id="9rd9n"></address>

              <noframes id="9rd9n"><noframes id="9rd9n">

              <address id="9rd9n"></address>

              揭秘數字音頻(上)

              行業新聞廣播數字音頻設備2020-03-30 09:18打印

              揭秘數字音頻(上)

              編譯:Monnie From iKnowMusic

              校對:K From iKnowMusic

              終審:Sing T From iKnowMusic

              原文:https://www.sonarworks.com/

              引言Introduction

              人類創造了一個由“比特”(Bit)構建的世界。比特,一種極小的單位,可以測量現實中的有形事物。在數字世界里,比特值構建了我們在物理世界中所能感知的聲音和畫面。在過去的幾十年里,人類通過數字計算來精確還原現實的能力,正在以不可思議的速度發展著。音樂領域也是如此,人類可以用這個比特值描繪出整個“聲景”(Sonic Picture)。我們能理解模擬音頻系統為聲音帶來,我們最為迷戀的美妙染色、質感增補以及失真音色,但是我們同樣也能使用數字音頻系統,通過算法機制讓數字音頻系統達到與模擬音頻系統相類似的聲音效果。不過,我們要清楚地了解,如何將捕捉到的聲音完美地植入數字比特值中,以便于為我們的“數字音頻創建計劃”提供最為純粹的原料。幸運的是,對于數字捕捉處理的定義只有簡單的幾個原則而已,遵循它們即可讓您的數字音頻處理中得到優化。另外隨文也附帶闡述了關于您音頻工程的文件管理以及備份存儲的方法。

              “一切皆可造,萬物皆神創。” - 托馬斯·布朗(Thomas Browne)

              “All things are artificial,? for nature is the art of God.”

              第一章、數字音頻基礎知識

              “數字音頻”(Digital Audio)是完美的,“模擬音頻”(Analog Audio)也是完美的。這兩句話陳述都正確,只是對于“完美”一詞的范疇上各有所指罷了。作為藝術家,我們篤定地認為會選擇后者,但作為技術人員,會選擇前者。從技術的角度來說,我們首先需要實現對數字音頻信號的精準捕捉,然后再將它們“完美地”呈現出來。數字音頻可以由兩個參數定義:“采樣率”(Sample Rate)及“比特深度”(Bit Depth)。如果這兩個參數設置正確,數字音頻可以幾乎毫無偏差地還原一切音頻信號的“動態范圍”(Dynamic Range)和“頻率響應”(Frequency Response)。熟練掌握這兩個參數的設定,剩下的可以輕松搞定。

              揭秘數字音頻(上)

              理解何為采樣率

              我們對“采樣率”(Sample rate)和“比特深度”(Bit Depth)這兩個數字音頻領域的專業術語都十分熟悉。盡管這兩個參數設置很常規,但我還是經常收到來自制作人或混音工程師們,關于某項目最佳參數設置方法的詢問。本文將深入淺出地介紹采樣率的基礎原理及最佳應用方法。不用擔心,比特深度的部分馬上就來!

              采樣率的概念

              采樣率指的是,當模擬音頻的波形轉換為數字信號時,每秒從連續信號中提取并組成離散信號的采樣個數。由于采樣率具有速度信息(或者說頻率),它可以用于定義一段音頻的“頻率響應”(Frequency Response)。由“奈奎斯特定理”(Nyquists Theorem)可知,在從模擬信號到數字信號轉換的過程中,數字音頻文件可錄入的聲音的最高頻率是其采樣率的二分之一。也就是說,采樣率為44.1kHz時,它可錄到的最高模擬信號的頻率是22.05kHz,同理可知,96kHz的采樣率可錄到帶有48kHz音頻“帶寬”(Band Width)的信號。如果我們以較低的采樣率錄制高頻信號(超過采樣率一半的信號),或者說超越 “奈奎斯特定理”(Nyquists Theorem)的極限,就會產生人耳可聽的頻率“混疊”(Aliase)現象(一種低采樣率失真)。為了避免該現象的產生,在模擬信號轉換為數字信號的過程中,會使用一個“抗混疊濾波器”(Anti-Aliasing Filter)濾除模擬信號中頻率在采樣率的二分之一以上的部分。在實際操作中,該低通濾波器的一定的運行時間,所以我們以44.1kHz的采樣率記錄20kHz頻率以內的聲音。

              想必我們都知道,人耳聽覺頻率范圍在20Hz至20kHz之間,那我們為什么要使用超過44.1kHz的采樣率呢?理由之一,許多人(包括一些科學家)聲稱,人類可以通過“骨傳導”(Bone Conduction)感知高達50kHz的聲音。這個觀念或許在理論上是正確的,但人類通過空氣傳播能夠感知到的聲音頻率仍然僅能達到20kHz。理由之二,從更實際的意義上來說,抗混疊低通濾波器并不是一個完美的工具,當它在濾波處的“斜率”(Steep)到達一定程度時,會令聲音產生更明顯的相位失真。因此,在使用濾波器時,要在斜率(過渡帶的陡度)與相位失真度二者之間做些權衡。

              關于采樣率的建議

              我們是否要因為人耳聽覺上限是20kHz,就僅限于使用44.1kHz的采樣率呢?正如上文所言,使用高于44.1kHz的采樣率可以減少濾波器在模數轉換中對信號造成的影響,帶來更好的聽感。換句話說,盡管44.1kHz的采樣率記錄了人耳可以聽到的全頻段音頻帶寬,但低通濾波器還是會對20kHz以下的頻率造成損失。因此我們建議,在制作流行音樂和混音時,使用48kHz的采樣率。首先,使用48kHz的采樣率在進行抗混疊濾波處理時,比使用44.1kHz采樣率有更好的聽感。其次,48kHz采樣率的文件只比44.1kHz的多占了一些磁盤空間。另外,我們的大部分音頻會被嵌入YouTube網站上的視頻或其他影片里發行,而視頻文件通常需要使用48kHz采樣率的音頻。當然,如果您制作的音樂僅用于CD發行,那么使用44.1kHz的采樣率就足夠了。

              更高的采樣率

              對于制作高音質要求的爵士樂、古典音樂、世界音樂或一些聲音設計的項目來說,我會建議使用96kHz的采樣率。該采樣率幾乎消除了所有可聽到的高頻混疊和濾波器引起的失真。此外,96kHz采樣率的音頻文件可以保障更低的處理延遲,在用于聲音設計或游戲音頻上保障更好的降調處理效果。不僅如此,當有需求時,96kHz采樣率的音頻文件可以將采樣率降到48kHz并保持音質完好。如果您需要開展超過96kHz采樣率的錄音項目,則需要花上大量時間來測試您的錄音系統,找到一套符合您需求的方案,包括使用的“數模轉換器”(A/D Converter)和“數字音頻工作站”(DAW,Digital Audio Workstation)。因為使用96kHz以上的采樣率可能會產生頻率抖動的問題,增加您的CPU負擔,減少可使用的音頻軌道數量,縮小插件的選擇空間。一般來說,我不會建議您使用176kHz或192kHz的采樣率,除非您真正研究過這些高采樣率的利弊。作為參考,《格萊美“美國錄音學院”對高解析音樂制作的建議》(Grammy’s Recording Academy Recommendations for Hi-Resolution Music Production)一文中曾提道:對于高解析音頻的制作和傳輸需求來說,最好是用96kHz的采樣率,最低采樣率為48kHz。

              采樣率轉換

              我們常常需要對音頻采樣率進行轉換,并且擁有許多優秀的采樣率轉換軟件工具。近期,一個對母帶混音師群體的調查顯示,音頻工作者常用的采樣率轉換工具有:“Voxengo”公司的“R8brain”,“Weiss”公司的“Saracon”,Pro Tools中的SRC(Sample Rate Convert,采樣率轉換,使用Tweak Head設定值),“Izotope”公司的“Resample”和“SoX”,還有些其它的工具也能產生很好的采樣率轉換效果,與此同時,宿主軟件的開發者們也在不斷優化采樣率轉換的算法。

              由此可見,選擇采樣率并非難事。下面是一個對上述內容歸納整理后,有助您查詢索引的備忘錄。

              采樣率知識點備忘錄

              以下是針對不同情況使用采樣率的建議:

              錄音

              流行音樂建議使用48kHz的采樣率(盡管44.1kHz也是可接受的)。在有高音質需求的音樂和聲音設計項目中,建議最好使用96kHz采樣率。

              混音

              混音工程應當與錄音工程保持相同的采樣率,將低采樣率的音頻文件放入高采樣率的音頻工程中并不會提升音質。如果您在模擬調音臺上進行混音,就把采樣率設置為前文所述的48kHz或96kHz吧。

              母帶

              在制作母帶的過程中,不要提高采樣率。對數字版母帶制作來說,使用與終混交付工程相同的采樣率即可。對模擬版母帶的話,先用數字文件的原始采樣率播放該音頻,再通過模擬信號處理器進行處理,最后以客戶要求的采樣率(通常是48kHz或44.1kHz)錄入音頻。另外,備份一版用96kHz采樣率錄入的音頻文件。除非萬不得已,盡量不要對最終版母帶進行采樣率轉換。

              發布

              視頻制作者通常需要48kHz采樣率的音頻文件,而像iTunes這樣的數字音樂發行平臺則需要44.1kHz以上的采樣率的音頻文件。除非萬不得已,盡量不要對最終版母帶進行采樣率轉換。

              “自然界中的每個部分都息息相通,一片葉子、一滴水、一塊水晶、一個瞬間,都與整體相連,并共享著整體的完美。”

              - 拉爾夫·沃爾多·愛默生(Ralph Waldo Emerson)

              理解何為比特深度

              我們在前一篇文章中探討了采樣率與頻率響應之間的關系,本文將介紹“比特深度”(Bit Depth),以及它與另一個重要的音質層面的參數 - “動態范圍”(Dynamic Range)之間的關系。

              動態范圍是一個音頻術語,音頻信號最大值和最小值的比值。下面來具體介紹如何應用比特深度這個參數。

              比特深度的概念

              如前文所述,比特深度代表了音頻信號的動態范圍。一“比特”(Bit)可以代表大約6dB的動態范圍,也就是說,16-bit可以提供96dB的動態范圍,24-bit可以提供144dB的動態范圍。比特數(或者說二進制位數)是應用于指數函數計算的,這意味著16-bit的文件可以測算出65,536個值(216,即2的16次方),24-bit的文件可以測算出大約1670萬個值(224,即2的24次方)。

              現實中,專業的模擬錄音機和調音臺設備由于構造原理,自帶介于-120dB到-90dB之間的“本底噪聲”(Noise Floor)。所以,對于模擬錄音技術來說,我們并不能以24-bit錄得完整干凈的144dB動態范圍模擬信號。但是,音頻信號在使用24-bit進行數字運算后,可以產生額外的、更重要的動態范圍。換句話說,雖然在進行傳統模擬錄音時,使用16-bit可以完整地記錄模擬音頻的動態范圍,而一旦我們需要將其放入宿主軟件中,就需要使用更高的比特深度值。

              我收到過許多客戶發來的文件,都是使用16-bit進行多軌錄音和制作的。當我對這些16-bit的音頻進行混音或制作母帶時發現,重新創建一個24-bit或32-bit浮點的音頻工程進行工作,會獲得遠比只使用16-bit的工程更好的聽感。于是我給自己定下了一個規矩:一定要在24-bit或32-bit的音頻工程中進行混音和母帶制作。Pro Tools,Logic或其它宿主軟件通常會默認以32-bit浮點甚至更高的精度來處理音頻。因此,我的建議是,您可以使用24-bit的設置來創建工程,后續也不用擔心比特深度轉換的問題了。當然,24-bit的音頻文件會比16-bit的占用更多磁盤空間,但這對于現代硬盤容量來說,已經不成問題了。

              什么是抖動(Dither)?

              在討論比特深度的時候,我們有一個不能忽視的概念 – “抖動”(Dither)。把一段音頻波形以數字信號的方式呈現出來,實質上就是將連續的(模擬)音頻波形轉換為大量離散獨立的(數字)測量值。這些離散的測量值無法將連續的模擬音頻波形完整地還原出來,并會因此令聲音產生一種名為“量化誤差”(Quantization Error)的失真效果。我們可以通過向數字信號中加入少量的隨機噪聲信號,來弱化這種失真效果,讓它聽上去不那么明顯。這種信號被稱為抖動噪聲,通常比本底噪聲高出3dB,例如,在處理16-bit的音頻時大約是-93dB。一般來說,我們可以通過抖動處理得到一條幾乎還原模擬信號的波形,但聽起來還是有一點音量極低的噪聲。這么看來,我們似乎無法在數字采樣的方法下完美還原模擬信號?但依據奈奎斯特定理(曾在前文<理解何為采樣率>中介紹過),經過數字采樣的模擬信號可以通過采樣率的設置被完美重建。

              如果我們在宿主軟件中以32-bit(甚至更高)的比特深度處理音頻,卻需要從中導出低于32-bit的分軌、混音、母帶時,就需要在導出設置時加入抖動處理,消除量化誤差。請牢記這個規則:在宿主軟件中導出比原始比特深度更低的音頻文件時,一定要加入抖動處理。如果您導出的是32-bit浮點音頻文件的話,請不要加入抖動處理。如果您正在和別的制作人進行工作交接,請一定要仔細檢查您的宿主軟件有沒有正確處理音頻文件。

              “請牢記這個規則:在宿主軟件中導出比原始比特深度更低的音頻文件時,一定要加入抖動處理”。

              我們能聽見抖動噪聲嗎?

              母帶工程師們一致認為,適當地應用抖動處理,可以提升音頻在由高比特深度向低比特深度轉換時的聲音質量。因為抖動噪聲是一種隨機噪聲,并且比峰值電平低93dB(以轉化到16-bit為例),只有在極端聲學環境下才能聽見抖動噪聲。不過,如果您真的聽見了抖動噪聲,也請不要擔心,人類是十分擅長忽略這種隨機噪聲的。

              如果我們在不加抖動處理的情況下降低音頻比特深度,會產生一種影響聽感的失真效果。這種失真效果不像隨機噪聲那樣容易被人耳忽略,反而會給音質本身帶來負面影響。

              抖動處理有很多種,其中包括了不同的噪聲塑形(EQ處理)。如果您愿意的話,可以嘗試借此做一下聽力測試,來聽聽看,不同類型的抖動處理是否會造成不同的聽感。我有時可以根據經驗判斷出一個音頻文件在導出時是否加入了抖動處理,但我從來無法分辨它的制作人是使用了什么品牌或者哪種抖動處理技術。最后,應用抖動處理就像按下按鈕一樣簡單,所以,在需要使用它的時候,不要再猶豫了。

              結論

              選擇比特深度值相對來說比較容易,關于應用抖動處理的規則也十分簡單。下面是一個對上述內容歸納整理后,有助您查詢的知識點備忘錄。

              比特深度知識點備忘錄

              以下是針對不同情況下,使用比特深度值的建議:

              錄音

              對于近距離拾音并采用話放增益的錄音需求來說,雖然使用16-bit的比特深度效果足以,但還是更推薦您使用24-bit。對于現場多軌錄音或者超大動態范圍的錄音來說,請一定使用24-bit。

              混音

              需要把混音工程的比特深度設置為至少24-bit。大多數宿主軟件的內部運算以32-bit浮點或更高的比特率來處理音頻。

              母帶

              由混音師將24-bit或32-bit浮點的混音工程交付于母帶工程師,以供母帶工程師在盡可能高的比特深度值下工作。

              抖動處理

              在宿主軟件中,導出低于工程設置的比特深度音頻文件時,請一定要加入抖動處理;導出32-bit浮點音頻時,請不要加入抖動處理。

              發布

              PCM音頻格式支持16-bit的文件,因此,在使用CD作為發布載體時,可以用該比特深度值。請和您的發行商或發布平臺確認他們需要什么格式的文件。如果該音頻文件需要被轉化為有損格式,您最好保證原始文件是24-bit或32-bit的,才不會在壓縮中損失太多音質。

              儲存

              美國國家錄音藝術與科學學院(NARAS,National Academy of Recording Arts and Sciences)建議您,盡量以原始采樣率和盡可能高的比特深度值,存儲PCM格式的音頻文件,如44.1kHz的采樣率和32-bit浮點的比特深度。

              “數字音頻傾向于技術,便于存儲,處理高速;模擬音頻傾向于藝術,聽感飽滿,富有溫度。”

              - 亞德里安·比勞(Adrian Belew)

              “蘋果數字母帶技術標準”(Apple Digital Masters)

              編者注:蘋果公司于2019年8月對旗下音樂應用軟件iTunes進行了品牌重塑,并更新了Mastered for iTunes中的內容規范,本文會對這些更新內容進行介紹。我們對于一切用戶反饋都感到十分感激,并且,我們會不斷致力于為用戶提供有用的、準確的最新信息。蘋果公司并沒有停止開發iTunes,只是為其流媒體服務以及音樂、播客和有聲讀物的內容存儲創建了一個名為Apple Music的平臺。

              母帶制作是一個復雜的過程 - 它是藝術與科學的精妙結合,需要對應的工程師有一雙敏銳且訓練有素的耳朵,也需要他對數字音頻技術與模擬音頻技術有深刻的理解,或許更重要的是,他具有評判一段音樂的藝術創作意圖是否被完美表達的能力。

              母帶工程師的工作是,為一段終混后的音樂塑造整體聽覺形象,讓它在所有的音響系統和媒體格式下都有最好的聽感表現。這首曲子的母帶版本將作為母版,基于它制作的各種后續版本或復刻版本,將被用于在線流媒體、CD、甚至是黑膠唱片中。

              不論是針對模擬信號還是數字信號,每個發布平臺都有關于文件類型、整體響度、元數據內容的獨家規范和標準。其中最嚴格的一套標準,或者說“最佳實踐標準”,來自于蘋果公司的“蘋果數字母帶技術標準”(Apple Digital Master)。本文將介紹如何達到“蘋果數字母帶技術標準”認證的規范標準,并解釋那些規范標準的意義是什么,以及如何確保自己向蘋果提供的是最高品質的數字音頻文件。可以放心的是,如果您的母帶達到了“蘋果數字母帶技術標準”的話,您的作品在其它流媒體平臺和在線發布平臺的音質也會是一流的。

              本文出自《midifan月刊》2020年02月第167期

              网上滚球