多媒體產(chǎn)品(Multimedia)是指能夠同時表現(xiàn)2種以上文字、圖表、影像、聲音與動畫等訊息的產(chǎn)品,不過訊息雖多,但是結合影像與聲音的影音多媒體,則一直占主流地位,因此能傳達此類訊息的表現(xiàn)方式,如電視、電影,都被稱為強勢媒體。
過去能播放影音多媒體的設備,體積都相當龐大。拜IT產(chǎn)業(yè)進步,IT與CE設備中,多媒體產(chǎn)品如雨后春筍,種類與數(shù)量愈來愈多,體積也有縮小化趨勢,例如多媒體個人計算機、筆記型計算機、手機、游戲機、專業(yè)機(如電子字典、電子書閱讀機)、MP3音樂播放機、可攜式多媒體播放機(PMP)、個人數(shù)字導航設備(PND)等。
由上述分類可知,IT/CE產(chǎn)品以影音應用產(chǎn)品為市場大宗,就算原非多媒體用途(如PC/NB,手機),也跨足影音領域。很明顯,IT/CE產(chǎn)品從單純的「計算器」走進消費性電子產(chǎn)品市場,進而創(chuàng)造廣大商機,影像播放與聲音聆聽的多媒體需求,絕對是最重要的殺手級應用。
當然,影音多媒體并不完全局限于娛樂用途,舉凡商品或服務展示、簡報、意見咨詢、科學研究、教學訓練、雙向互動等各種用途,都可用多媒體實現(xiàn)。

圖說:原本以傳輸語音為主的手機,目前卻被賦予豐富的娛樂用途,播放音樂亦是重點應用。圖中的Nokia 6233甚至配備雙揚聲器,強化聆聽音質(zhì)。
多媒體產(chǎn)品影音失衡 音效功能長期被忽略
影音多媒體設計上,長久以來多半是由影像功能掛帥,無論是機構設計或是市場宣傳,影像的訴求遠遠大于聲音。例如IT設備中的筆記型計算機,強調(diào)多媒體用途者,多半以大屏幕與強力顯卡為訴求,音效功能則多輕描淡寫。
反觀CE產(chǎn)品類,也是如此,以多媒體手機為例,雖手機以傳送語音起家,但是搖身變成多媒體手機后,幾乎都以強調(diào)顯示功能為主,甚至將多媒體手機分為單色、CSTN、STN、TFT、AM OLED等,完全以影像為分類主導,對聲音則鮮少著墨,幾乎沒有研究將多媒體手機音效的進步,列為分類重點。
這樣的發(fā)展趨勢,原因之一在于人類的感官中,80%是倚賴視覺,因此在多媒體中,視覺所占的重要性也相對提高。其次根據(jù)人類聽覺特性,也不是所有的聲音都能感受、分辨,許多音效壓縮格式多將一般人耳無法查覺變化的音頻舍棄,減少音訊編碼的數(shù)據(jù)量,就算解壓縮后的音質(zhì)與來源不盡相同,對還原后的音質(zhì)體驗感受差異不大,此稱為感知編碼 (Perceptual Coding),因為訊號源已經(jīng)處理略微劣化,多媒體播放出來的聲音自然無法追求質(zhì)量。
再者,電子環(huán)境對于音效的質(zhì)量,也是相對不友善的環(huán)境,充滿噪聲與干擾。傳統(tǒng)的模擬音效環(huán)境,例如音響,無論訊源、前級、后級部分,雖有電子設備與電源,但是擁有良好的屏避與阻隔,設計者較能掌握、排除其對音質(zhì)的干擾。
但音效設計場景換到IT/CE設備,因電路版空間有限,不可能針對單一訊號進行太多遮蔽、改善,且受限成本考慮,通常也很難利用較好的電容或電感,來減輕或阻絕交換式電源供應器天生的噪聲,加上其它設備的電磁波干擾,聲音表現(xiàn)自然大打折扣。
在如此發(fā)展趨勢下,影音受重視的程度逐漸失衡,此點由多媒體中數(shù)字影像規(guī)格,由高度破壞性壓縮的Mpeg格式進展到Mpeg2,甚至目前的各種HD規(guī)格,畫質(zhì)表現(xiàn)愈來愈清晰、分辨率不斷飆升,追求質(zhì)量的趨勢相當明顯。但數(shù)字音效卻反其道發(fā)展,破壞性壓縮的mp3格式甚至AC3等盤據(jù)主流市場,音質(zhì)較佳的無失真壓縮反而成了小小眾。消費者長期受到此趨勢影響,對于多媒體中聲音質(zhì)量的要求,多半也以「有聲音」就好的態(tài)度面對。

圖說:MP3就是音樂播放產(chǎn)品,音樂的播放效果即音質(zhì)優(yōu)劣,便成為評斷MP3的最終條件。不過目前許多廠商卻在外型、功能上大做文章,似乎本末倒置。
影像發(fā)展紅海競爭 強化音質(zhì)成多媒體產(chǎn)品差異化活路
如前述,因影像功能獲得的重視遠大于聲音,因此多媒體產(chǎn)品在影像部分的競爭相當激烈,但由于零組件多半由特定供貨商提供,設計人員雖然可在布線、調(diào)整上,做出修正,取得更好的影像質(zhì)量,但是實質(zhì)差異通常不會太大,最后產(chǎn)品上市后,由于與競爭產(chǎn)品沒什么差異,往往陷入白熱化的價格戰(zhàn)。這樣的紅海市場,相信是許多廠商的痛,卻又不得不奮力肉搏,不過音效卻可能成為多媒體產(chǎn)品拉開差異化的救贖。
例如宏碁2007年,隨著Santa Rosa平臺,推出的一系列筆記型計算機,舍棄傳統(tǒng)強調(diào)性能的宣傳模式,而將訴求重點放在提高聲音質(zhì)量,以「有杜比,最動聽」的口號,成功的打動消費者,因此在筆電市場創(chuàng)造亮眼銷售佳績。由此例可見,高音質(zhì)的數(shù)字裝置,并不是沒有市場,只是過去沒有選擇,一旦有音質(zhì)較佳的產(chǎn)品出現(xiàn),就能夠迅速拉開產(chǎn)品差異性。
不過要設計好的數(shù)字音效裝置,并不是那么容易,設計者首先要能掌握數(shù)字音效原理,了解數(shù)字音效原理、編碼模式、音質(zhì)好壞標準,接著認知目前影響數(shù)字音效質(zhì)量的關鍵零組件。

圖說:宏碁筆記型計算機在2007成功以較佳的音效,拉出與對手產(chǎn)品的競爭差距,創(chuàng)造銷售佳績,就是以音效為產(chǎn)品創(chuàng)造差異化、提升競爭力的實例。
音效原理與壓縮格式掌握 設計高質(zhì)量音效裝置的第一步
聲音是一個籠統(tǒng)的名詞,以物理性分析,聲音由4種特性組成:
1、音高:震動頻率(Frequency),指單獨一個音在整個音域中的位置。音根據(jù)音波振動的頻率在音高上有高或低等分別。
2、響度:震動幅度(Amplitude),聲音的強弱稱為「響度」,通常以「分貝」(dB)來表示響度大小。
3、音色:震動波形(Wave Form),又稱音品,聲音在真實世界由震動產(chǎn)生,而不同的物體振動的原理和情況都不同,震動波形相異,就會形成各種不同的音色,如纖細、渾厚等。
4、方位:音源(Source)與聽者的相對位置,但人的雙耳除了判斷聲音的方位之外,也可感受聲音的空間感,空間感由聲音的直接音(direct sound)、早期反射(early reflection)、回響(reverberation)等3部分重現(xiàn)。
重現(xiàn)聲音,對于數(shù)字音效來說,卻具有天生上的難度,因為數(shù)字音效常常都是壓縮、編碼、重制后的產(chǎn)物,主要原因是為了滿足儲存容量的需求,因此利用音訊編碼(Digital Audio Coding)可實現(xiàn)聲音數(shù)字化后檔案體積小、復制不失真、容易保存及保密等優(yōu)點。
音訊編碼其中一種方式是以無失真 (Lossless) 為原則,意指當經(jīng)過壓縮過的訊號,再解壓縮之后,可以還原成幾乎與未經(jīng)壓縮的訊號質(zhì)量一致,這種方法對音樂質(zhì)量有較好的保障,然而所付出的代價是壓縮率偏低,像DVD Audio規(guī)格采用的MLP (Meridian Lossless Packing) 就是無失真壓縮的一例,壓縮率只有50%左右。
目前主流編碼格式則反其道而行,為得到較高的壓縮效率,根據(jù)人類聽覺特性,將一般人耳無法查覺其變化的高低頻數(shù)據(jù)舍棄,減少音訊編碼的數(shù)據(jù)量,與解壓縮后的數(shù)據(jù)不盡相同也無妨,這一種壓縮方式泛稱為感知編碼 (Perceptual Coding) 或是感觀式編碼。
音訊編碼有許多種,針對聲音的編碼有PCM、ADPCM、DM、PWM、WMA、OGG、ACC、MP3Pro以及MP3等等;針對人類語音有LPC、CELP與ACELP等。

圖說:數(shù)字音效在編碼時如果采用更高的取樣率、或是數(shù)據(jù)分辨率,還原后的音質(zhì)就越能夠接近原音。
音效評估標準掌握 設計高質(zhì)量播放裝置基準
音樂好不好聽,見仁見智,但是音質(zhì)好不好,卻可以精確評估。一般所謂音質(zhì)好,就是發(fā)聲裝置能夠真實重現(xiàn)上述4種聲音的物理特性。換句話說,無論以模擬或數(shù)字方式重現(xiàn),都以音頻信號范圍越準確、失真度與干擾(例如噪訊)越少,聲音越能接近來源越好。
以數(shù)字音效來說,又可分為語音類與音樂類重現(xiàn)。語音類相對較單純,通常以5個等級評估,一般只要與音頻率達到7Hz以上,并且使用者不察覺失真,即可評估為優(yōu)良。
但是IT/CE多媒體設備所播放的數(shù)字音樂,原音重現(xiàn)就相當困難,由于數(shù)字音樂本身通常就并非由來源100%轉換,因此數(shù)字音樂的取樣率,分辨率,壓縮格式都會影響聲音質(zhì)量甚巨,再者如噪訊比(SNR)、總諧波失真(THD)等因素,也都會影響數(shù)字音樂質(zhì)量。
而且,數(shù)字音樂的質(zhì)量評估,也較語音類困難許多,因為音樂重現(xiàn)質(zhì)量優(yōu)劣取決于多種因素綜合評量,如聲源(聲壓、頻率、頻譜等)、訊號(失真度、響度、動態(tài)范圍、噪訊比、瞬態(tài)響應、聲道分離度等)、音場與方位性(直接音、前期反射聲、混響聲、立體感、基準振動、吸聲率等)、聽覺特性(可聽范圍、各種聽感)等。

由于評估的要點眾多,甚至連人聲與音樂評估都必須分開處理,因此評估方式也較為復雜,分主觀與客觀2種方式處理。主觀方式評估參數(shù)為立體感、定位感、空間感、層次感、厚度感等5大方向,由于主觀方式較無標準可言,因此詳細評估細節(jié)在此不多贅述。
客觀評估方式多以儀器或是測試軟件評量,通常會有下列幾種標準:
1、總諧波失真(THD)
失真是檢驗數(shù)字音樂是否接近原音重現(xiàn)的關鍵,若失真度太大,則其它評估標準表現(xiàn)再優(yōu)異也沒用。總諧波失真(Total Harmonic Distortion,THD)則是檢查的第一關。主要是評估數(shù)字音效是否有非線性失真(Nonlinear Distortion)產(chǎn)生。
非線性失真是指輸入信號經(jīng)過處理后,輸出時所產(chǎn)生的錯誤部分,而這個錯誤部分則與原本的輸入信號完全無關,例如不是因破壞性壓縮格式所造成,是在輸入信號以外的頻率產(chǎn)生的其它類錯誤信號。這些屬于非線性失真的頻率就稱為諧波(harmonics),諧波產(chǎn)生的位置是原始信號頻率的整倍數(shù)的位置,例如,1KHz的諧波就是2kHz、3kHz、4kHz。
2、互調(diào)失真(IMD)
互調(diào)失真(Intermodulation Distortion)是指2個頻率間,因為頻率混合所產(chǎn)生的和、差、乘積的失真頻率,例如輸入頻率為2KHz與6KHz的訊號后,產(chǎn)生8KHz、4KHz、16KHz的訊號,甚至原始輸入訊號2KHz與失真的8KHz,又可能產(chǎn)生10KHz的訊號,這些失真的訊號亦稱為諧波,以數(shù)字播放裝置來說,這些互調(diào)失真的諧波當然越少越好。
3、相位失真(Phase Error)
相位失真則是1種線性失真,系指音源信號在傳輸和放大過程中發(fā)生時間延遲。因為電子音訊設備,在其輸出信號與輸入信號之間一般是存在相位差,例如電容和電感對交流信號(電壓或電流)具延遲作用。當一個交流信號經(jīng)過電容、電感和電阻時,或多或少造成延遲現(xiàn)象,這會導致這個交流信號的幅度變化時間向后推遲一段時間,造成聲音訊號不一致,對于需要定位性的聲音,如立體聲,影響更大。
4、頻率響應(Frequency Response)
頻率響應是對DAC/ADC轉換器頻率響應能力的評價標準之1。最佳狀態(tài)是在每1個頻率都能輸出穩(wěn)定,換句話說,輸出質(zhì)量越好的裝置,頻率響應曲線就越平直,反之則不但在高或低頻衰減得很快(因為高低頻訊號重建困難),在一般頻段,即人耳對聲音的可接收范圍20HZ-20KHZ內(nèi),亦可能呈現(xiàn)抖動的現(xiàn)象,無論是曲線突起(功率增益過大)或下滑(功率衰減)都是音質(zhì)失真的表現(xiàn)。
5、噪訊比(Noise Level)
訊噪比是指最大不失真訊號與噪音之間的比例,噪音分為2種,首先在數(shù)字音效的轉換過程中,每個相關零件都可能產(chǎn)生噪聲,并成為處理中的數(shù)字音效的一部分,這些訊號與輸入信號無關,但卻會隨著訊號源進入下一個處理單元或是輸出成聲音,換言之,就是設備自己發(fā)出的噪音。此外,當有訊號發(fā)出時所伴隨的調(diào)變噪訊(Modulation Noise),也是噪音的一種。噪訊比以S/N或SNR(dB)表示。于音效播放裝置來說,比值當然越大越好,例如Hi-Fi音響的SNR>70dB,CD機要求SNR>90dB。在實際設計上,因為人耳對4~8kHz的噪聲最靈敏,所以這個范圍的噪聲對于實際聆聽的影響較大。
6、動態(tài)范圍(Dynamic Range)
動態(tài)范圍表示的是最大不失真信號與噪聲值的比例,此處的噪聲指的是沒有信號輸出時的噪聲值。如音頻信號無失真最強部分與最微弱部分之間的電平差,這個比值為越大越好。不過動態(tài)范圍跟響度有關,并不是無限制的,即從最小的響度到最大不失真響度間的范圍,以CD為例,其聲音采樣分辨率為16bit,因此動態(tài)范圍就算毫無瑕疵,也只有65,536種響度變化,不可能超過。
7、立體聲分離度(Stereo Channels Crosstalk)
單聲道基本上不可能創(chuàng)造出立體感的聲音,只有2聲道以上才能辦到,就是所謂的立體聲。所謂聲道分離度,就是指不同聲道間立體聲之間的隔離程度,通常用1個聲道的信號電平與串入另1聲道的信號電平差來表示,換句話說,就是數(shù)字播放器左(右)聲道的聲音,傳到相對應另一聲道的情況。這個數(shù)值越大越好。一般要求Hi-Fi音響分離度>50dB。。
實際上,在數(shù)字信號中,要做到100%的左右聲道獨立是非常簡單的事情,然而實際能夠聽的聲音,卻是模擬信號,而能發(fā)出模擬信號的設備,本身就無法達到這一理想值,就是串音(Crosstalk)了,為一種訊號干擾,模擬在線相鄰訊號間的耦合干擾,會影響到彼此的訊號接收。例如在左聲道的信號,也能在右聲道取得一點點細微的相同信號,就會造成立體聲無法達到聽覺上的良好分離狀態(tài)。
此外,還有聲道平衡度,是指2個聲道的增益、頻響等特性的一致性。否則,將造成聲道或聲相偏移。


圖說:透過軟硬件設備與各種客觀標準,音效可以評估優(yōu)劣以及加以調(diào)整。
先天不足可后天加料 音效合成亦是研發(fā)重點
雖原汁原味是許多人追求音質(zhì)表現(xiàn)極致的至高標準,但是因上述各種原因,通常無法達到,所以音樂播放過程中,數(shù)字數(shù)據(jù)的呈現(xiàn)結果最重要是要防止在模擬儲存、和運作時所造成的音質(zhì)損耗。但是如果無法避免錯誤時,則也可以利用后天的方式彌補、修正。
例如以均衡器(Equalizer)能將不同頻率范圍的訊號分別濾出,然后再各別放大或縮小處理,最后再合成,藉此補償訊號的頻率衰減,使音質(zhì)回復至接近原音,或者也能補償輸入的不足,即針對一個音程里的倍頻點,可以去補償與衰減,在聆聽上,馬上可以得到實時的修正,使音質(zhì)達到接近理想狀態(tài)。由于人類的聽覺系統(tǒng)在低頻及高頻的接收上感受度較差,透過均衡器強化或補足聲音的功能,能彌補人們在聽覺上的盲點。
如將頻率為100Hz的組成泛音放大,就會讓聲音中100Hz左右的低頻部分聽起來更震撼一些,若覺得聲音的低頻部分不夠明顯,也可以用均衡器加以補足。像目前MP3播放器幾乎都有Equalizer的功能,使用者可選定或自定不同的播放音場(抒情、爵士、搖滾、流行音樂等),充份表現(xiàn)出音樂的個性化。

圖說:均衡器目前已經(jīng)以數(shù)字方式,內(nèi)建在大部分的播放裝置中,彌補聲音表現(xiàn)的不足或展現(xiàn)個性化音樂風格。
IT/CE類的音效播放設備提升音質(zhì)的方式很多,不過從關鍵零組件下手,通常能展現(xiàn)立竿見影的效果,對于開發(fā)上的難度來說,也相對較低,當然聲音表現(xiàn)在「一分錢,一分貨」的情況下雖然提高了,但是也讓開發(fā)案的成本,可能因此居高不下,但參考前篇的例證,提高音質(zhì)能夠拉開與競爭產(chǎn)品的差距,應值得開發(fā)者投資。
音質(zhì)提高的關鍵零組件在于DSP、Codec、DAC、與放大IC,一個個都成為今日數(shù)字音樂播放裝置音質(zhì)展現(xiàn)的瓶頸,以下將分別探討。除零組件外,實際電路設計、EMI與差動信號,連電源供應都會影響音質(zhì),如果采用高質(zhì)量零組件,卻敗在這幾個可能被研發(fā)人員忽略的細節(jié),相信也會令開發(fā)者遺憾。
數(shù)字音效音訊處理關鍵 DSP勝過純軟件譯碼模式
數(shù)字音效如前所述,幾乎都是壓縮格式,處理第一步,就是將壓縮格式經(jīng)譯碼還原,在PC類的音效裝置上,這個步驟由于有強力CPU代勞,所以幾乎可以將此必經(jīng)過程忽略不計,但是其它CE等級的音效播放裝置,特別是最熱門的手持類裝置,由于功耗與散熱限制較多,無法使用效能較高的CPU,故譯碼就成為音質(zhì)提升的第一個關鍵。
許多兼具影音功能的多媒體裝置,多半采用多媒體處理器進行譯碼,此種處理器包括TI的OMAP、Freesale的i.MX系列、ST的Nomadik、Renesas的SH-Mobile、NXP的Nexperia、ADI的Blackfin,以及Marvell的Xscale等。
不過采用處理器譯碼的方式,基本上可歸類為沒有硬件加速的純軟件譯碼,譯碼效率并不高,許多研發(fā)人員認為這部分對于音質(zhì)沒有影響,實際上的譯碼速度、精確度以及噪訊比等性能,通常較硬件譯碼表現(xiàn)略微遜色,因此終端輸出音質(zhì)也不用抱太多期待。此外,由于軟件譯碼,也不容易加入音效的后制處理,因此無法表現(xiàn)出音場,或者是不同音樂頻譜的動態(tài)調(diào)整等進階音樂表現(xiàn)能力。
因此,提升音質(zhì)的第一步,音訊譯碼應該用硬件處理為佳,在設計中加入采用純?yōu)橐粜ёg碼設計的DSP,讓譯碼精確度以及噪訊比等關鍵性能都有所提升,音質(zhì)自然會更好。甚至有的DSP還通過高音質(zhì)認證,如德州儀器(Texas Instruments,TI)推出的DA7xx系列,可同時執(zhí)行DTS-HD Master Audio串流解碼、8聲道192kHz原聲音訊及所有后段處理。

圖說:專業(yè)DSP需要為其開發(fā)最佳化軟件,音效DSP亦然,其算法考驗設計者功力。
Codec位居音效裝置數(shù)字模擬轉換要津 亦是音質(zhì)掌握關鍵
音效裝置輸入或輸出的是模擬訊號,人耳才能聽到,但是中間所處理的全是數(shù)字訊號,兩者間的轉換,也是影響音質(zhì)的重點,把數(shù)字音效數(shù)據(jù)轉換為可輸出的模擬訊號階段,因成本與布線等因素考慮,大多由音效Codec芯片所負責。
大部分的Codec芯片,同時具有D/A(數(shù)字訊號轉換成模擬訊號)和A/D(模擬訊號轉換成數(shù)字訊號)轉換功能。音效輸出時利用的是D/A轉換功能。以接收到來源數(shù)字訊號相同情況下,D/A性能好壞直接決定音效裝置的輸出音質(zhì),所以包著D/A的Codec芯片,其處理能力和訊噪比,對最終的聲音輸出質(zhì)量有很大的影響。
Codec的性能好壞,可由性能規(guī)格進行分析,例如支持可處理的數(shù)據(jù)位、取樣頻率、噪訊比、動態(tài)范圍與各項失真值等,有些codec已支持HD格式,在數(shù)據(jù)呈現(xiàn)上比較漂亮,但真實音質(zhì)未必比較好。決定Codec音質(zhì)關鍵簡述如下:
1、DAC訊噪比:DAC是Codec中真正負責轉換工作的單元,其訊噪比高低,將直接關系到最終音效聲波輸出的訊噪比,因此其性能為Codec的核心參數(shù)。大部分Codec芯片此項數(shù)值約在95db,但實際上,最后是否是能夠達到供貨商標示的數(shù)值,還是會受到很多其它因素影響。
2、Mixer訊噪比:Codec中有Mixer,也就是混音器,負責對聲音的迭加與混合處理,即可將2個或多個輸入音效流結合為1個輸出流,并可選擇各個輸入流的增益,所以Mixer噪訊比也是Codec影響音質(zhì)的因素,一般此項性能參數(shù)與DAC噪訊比約略相同或相近,差距在-1db左右。
3、DAC通道數(shù)目:許多音效裝置已開始支持多聲道,Codec芯片支持多信道能力,也是靠多信道DAC,其性能也會影響多聲道時音質(zhì)的表現(xiàn)。目前較新的Codec芯片大多已可以支持8通道的DAC轉換。
4、PCM格式轉換時所支持的最高取樣分辨率、和取樣頻率:以音質(zhì)的角度分析,取樣分辨率越高,對聲音數(shù)據(jù)的處理能力就越強;取樣頻率值越大聲音訊號的分辨率就越高,聲音轉換中的失真就越小。Codec芯片一般可以最高支持192KHz取樣頻率以及24Bit立體聲A/D轉換和24Bit立體聲D/A轉換。
5、A/D和D/A的頻率響應范圍:頻響范圍也是音質(zhì)中重要的指標,不過由于人耳的限制,只能聽到20Hz~20KHz的頻響范圍,因此超過此頻率的聲音就算處理得再好,使用者也聽不到,因此目前絕大多數(shù)的DAC頻響范圍,都在20Hz~20KHz之內(nèi)。

嫌包山包海Codec音質(zhì)不好 采用直接DAC音質(zhì)更上層樓
如前所述,DAC目前大多已經(jīng)包在Codec內(nèi),不過以音質(zhì)的角度觀察,Codec號稱樣樣通,可能就表示每樣表現(xiàn)都很平庸,例如在音頻信號處理上,Codec的精準度就不如獨立的DAC。
再者,Codec的Jitter控制力也不如獨立的DAC,Jitter指時基誤差,會造成音質(zhì)劣化,成因并非震動幅度等數(shù)據(jù)本身的錯誤,而是時間部分出錯了,造成聲音的波形扭曲,很明顯的,這對音質(zhì)高規(guī)格要求來說,絕對是一大殺手。
除了處理能力比較差外,目前主流多通道Codec在設計上很難避免多通道間的干擾,音質(zhì)表現(xiàn)會比2聲道Codec差一些,因此講求多聲道支持,又兼顧音質(zhì)的設計,會改用多顆雙通道DAC的方式解決需求。
雖然采用DAC的方式比Codec成本高,但是音質(zhì)比較好,目前講求音質(zhì)的裝置,越來越多采用專業(yè)DAC,如iPod、iRiver、Zune等。
專業(yè)的高音質(zhì)DAC廠商不多,較著名的有歐勝微電子(Wolfson)、德州儀器、恩智浦半導體(NXP Semiconductors)、Cirrus Logic等。
DAC音質(zhì)判斷的標準與要點,與前述的Codec差別不大,不過以規(guī)格來說,DAC的效能都略勝一籌,因此通常判斷的標準會更為嚴格,除了原本就被考慮的分辨率、取樣率,噪訊比、總諧波失真這幾項因素外,通常還會把有效位數(shù)(Estimated Number Of Bits,ENOB)、噪訊加失真比(SIgnal-to-Noise And Distortion,SINAD)、無雜散動態(tài)范疇(Spurious Free Dynamic Range,SFDR)、
差分性失真(Differential Non-Linearity,DNL)、積分性失真(Integral Non-Linearity,INL)等參數(shù)列入評比。
DAC的硬件規(guī)格通常也比較好。以Wolfson的WM8978為例,噪訊比達98db,具有改良的HI-FI級數(shù)位信號處理核心,支持增強型3D硬件環(huán)繞音效,以及5頻段的硬件均衡器,以改善音質(zhì);并有一個可程序化的陷波濾波器,用以去除音效裝置因為顯示屏幕開關或切換時產(chǎn)生的干擾噪音。
除了DAC,許多播放音效的裝置,如果擁有錄音功能,那ADC的質(zhì)量也相當重要,判斷標準與DAC相同。

放大IC攸關音質(zhì)與功耗 D類放大成首選
前述探討的幾個零件,都在于訊號轉換的部分,不過當數(shù)字音訊數(shù)據(jù)處理完畢,成為模擬的聲音訊號后,必須加以放大輸出,因此放大IC也是攸關音質(zhì)高低的重要環(huán)節(jié)。
不過放大技術與音質(zhì)的關連性,卻不能完全以音質(zhì)的角度出發(fā),以傳統(tǒng)的Class A/AB放大技術來看,A類放大的音質(zhì)最好,其原理是純粹的以模擬訊號進行線性放大,音質(zhì)沒有失真。
不過,A類放大雖具有最佳的信號傳真性,但卻相當耗電,一般來說,電能利用率只有20%~30%,例如供應100W電力給A類放大裝置,最后真正輸出到喇叭發(fā)聲功率的只有25W左右,其余的75W通通損耗掉,除了電力效率不佳,高耗能也代表會產(chǎn)生高廢熱,常需要在放大晶體管上配裝大型的散熱片輔助散熱。對手持式裝置來說,高功耗與高熱都是設計上的原罪,開發(fā)者避之唯恐不及。
另一種B類放大設計,雖省電性較佳,但信號失真影響音質(zhì)甚巨,因此衍生兼具兩者優(yōu)點的AB類放大,在音質(zhì)與省電性取得較能接受的均衡點,過去成為消費性音響領域最受歡迎的放大方式。
但目前在數(shù)字播放裝置,越來越講求整體電路配置空間縮小、并且降低功耗讓產(chǎn)品更省電,以維持電池續(xù)航力等種種發(fā)展趨勢下,于1958年就提出的D類放大(Class D Audio Power Amplifier),目前成為當紅炸子雞。
D類放大利用的原理為PWM(Pulse Width Modulation),作用方式類似于主機板上交換式電源概念,即利用數(shù)字頻率波型的疏密來輸出模擬振幅的高低大小,頻率密則振幅高,反之頻率疏時則振幅降低。也因此運作模式,D類放大亦被稱為為數(shù)字式功率放大或數(shù)字功放。
D類放大省略了傳統(tǒng)AB類晶體放大,在作成大功率機型時所需的大型變壓器、超大濾波電容,可改以小電容與類似交換式電源供應模式(Switching Power)的小型變壓器取代,使得電能可以快速直接地驅(qū)動喇叭單體。此運作模式提供了極高的電能利用率,純理論上是100%運用,實務上電能利用率也經(jīng)常在80%、90%水平。
由上述驅(qū)動模式即可發(fā)現(xiàn),D類放大電路當然在工作時不易產(chǎn)生高熱,所以可以免掉占空間的散熱片,此外,由于采用PWM模式,D類放大電路所需的體積,會比傳統(tǒng)的功率放大電路小了許多,成本也較低,加上低耗熱優(yōu)點,D類放大電路非常適合塞在小小空間里。
不過以音質(zhì)的角度檢視,D類放大的缺點是以調(diào)變程序所形成的放大,其結果必然與原始信號有些出入,但在一般消費性產(chǎn)品的音樂播放上,其質(zhì)量可被接受,甚至在目前的技術下,D類放大的音質(zhì)越來越好,特別是在低瓦數(shù)的狀況下。
例如,以采用D類放大器IRS2092S D的IRAUDAMP5設計方案,與同等級AB類放大輸入比較,在1kHZ、接4Ω負載時,80W以下區(qū)域,D類放大的THD+N實際上是低于AB類放大器,而在60W附近,D類放大的THD+N更是進步到了0.005%的水平。
只有在80W到140W區(qū)域,AB類放大的性能才稍高過D類放大,不過即使到了120W,D類放大的THD仍不超過1%。對于大部分數(shù)字音效裝置來說,很少用到高功率,低功率的情況比較常見,此時D類放大的反而占有音質(zhì)優(yōu)勢。
D類放大的優(yōu)劣評估,在于供電抑制率(Power Supply Rejection Rate;PSRR)以dB為單位,PSRR必須盡可能高。對于音質(zhì)方面,則為總諧波失真加噪訊比(TDH+N)要求,此點以百分比(%)為單位,,THD+N則是盡量低,一般不超過10%,高標要求上還要低于0.1%、0.01%。不過THD+N建議與負載阻抗Rl、輸出功率(Output Power)、PWM的調(diào)變頻率(f)等做比較,才能準確判斷。
此外,D類放大有獨特的電子特性,因此在音質(zhì)評估時,必須注意EMI電磁干擾問題。因D類放大IC會持續(xù)、頻繁地進行晶體管的導通、關閉作業(yè),所以很容易產(chǎn)生電磁干擾,對于音質(zhì)當然有不利影響。因此越能降低降低電磁干擾的發(fā)散度的產(chǎn)品當然越好,不過此點在空間與成本許可的情況下,可用金屬外覆來屏蔽。
此外,許多D類放大IC在省電性、控制性、體積縮小、彈性、保護能力上都有所著墨,形成各家的特色,大部分與音質(zhì)沒有太大關系,不過有些設計如果太過頭,對于音質(zhì)就會有影響。
例如一些D類放大IC減少后段的LC低通濾波電路質(zhì)量,如使用更小的電容,或根本省去電容(Cap-Free),甚至有些設計連外接電感都一并省去(LC-Free、Filter-Free),直接將揚聲器的音圈之漏電感來充當LC用,當然,此種D類放大IC能夠達到相當小的體積,因其輸出接腳可與喇叭、耳機直接相連。
雖此種設計方式可將體積縮至極小,但高頻部分未經(jīng)過濾就直接輸出,喇叭不易將20kHz以上的頻率發(fā)聲,即便發(fā)出人耳也聽不到20kHz以上的頻率,但如果省過頭,也可能對可聽范圍內(nèi)的音質(zhì)產(chǎn)生負面影響。D類放大IC的提供商有ADI、Cirrus Logic、MAXIM、Motorola、NS、Philips、Sanyo、ST、TI、TriPath等。

圖說:D類放大原理與AB類放大比較。
零件優(yōu)秀一時之選 整合電路也需配合才能發(fā)揮最高音質(zhì)
由于目前的數(shù)字音效播放裝置,大多在內(nèi)部整合各種電路,以及相關的數(shù)字IC,為達產(chǎn)品體積的集縮需求,各項組件間靠的非常緊密,組件間將無法保持足夠的距離隔開對音效處理組件的干擾,因此音樂透過模擬電路輸出時,幾乎都可以聽到程度不等的電子噪音夾雜其中。
針對此問題,在產(chǎn)品設計時就應該在印刷電路板規(guī)劃中,盡量將模擬電路和數(shù)字電路隔離,并確保模擬訊號布線遠離數(shù)字或功率開關布線。
此外,EMI干擾也是音質(zhì)殺手,開發(fā)者當然有許多傳統(tǒng)方式針對EMI做減低或隔離,但是最有效的方式為差動信號,即利用2個完全相同,但具有不同極性的訊號,取代單端電路。
例如在一個對稱布局中,2個路徑相鄰運作,一旦發(fā)生EMI干擾,則相同的EMI突波會被導入這2個信號中,但是,因為2個信號的接收側不同,所以EMI會被抵銷,換言之,共模抑制比(common-mode rejection ratio,CMRR)越高,則抑制EMI的效果就越好。此外,兩個鏡像也能夠增大訊號,使任何殘余的噪聲都會較不明顯。
再者,電源供應是數(shù)字裝置一定具備的組件,但也提供了噪聲干擾音質(zhì)的管道。對于線性電源供應產(chǎn)生的低頻電源線漣波,以及交換式電源供應器產(chǎn)生的高頻交換式噪聲,因此在設計上應該避免共享電源回路,此外,也可以藉由適當?shù)姆(wěn)壓器與高質(zhì)量電容器,加以過濾、抑制、消除,例如將低ESR電容放在音效IC的電源接腳附近,這可減輕交流噪聲影響,并且可以降低電源突波發(fā)生,
音質(zhì)提高,除了本篇提到的關鍵零組件(主動組件)外,被動組件(電阻、電容)的用料也相當重要,除影響前述的電源濾波質(zhì)量,在音效處理路徑中的交連電容、回授電容以及電組,都會因為其自身的電子特性,影響輸出的模擬訊號質(zhì)量,這部分的設計調(diào)整,對于最后音質(zhì)的細節(jié)影響也頗大,不過這是在主動組件已經(jīng)相差無幾的情況下,才能比較出差異。 |