[心得] 整理翻譯 mp3 vs AAC 與 有損 vs 無損


《前言》

想寫這篇文章很久了,
主要前陣子在探究Apple music與Spotify的音質差異,
就我所知,
– Apple music是256Kbps的AAC
– Spotify是320Kbps的MP3
(編按:這裡完全誤會,原來Spotify是OGG Vorbis,因此我拿掉後面不正確的結論)

以這主題來說,CODEC不同、位元率不同,要比較有點奇怪,
且還不考慮不同的mp3 codec也有差異、串流在不同環境下的比較,
要討論音質其實並不容易。

然而網路上,至少中文的資源,針對這個主題,
往往只用描述的方式,
整理針對CODEC的說明、大概解釋位元率,
深一點會解釋不同編碼的邏輯與特色

但很少透過具體圖像,去比較聲音如何被影響,
不論是透過示意圖、演算法模擬或是真實的轉換,
我個人會很想知道「頻譜或是波形,壓縮前後的差異」

(當然對許多情況,不用講到這麼具體,就足以支持其論點)

尋尋覓覓,這篇來自Stereophile.com的老外文章,
看完拍案叫絕,
非常詳盡的介紹有損壓縮與無損壓縮,
並拿幾種常用的出來比較,使用頻譜解釋。
(有損的部分選擇Mp3與AAC、無損選擇FLAC)
https://www.stereophile.com/features/308mp3cd/index.html

其中使用頻譜的部分,
選的題材非常具有啟發性,
當然,頻譜是非常根本、非常物理層的,
編曲、錄音、混音、編碼等等的技術往往影響音樂更多,
然而從最根本的角度去看不同的CODEC,
可以直接佐證一些特色與理念。

太精彩了,常常會打開來看,也很想整理起來,
最近工作很操,決定靜下來寫這篇文章轉換心情。

《內文概述》

本篇文章將擷取文章,翻譯給各位版友參考,
將包含:
– 翻譯一段文字,解釋錄音檔,以及有損壓縮與無損壓縮
– 利用這篇文章的圖,簡單比較不同codec的差異

(因為我比較熟悉英文的術語,翻譯的部分看不懂可以討論一下)

文章會有點長,盡可能的解釋清楚是我的目標;
另外如果有興趣可以點進去原文,
看底下的討論,很多也很精彩。

《內文之一:有損與無損的差異(翻譯)》

一片CD上,三分鐘的錄音檔,大小為30到40MB。一台4G的iPod大概可以裝入
一百三十首歌曲,大約只是九張唱片的大小,為了放進更多的歌,某種壓縮
的技術讓檔案變很小就很必要,一方面也可以減少下載的時間。

無損壓縮對於聲音是無害的。就很像我們使用WinZip壓縮電腦的檔案,你讀
取出來的內容跟壓進去的內容一定是一樣的。而一般檔案的壓縮與聲音檔案
的壓縮最大的差異,在於後者需要能夠隨機存取。(想像為了聽一張唱片,
還要等電腦把400M的檔案全部解壓縮完,大概會馬上就不想聽歌啦)如果有
辦法把檔案壓到40~60%,一台4G的iPod就能放進三百首歌,大概是二十張唱
片,當然不同的壓縮技術有點差異,但我們需要把檔案壓的更小。

1980末期,MP3這種CODEC被提出來,並在1991年變成一種標準。一般來說,
MP3的壓縮比可以到10倍,也就是一首CD上要30MB的歌曲只需要3MB的儲存空
間。現在iPod可以裝進超過一千首歌了,而且通常家裡一般的高速網路,只
要十秒,歌曲就被抓下來啦。

但天下沒有白吃的午餐。MP3以及其他種類似壓縮比的演算法,都是「有損」
的:在這樣的需求下,許多音樂資訊就被捨棄掉。而捨棄多少,就看他的位
元率,越低的位元率就越多音樂消失。

以CD來說,不考慮overhead,從唱片上拉下來的檔案傳輸速率,兩聲道是超
過1400 Kbps,一般的MP3是使用十分之一,128Kbps。為了要這樣搞,MP3把
連續的聲音切成分離的時間區塊,並透過各種轉換去檢視每個區塊。Codec
的設計者,根據一些聲音的心裡學,做一些假設,討論看看有哪些可以捨棄,
例如同一個時間裡,播出比較小聲的就被捨棄,畢竟大聲的會蓋過小聲的。
另一方面為了要使用各種轉換來處理,這些被切開的時間之間,可能具有的
連續性特質就也被捨棄了。(編按:這段英文好懂很多XD)

一般聽眾會不會感受到有東西被捨棄了?那些在不同區塊間的連續性特質,
到底聽不聽的出來?如我1994年所寫的,「如果這些演算法,使用聲音心理
學的假設時,所寫出的演算法是正確的,那大部分的人都聽不出來的。」

欸欸,「如果」這個餅畫的有點大。

況且,當各種演算法間所做的假設都不太一樣的同時,那些他們捨棄的,永
遠捨棄的真實資訊,可能在一些使用者的系統上,有一些音樂是聽的出來差
異的。用玩家術語來說,這些codec不夠透明!有些測試可以輕易demo出來。

所以對我們這些發燒用戶來說,討論哪個有損壓縮的音質最好,是有點阿雜
的事情。最好就使用WAV或AIF等完全沒壓縮的檔案,不然就選擇無損壓縮,
像FLAC或ALAC,這些檔案在不同種的系統、音樂間,對用戶都是完全透明的。
(編按:透明,意思應該是指沒有隱瞞)

《內文之二:不同code之間的差異:AAC與MP3》

進入討論前,先簡單介紹一下什麼是頻譜。
(信號與系統入門教學,START!)

人類的混沌持續數千年,直到富立葉轉換出現,世界才有了光明,
所謂富立葉轉換(Fourier Transform),
他證明出,世界上所有的波形(函數)都一定能透過一連串的單頻波組成,
可能1% 10Hz2% 11Hz0.368% 12Hz+…+=原PO的聲音
把那些幾趴幾趴,對頻率作圖,就是大家所說的頻譜。

男生、女生聲音的頻譜比較:

View post on imgur.com

y軸是剛剛說的幾趴幾趴,x軸就是越來越大的頻率

大概解釋一下就好

———————————————
底下一些圖與說明
———————————————

原文作者使用幾種訊號(聲音):
– 純1KHz tone
– 43個tone,彼此相隔500Hz,從350Hz到21.35KHz
– 上面檔案,去掉中間的一些tone。

經過各種codec轉換後,
再去看他的頻譜。

—-
純1K tone
—-

透過CD播放出來的訊號如下,-10dBFS的1KHz弦波,
伴隨著大概-132dB的雜訊,一直延伸到CD的最高頻22Khz,
等效來說訊雜比是CD標準的96dB
(就我所知,80dB是人耳可以辨認的極限)

View post on imgur.com

透過MP3 128Kbps轉換出來的波形如下,
就可以看出1K tone旁,有很明顯的裙子,
也就是1K tone的周遭有非常多不該出現的頻率的聲音,
另一方面,也可以看出沒有聲音的區域,那些底躁都無法還原出來

View post on imgur.com

—-
43個tone,彼此相隔500Hz,從350Hz到21.35KHz
—-

CD撥出來的如下圖,用圖就可以看得出來,
這應該很難聽XD但是不該有訊號的地方,當然不會出現。

View post on imgur.com

值得注意的是,這麼嚴苛的聲音,
利用FLAC可以精美的還原。

View post on imgur.com

至於Mp3呢?128Kbps的MP3如下圖,每根訊號旁邊都有裙子,
還不一樣多,很高頻的地方因為沒有訊號就被省略。

View post on imgur.com

而320Kbps,最高位元率的MP3也是難逃此難,
如下圖,有著低了20dB的裙子,
但對比訊雜比約在50dB,人耳可以輕易聽得出來。

View post on imgur.com

那AAC怎麼說?看看人家128Kbps的AAC,轉出來的頻譜,
也可以見到明顯的裙子,
但有趣的是,越低頻,裙子的能量越小,把雜訊都往高頻推,
的確大家的耳朵越老越聽不到高頻,
感覺是蠻合理的假設。

View post on imgur.com

到了320Kbps的AAC時,效果更為明顯,
16000K以內的聲音幾乎與原本差不多了!
像我去測試,最高只能聽到17000K,
當然我沒有真的調設備,可能是設備撥不出更高頻的聲音,
但感覺AAC是很好的選擇!

View post on imgur.com

—-
上面檔案,去掉中間的一些tone
—-

最後看這個聲音,去掉一些tone,
讓沒有聲音的淨空區更大,
到底mp3跟AAC誰比較不失真呢?

View post on imgur.com

Mp3 320Kbps轉換如下:

View post on imgur.com

AAC 320Kbps轉換如下:

View post on imgur.com

看來面對這種聲音,不該有的頻率AAC都不會給你,
Mp3會給你很多裙子,透過頻譜,
鍵盤耳機表示:
低頻會聽不清楚,中頻太弱,高頻太尖銳
(自己詮釋XD)

《結論》

不過apple music是使用256Kbps的AAC,
所以….內文其實沒有比較到,糟糕哈哈哈哈哈

但我個人認為,AAC貴為下一代的標準,當然有其厲害的地方!
如果耳機的頻率不夠高、人耳的聽覺也不是很靈敏了,
那AAC可以帶來的聽感,理論上128Kbps也能夠與CD相提並論。
因此我認為apple music的音樂檔案比較好(由於原PO誤會,刪除結論)

希望這篇能帶給大家一些比較解析的討論,
聽感是因人而異,
但樂器的定位、大小聲,各種音效的混音,
我相信大家都是希望可以透過自己的系統,
聽到樂手與混音工程師的想法,或是取得現場般的感受。

(就我的認知,還原現場是非常難的,因為聽覺有一部份是來自身體,
對於一些聽覺喪失的人,是可以透過背部,去定位周遭的聲音,
因此即使用音響,也很難做到音樂廳或演唱會的臨場感)

因此一定希望可以消除失真的,
或許不懂如何做好grounding、IC怎麼選、電源跟線材怎麼處理,
感覺很容易被噱一筆,

但檔案是我們可以掌握的部分,
所以我在跟朋友們討論時,
都一定會先建議他們至少開始使用串流,不要用youtube了,
就算1080P,4K,音樂的資訊量比起一般AAC都差太多。

我個人是因為看完這篇老外文章,才真正被說服,
開始收集無損的檔案,或是把家裡的唱片有空都轉一轉,
Hi Res的領域我還沒有想法,但最近購入了onkyo HA200,
(日亞買全新不用四千五台幣!)
未來可能可以慢慢往那裡前進

以上


※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.115.57.19
※ 文章網址: https://www.ptt.cc/bbs/Headphone/M.1513656960.A.A7A.html

Kowdan : 推整理 串流也是未來趨勢了 不過還是習慣cd轉 12/19 12:18
clioneurise : 好文推 12/19 12:19
greg7575 : 謝謝分享 12/19 12:36
sdfk7209 : 推個 12/19 12:39
JeremyC1984 : 想問我聽阿婆音樂有些歌高音某個頻率會破音 會有滋 12/19 12:43
JeremyC1984 : ~的聲音 有人有同樣的狀況嗎 12/19 12:43
greg7575 : 耳鳴去看醫生 12/19 12:46
tzangyoung : 推 12/19 12:47
chenszhanx : 蠻有意思的,不過-80dB以下的聲音可能沒辦法直接聽 12/19 12:48

這邊我講的是訊雜比,不是分貝,
這與另一位朋友所分享的遮蔽效應比較類似,
https://goo.gl/WDvEqK

但一下子找不到連結說明80dB是怎麼來的,要找一下

chenszhanx : 但是還是會明顯的讓分離度下降 12/19 12:48
ItsATrap : 推整理 12/19 12:48
d58974 : 好文推,如果當初讀碩碰到訊號處理有這篇就好了QQ 12/19 12:53
bowbowthru : 推整理 12/19 13:06
nerdgadget : 之前看320kbps下的Codec比較,總結是Opus>Ogg> AAC 12/19 13:26
nerdgadget : ,MP3的確很糟。 12/19 13:26

恩我也是記得這樣的順序,
至少Opus的官網是這樣宣稱的XD

這邊有一些發散的討論,
https://goo.gl/JEd6QK

yenchieh1102: 推整理 12/19 13:43
itwobbs : 推好文。AAC還有mastered for iTunes可以開腦擴 12/19 14:17
s900037 : 推個 12/19 14:23
stardust7011: 推推 受益良多 目前仍處於不是mp3就是CD轉的狀態 12/19 14:36
chondrites : 推整理 12/19 14:39
will4006 : 優質文~推 12/19 14:55
bigheadpro : 推一下,串流還是之後的主流… 12/19 14:57
JDK284 : spotify 不是320k ogg vorbis嗎? 12/19 14:57

感謝提點,是ogg vorbis沒錯,怎麼一直記得是mp3凹凹
這樣這整篇就沒回答到Apple vs Spotify這個問題了哈哈哈哈靠邀

→ bigheadpro : 不過現在聽tidal 的master版本後就回不去了… 12/19 14:58

njvmp : 長知識推! 12/19 15:18
smallsmall : 讚! 12/19 15:35
zaqwer : 推用心!超清楚的 12/19 15:36

※ 編輯: iaminanl (59.115.57.19), 12/19/2017 15:40:53

pOsOq : good 推推 期待ogg的分析 12/19 16:06
kaienchou : u質好文,讚 12/19 16:19
Annex : 先標記 12/19 16:26
a8971882 : 推推推但是看不懂直接往下滑哈哈 12/19 16:39
qazxws : 推 12/19 16:55
chickengod : 好文推推 12/19 17:40
chitsaijang : 推 長知識 12/19 17:59
evadodoya : 推 12/19 18:03
MudaMuda : 詳細 推推 12/19 18:18
Wcw5504 : 這篇還是可以當成Amazon vs iTunes的比較啦 剛好一 12/19 18:59
Wcw5504 : 個是MP3 一個是AAC 12/19 19:00
alstorsummer: 推分享 12/19 19:18
orange7x7 : 推 12/19 19:39
jacky7987 : 推 12/19 19:53
micni2000 : 專業,推推 12/19 20:35
Kaneki : 推科普,另外現在最新的串流有損壓縮格式應該是Opus 12/19 20:37
Kaneki : ,應該可與AAC一戰。 12/19 20:37
good2513 : 好文推 12/19 21:23
Lickilicky : 先推 12/19 21:35
higreater : 專業推 12/19 22:49
charles1102 : 所以原po是都將CD轉成什麼檔案 12/19 23:51
charles1102 : 在硬碟空間足夠的話 理論上是否都轉成aiff最好 12/19 23:53
justagame : 不在意空間的話aiff很好啊 在意的話就flac吧 12/20 01:31
l6333133 : 值得一讀 12/20 03:50
justlovekiss: 推專業 12/20 09:41
KhePri : 好文推推 12/20 10:59
LsVCheN : 有看有推 12/20 11:48
tauym209 : 好 12/20 13:30
SYAT23 : 推整理 12/20 14:52
dyrlo : すごい 12/21 16:07
chino32818 : 推 12/22 21:31
k073322524 : 推 12/23 22:41