題:
192和320 kbit / s .mp3文件之間是否存在可聽見的區別?
boehj
2011-05-15 20:28:29 UTC
view on stackexchange narkive permalink

我的朋友對mp3比特率非常挑剔,並且總是會尋找文件的320 kbit / s版本。但是,我從未註意到任何差異,它們對我來說聽起來是一樣的。我記得曾經讀過某個地方的聲音,即使存在,人的耳朵也根本無法感知到這種差異。

在此區域是否進行了任何高質量的測試?

需要什麼樣的因素來弄清192和320 kbit / s .mp3之間的音頻質量差異(如果有)?


當前正在 skeptics.stackexchange上討論此問題。從音頻專家那裡獲取一些意見被認為是合理的。因此,經作者許可,我將其發佈在這裡。

不能說我是這方面的專家,但是如果您想听聽不同MP3比特率之間的差異,那麼值得一聽的是崩潰c的衰減。較低的比特率聽起來很“泥濘”。
@Mark-為有關c的信息而歡呼。我在某處(我認為)讀到(高音)小號也是某些人的贈品。但是我真的可以彌補這一點,老實說我不記得了。我用`--preset fast extreme`和`lame`做所有CD或.flac-> VBR .mp3。我無法通過KRK VXT6分辨出.mp3和源文件之間的區別。不過,我絕對會留意the的。
Muntoo在有關懷疑論者的同一問題上發布了此鏈接,我只需要再次分享:(http://xkcd.com/841/)[Audiophiles]
@JYelton-這是他最好的之一。 :)
如果您選擇一點音樂,將其轉換為兩種不同的格式,再次將它們轉換回無損的高質量文件,將它們並排放置在像樣的DAW中,將其中之一翻轉並混合在一起,則可能會產生反相效果意味著您可以聽到兩個文件之間的區別。我自己沒有嘗試過,所以我不知道如何
我注意到的最大區別是音量。如果您非常大聲地收聽音頻文件,則比特率越低,與高比特率的文件相比,其失真越大,音量越低。
Oops, the link in my previous comment was broken. It should be [xkcd.com/841](http://xkcd.com/841/).
十三 答案:
Ian C.
2011-05-16 00:34:08 UTC
view on stackexchange narkive permalink

如果您追求聽得見的差異,則可以使用的唯一測試是雙盲測試。諸如波形分析之類的經驗測試肯定會顯示出輸出的差異,但這並不意味著該差異是可聽見的。

在這種情況下,您可以讓一些人聽音樂樣本並讓他們猜測樣本的比特率。 ABX類型測試似乎在比特率比較中很流行:先聽樣本A,然後聽B,再聽X,然後確定樣本X來自A還是B。因此,A可能是192 kbps,而B可能是320 kbps,並且偵聽器必須確定X是來自192還是320 kbps編碼軌道。這種測試比“將比特率分配給樣本”類型的測試要好一些,因為偵聽器無法準確地猜測通過它的方式並歪曲結果。

還有其他雙重盲法,請參見本文的詳細信息

雜誌上有一些嘗試揭示編解碼器和採樣率差異。 Maximum PC文章在網絡上引起了很多關注,儘管他們分別進行160 vs 192和320 vs未經壓縮。

我在該書上找不到任何學術論文。事情(但我看上去並不難),這讓我有些驚訝。我本以為會有很多研究生在心理聲學方面的研究。

+1用於雙盲測試,但請記住,您還要同時測試揚聲器/耳機-如果它們的頻率響應有限,則它們可能會掩蓋更高比特率編碼的好處。
為此伊恩喝彩。我相信懷疑論者會對此感到高興。我也很驚訝沒有太多人在網上跳出來。因此,現在我想為懷疑論者解決這個問題的關鍵是找到一個好的ABX試用版。
@boehj:去年我離開舊公司時,我失去了IEEE DB訪問權限。如果您可以找到某人可以訪問他們的論文,那麼我相信您將能夠找到IEEE資助的與此主題相關的研究論文。這就是他們的小巷。
有些ABX軟件程序會使您看不到開關。在嘗試對此進行評估時,我發現它們非常有用。
傑夫·阿特伍德(Jeff Attwood)最近在他的博客上進行了盲聽測試。請在此處閱讀(http://www.codinghorror.com/blog/2012/06/the-great-mp3-bitrate-experiment.html)。
@JohnRegner,看起來好像支持我對此事的個人假設。真好
我在一對Genelec 1030揚聲器上對古典音樂做了某種盲目測試。我們聽了一首,每分鐘比特率都在變化。我們事先知道有哪些質量可用(從96kbps立體聲MP3到完整的16位44k1 PCM),我們必須確定順序。我們與6位專業工程師進行了測試,這些工程師對192kbps的質量要低於對320kbps的質量。儘管不如雙盲測試可靠,但實際上表明存在聽覺上的差異。
Rory Alsop
2011-05-19 17:22:50 UTC
view on stackexchange narkive permalink

我發現它完全取決於音樂的類型和您通過以下方式收聽的揚聲器:

我可以通過低比特率的耳機通過ipod開心地聽ipod上的流行音樂(嗯,我說很高興-並不是忠實於流行音樂的粉絲,但我的意思是聽起來應該如此。

如果您通過體面的或高端的音頻系統播放相同的mp3,聽起來會更糟,但是,

我真正的問題是試圖通過高端系統以低比特率收聽重金屬或古典音樂。彎角,飛濺和其他數字人工製品破壞了我從一首好音樂中獲得的樂趣。這種情況主要發生在頂端(cy,吉他失真等),尤其是在同時出現明顯的底端(1)的情況下。

也就是說,我從不擔心320恆定比特率,因為它只是導致大文件。最好使用可變比特率,因為它可以智能地減少不需要的文件大小。

1-錄製我們的新曲目之一發現生成mp3時存在主要問題-部分不僅有很多高音高失真的吉他,而且還有一些主要的亞音速,它們的頻率從80 Hz降到15 Hz。這就需要高質量的VBR來應對:-)

Izhaki
2013-10-21 06:26:23 UTC
view on stackexchange narkive permalink

對此的最終答案是:這取決於您要編碼的材料。

最強有力的科學依據是編碼人員本身。使用VBR(可變比特率)編碼mp3時,某些編碼器會顯示使用該比特率編碼的幀數。這是LAME的屏幕截圖:

The output of VBR mp3 encoding in LAME

您會注意到10735中只有10幀是使用320kbps編碼的,這是mp3支持的最高比特率。如果將質量設置為最高(在此示例中未設置),則實際上意味著沒有聲音差異。如果沒有使用320kbps編碼的幀,則聽覺上的差異是無法分辨的。可悲的是,輸出並沒有提到320kbps的編碼是否足夠,或者是否需要更高的比特率。大多數人聲軌或貝斯唱片很少需要超過192kbps。

從已進行的各種實驗(包括我參與過的一些實驗)中,您應該期望發現我們的聽力與聽覺不一致。這些編碼器的輸出。換句話說,在日常使用的材料和環境中,人們無法分辨192kbps和256kbps之間的差異,更不用說320kbps了。儘管許多實驗還不夠全面(測試環境和統計分析),但有充分跡象表明,我們的理解比mp3編碼器的假設要糟糕得多。請記住,大多數數字廣播電台都使用96kbps進行傳輸。

但是,應根據具體情況使用嚴格的研究做出最終裁決,這是極其困難的。另外,上述過程可以讓您便宜又快速地指示出人們是否應該能夠分辨出差異。

為此+1。任何真正知道自己在做什麼的人都將意識到,當比特率不夠高時,細節上的明顯損失是無法很好掩蓋的細膩聲音。如果沒有很多細膩的聲音,或者聲音一開始是渾濁的,那麼高水平的壓縮效果很好。當仍然有很多小的細節混合在一起時,所需的數據量就會增加。您不能從整體聲音中識別壓縮音頻,而可以從細節中識別出來。
@Izhaki您如何進行此測試的?你有命令嗎?我想嘗試一下。
@Masi http: // lame.sourceforge.net /
Sound Warrior
2013-01-03 21:45:24 UTC
view on stackexchange narkive permalink

我以聲音為生。

我已經用一台價值100,000美元的聲音採樣示波器將128、192、256和320的相同片段放入人耳聲音分析測試範圍,並填充了人耳整個頻譜的全波形。

進一步的分析表明,mp3聲音的主要問題不是在位中而是在任何位處的錄製設置失真。換句話說,人們傾向於在比需要的輸入高度高得多的輸入高度上撕裂音樂,從而引起所有波形的包絡折疊,從而在所應用的錄音中增加失真。

高於95%的輸入會對錄製造成損害,因為它幾乎沒有開銷。我的經驗法則是,不要錄製任何超過89.2%的音頻,因為這將使您的錄音有一定的開銷。所有聲音都有窺視點和谷底,必須為它們留出一定的空間,否則就被信封折疊折疊成高音而使聲音失真(低音降低)。

要獲得良好的錄音,您必須停留在音調通道中,然後才能通過收聽設備和接收器的耳朵的質量來複製它。順便提一下,兩者都不是一樣的或完美的。

我的意思是,聲音質量遠不止於復制聲音的質量。每個人在某種程度上都充耳不聞。您可以向100個不同的人播放一個聲音片段,每個人在某個時候會聽到不同的聲音。一遍又一遍的聲音實驗室證明了這一點。然後,您要考慮人類接受度(無論是否聽起來),從任何錄音中得出的最佳結果就是88%的接受度。

因此,您看到了,您正在為一場失敗的戰鬥而努力,試圖解釋最佳質量。只是不要讓您的錄音達到峰值,讓各個接收器調整自己的耳朵和設備的收聽水平。只需適度取樣即可發揮作用。這就是您或其他任何人可以或曾經做過的一切,以安撫任何人。

輸入記錄的質量是最好的答案,因為位複制深度的影響很小,只要保持在可接受的範圍內即可。經過30多年的經驗,只是我的看法。

我完全同意。在很多情況下,編碼所採用的級別就是問題所在。導出到MP3時,我曾經允許.3db的淨空。我現在選擇.6db只是因為我開始注意到在混響尾巴之類的東西上有一些怪異的偽影。聽到這些MP3問題時,您通常不會聽到它們,除非您這樣做。但是一旦有了,您就開始在各處聽到他們的聲音。對於耳塞的一般聽眾來說,區別仍然可能仍然存在,但大多數人不會聽到,因為那不是在聽。
我不太明白如果要從CD翻錄,則是將數字轉換為數字。您是說mp3編碼的失真加上原始wav的峰值(時間的90%)足以超過0dB嗎?對我來說這聽起來很瘋狂。您是否嘗試過以原始性或類似方式將原始wav與解碼的mp3進行比較?
儘管@naught101的過程並非無損,但轉換為有損格式需要經過心理聲學噪聲模型,其中涉及頻帶分配,掩蔽和舍入,因此您將一無所獲。Inter Sample Peaks對於一些編解碼器。有了16位記錄,您就無需再全面使用了-這是一個壞習慣。但是,關於是否將輸入音頻保持原樣並處理偽像的爭論,或者是否歸一化為-1 dB並因此改變音源以保留更多的源信號,這一爭論不在此範圍之內!
Owen Kelly
2011-05-16 20:32:23 UTC
view on stackexchange narkive permalink

對於未經訓練的耳朵來說,這幾乎是無法分辨的,即使是經過訓練的耳朵也需要引起注意。因此,很難量化可感知的差異,因為每個人對差異的理解,甚至根本都不一樣。

我在SAE的工作中所採用的音頻工程方法是憑感覺來進行的。您可以監視所有內容,並將其調整到第n級,但是由於音頻本質上是模擬的,因此您應該真正測量所有這些。就像Ian C所說的那樣,ABX測試是一種看待自己的好方法。

要根據我的經驗回答您的問題,答案肯定是肯定的。

您會發現差異將在很大程度上取決於歌曲的內容。以我的經驗,管弦樂是測試的完美主題。它的聲音結構非常複雜(通常覆蓋人類聽覺的整個頻率),並且具有很大的動態範圍。

位深度也會產生影響,我的經驗是,更大的位深度為24位與16bit的cd標準相對,也有很大的不同。另一個自然的增強是乙烯基。

正如其他人所指出的那樣,您使用的裝備也會影響感知。在我的白色小耳塞上,這種區別幾乎不像在大型錄音室監視器上那樣明顯。因此,如果要進行測試,則應盡可能使用質量最高的齒輪,以使齒輪完全消除諧波失真。您可以使用1980年的動臂音箱,而不會注意到A或B之間的差異。

如果您要進行測試,請進行跟進。聽高頻,尤其是小提琴和。還可以聽複雜的聲音,如明亮的鬆脆吉他。您將聽到的最常見的偽像將是移相器或梳狀濾波器。但是,您需要確保這些假像不是由測試中使用的齒輪引起的,包括數字模擬轉換器等。
John Leidegren
2011-05-22 19:26:51 UTC
view on stackexchange narkive permalink

在心理聲學領域有一些整潔的研究表明,有損音頻壓縮比無損格式對我們大腦的作用更大。我不能為我的愛而想起我從哪裡得到的,但是我相信那是從TED.com上獲得的,我確實在事後對這些聲明進行了一些背景調查,它們似乎相當準確。

大多數我們當然可以分辨出128位和192位速率之間的差異,但是192位和320位之間的差異聽不到。但是,對於受過訓練的耳朵,我打算做到這一點。我當然覺得,與192個計數器部件相比,收聽320個比特率的任務較少。但是,從一般意義上講,這確實很難應用。糟糕的MP3甚至在更高的比特率下也絕對會干擾我的聽力,但我無法將這種理論應用於一般人群。

聽眾的經驗(和培訓)絕對是其中的原因。除非您正在運行流服務並且需要對帶寬保持保守,我想說的是更高的320位速率。

這個答案確實需要參考。
@naught101對不起,我找不到原始來源。但是您應該能夠獨立地很容易地驗證這一點。只需下載一些MP3編碼器,然後使用各種質量設置來進行擺弄。如果您長時間以低比特率聽音樂,然後切換到相同的音樂(但比特率更高),那麼如果您不感到某種緩解,我會感到驚訝。儘管在什麼時候壓縮是個問題,但這可能是非常個別的。
-1
對不起,約翰,但這完全不科學。無法保證您不只是觸發確認偏差。當然,如果您“已經知道”更好,那麼“更好”的聲音文件將聽起來“更好”。 A / B盲測可以工作,但要在家裡進行安裝並不容易。我嚴重懷疑大腦是否有能力確定與MP3算法相關的偽像是“噪音”,而不僅僅是音樂的一部分。我的意思是,乙烯基比有損的MP3有損且質量較低,但人們仍然喜歡聲音。為什麼低質量的MP3不能如此?
@naught101如果這使您的興趣達到頂峰,我建議您去做實驗。您還將如何學習?我沒有答案,我只能從有限的經驗中吸取教訓。我找到了一個我認為您應該觀看的視頻。這是關於掌握“響度大戰”的空間,這很有趣。 https://www.youtube.com/watch?v=BhA7Vy3OPbc,這是我的原始參考文獻之一,我是該領域活躍的研究人員所找不到的。
我已經在下面發布了一個答案,其中包含兩個盲目的研究的鏈接,這些研究表明192kbit和320kbit之間沒有發現人類可察覺的差異。
@naught101我不會被Jeff Atwood和其他一些PC雜誌說服。我不會稱其為任何證據。它只是表明,一般而言,傑夫·阿特伍德博客的普通讀者無法分辨出區別。同樣,我建議您觀看視頻演示,它實際上包含該領域相關研究人員與該主題相關的材料。
For example, about 10 minutes into the video. The researcher (Thomas Lund) talks about something called codec overloading. This can happen with there isn't enough headroom in the signal going in to the codec. The amount of headroom required varies by codec and codec settings. There is a relationship between encoding and mastering. Jeff does not touch on any of these things. Thus I'd call his experiment amusing but not very significant.
Thomas還向我們介紹了M / S偵聽的概念。您可以在這裡閱讀有關此內容的更多信息https://varietyofsound.wordpress.com/2011/09/25/the-mid-side-technique/
user25299
2018-08-19 14:24:54 UTC
view on stackexchange narkive permalink

人的聽力在模式檢測方面很出色。 MP3具有心理聲學模型,試圖匹配聽力和典型來源中的模式。音樂中的很多透明度都依賴於階段信息,而MP3則願意押在相關的階段和無關的階段。 c的相位組成非常複雜,在很大程度上聽不清它的聲音,因此MP3可以簡化。

另一件事是,環境中存在混響和混響,也降低了相位的連貫性。

因此,最有問題的測試對像是沒有後處理的 dry 錄音,而且相當複雜,需要熟練的技術人員才能分辨出來。

高質量的淺三簧顫音手風琴。手風琴具有非常穩定的頻率和較高的泛音含量,“顫音”是指(鋼)簧片彼此略微失諧,從而產生一致的拍打效果。 “淺”表示拍子只有幾美分,一支3簧顫音的簧片頻率比主簧片稍低,而一支簧片的頻率比主簧片稍高。像這樣的顫音之所以能夠通過耳朵進行調諧,是因為無法通過觀察孤立的頻率讀數來確定跳動的精度以及上下跳動的兼容性。

所以現場直播聽起來不錯。以合理的質量記錄是一頭熊。當您設法創建一個好的.wav時,MP3壓縮的閾值介於不容忍和一般之間,介於160kbps和192kbps之間。我敢肯定,您可以分辨出192kbps和320kbps。顯然,在這種情況下,MP3的心理聲學模型無法很好地捕捉到耳朵所捕捉到的聲音(Vorbis的行為與這種音源的可聽質量和比特率之間的關係更符合預期)。麥克風通話也已經成為問題。使用沒有顫音的配準,您可以輕鬆壓縮而不明顯影響質量。一開始使用聽起來很糟糕的樂器,但您很難輕易掌握其中的區別。甚至2簧顫音已經可以更好地發揮作用。

因此,這是具有特定元素的特定聲音,其中MP3需要相當高的比特率才能完成合理的工作。我想像像ym片上的閉路爵士樂刷牙技術(帶有可識別的可定位成分的複雜噪音)在並排比較中同樣明顯,但在“透明/泥濘”類別中可能會更多“很好/很醜”。

通常,“以192kbps和320kbps的速度聽音樂會產生很大的不同”對我來說似乎有些過分。對於大多數音樂,不同之處在於,如果您嘗試將單個樂器/組件集中在一個複雜而透明的整體中,並且原始錄音足以使這一嚐試成功。與聆聽樂趣相比,這更像是一種聲音工程師的聽力。我認為某些聲音像手風琴顫音那樣在壓縮下會明顯破裂。

Rohjay
2011-05-21 05:28:26 UTC
view on stackexchange narkive permalink

要考慮的另一件事是他們是誰/如何編碼。我發現很多時候人們正在編碼和使用他們可能不理解的設置。儘管這個問題是如此有限,以至於它幾乎與“模擬與數字音頻”辯論相似。

可以感知嗎?是的。

收聽正確編碼的192kb / sec mp3會很麻煩嗎?不太可能...

聽編碼不正確的320kb / sec mp3會很麻煩嗎?是的。

這是個人喜好嗎?通常。

我聽不到128kb / sec的mp3 ...聽不到。 ! 192對我很好。如此說來,是否有那些擁有立體聲系統的人能夠很好地複制音頻,以至於人們對320優於192的偏愛是可信的?絕對...雖然我沒有立體聲系統= {

naught101
2014-02-20 06:01:27 UTC
view on stackexchange narkive permalink

請參見 http://www.codinghorror.com/blog/2012/06/conclusion-the-great-mp3-bitrate-experiment.html http:// www。 maximumpc.com/article/do_higher_mp3_bit_rates_pay_off。兩者都很簡單,但是有效的研究表明,我們不能真正區分出160kbps以上編碼的文件之間的任何區別。

一些警告:

  • 上面的數字是立體聲。對於具有更多通道(例如環繞聲)的文件,您需要相應地更高的比特率。因此,基本上來說,如果有2個以上的頻道,您會聽到160 kbps和320 kbps的差異,因為每個頻道的比特率會更低。
  • 比特率受比特深度的影響。 16位聲音文件適合聆聽,但是如果要將其與其他音頻混合,則可能需要20或24位聲音提供的額外淨空,並且比特率(和文件大小)將相應地更高。但是您將無法通過單獨收聽音頻文件來聽到這種差異。
Ronald
2012-07-20 16:54:48 UTC
view on stackexchange narkive permalink

我是一個非常挑剔的聽眾。我注意到,使用聲學樂器,與不是高端音頻的mp3播放器相比,您會聽到優質音頻集的區別。爵士笛,顫音和長笛。他們有8個自然管道的寄存器,其餘的是電子設備。

我把所有這些音樂CD都存儲為 .wav ,聽起來很完美。我以不同的比特率嘗試了 .mp3 ,聽起來效果不太好,氛圍也更少了……音樂的溫暖中缺少一些東西。

我很樂意看到人們能夠區分出高質量的320kbps`.mp3`和高質量`.wav`文件的證據(非軼事)。
您可能正在等待一會兒羅伯特。
Gary L. Nordeen
2015-12-24 11:33:44 UTC
view on stackexchange narkive permalink

不考慮數學和測量軟件,中高頻出現某種失真或振盪。通過持續的弦樂或鍵盤音調,尤其是在符號上,您會聽到更多。無論分辨率如何,所有MP3似乎都存在此問題。 320 kbps的發音不太明顯,但仍然存在。在揚聲器打開的情況下,立體聲圖像也較小。戴著耳機,我聽不到變化。 Wav / FLAC甚至在320時也將顯著改進為MP3,播放的音樂類型只有幾個例外,但即使如此,在A / b測試中也會注意到。有多少人可以說是另一個故事。作為一名工程師,我被教導要記住只有5%的人口可以聽到您聽到的聲音,所以不要花所有的時間使它變得完美。只是擔心好。

user25294
2018-08-19 02:59:51 UTC
view on stackexchange narkive permalink

簡單明了,是的,期間有所不同。沒有辯論。如果某人聽不見差異,那是因為他們的聽力已經受損,他們只是聽不到頻率差異。降低比特率會降低質量!我不明白為什麼這甚至是一個問題。查看數據!自我解釋。除此之外,許多可靠來源的人在Google上還有大量結果!這不是火箭科學。...

Vinyl Junkeee
2015-12-17 12:15:40 UTC
view on stackexchange narkive permalink

我對此並不陌生,但認為分擔我的2美分價值會有所幫助。當我偶然發現以128kbps編碼的舊版本,並以320kbps編碼的版本背對背聆聽同一文件時,我注意到給定音樂文件的聲音深度。令人煩惱的是,一旦我感覺到這種差異,我內心的完美主義者便開始更新我幾乎完全是音樂庫的其餘部分。使用參考質量的耳機來注意差異。

眾所周知,128kbit足夠低,足以引起音頻問題。這就是為什麼這個問題專門詢問大約192kbit的原因。在我的閱讀中,某些情況下160kbit *可能與320有所區別,但192kbit卻沒有。


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...