人的聽力在模式檢測方面很出色。 MP3具有心理聲學模型,試圖匹配聽力和典型來源中的模式。音樂中的很多透明度都依賴於階段信息,而MP3則願意押在相關的階段和無關的階段。 c的相位組成非常複雜,在很大程度上聽不清它的聲音,因此MP3可以簡化。
另一件事是,環境中存在混響和混響,也降低了相位的連貫性。
因此,最有問題的測試對像是沒有後處理的 dry 錄音,而且相當複雜,需要熟練的技術人員才能分辨出來。
高質量的淺三簧顫音手風琴。手風琴具有非常穩定的頻率和較高的泛音含量,“顫音”是指(鋼)簧片彼此略微失諧,從而產生一致的拍打效果。 “淺”表示拍子只有幾美分,一支3簧顫音的簧片頻率比主簧片稍低,而一支簧片的頻率比主簧片稍高。像這樣的顫音之所以能夠通過耳朵進行調諧,是因為無法通過觀察孤立的頻率讀數來確定跳動的精度以及上下跳動的兼容性。
所以現場直播聽起來不錯。以合理的質量記錄是一頭熊。當您設法創建一個好的.wav時,MP3壓縮的閾值介於不容忍和一般之間,介於160kbps和192kbps之間。我敢肯定,您可以分辨出192kbps和320kbps。顯然,在這種情況下,MP3的心理聲學模型無法很好地捕捉到耳朵所捕捉到的聲音(Vorbis的行為與這種音源的可聽質量和比特率之間的關係更符合預期)。麥克風通話也已經成為問題。使用沒有顫音的配準,您可以輕鬆壓縮而不明顯影響質量。一開始使用聽起來很糟糕的樂器,但您很難輕易掌握其中的區別。甚至2簧顫音已經可以更好地發揮作用。
因此,這是具有特定元素的特定聲音,其中MP3需要相當高的比特率才能完成合理的工作。我想像像ym片上的閉路爵士樂刷牙技術(帶有可識別的可定位成分的複雜噪音)在並排比較中同樣明顯,但在“透明/泥濘”類別中可能會更多“很好/很醜”。
通常,“以192kbps和320kbps的速度聽音樂會產生很大的不同”對我來說似乎有些過分。對於大多數音樂,不同之處在於,如果您嘗試將單個樂器/組件集中在一個複雜而透明的整體中,並且原始錄音足以使這一嚐試成功。與聆聽樂趣相比,這更像是一種聲音工程師的聽力。我認為某些聲音像手風琴顫音那樣在壓縮下會明顯破裂。