我想從一個音頻文件中分離出2個或更多聲音,
對此有任何軟件嗎?
我做了一些Google搜索,發現在大多數情況下答案是否定的。 / p>
但是我認為至少應該有一種方法可以查看不同的頻率(就像波形一樣)並手動進行編輯?
我偶爾使用audacity來編輯音頻,但不知道是否它可以做到嗎?
我想從一個音頻文件中分離出2個或更多聲音,
對此有任何軟件嗎?
我做了一些Google搜索,發現在大多數情況下答案是否定的。 / p>
但是我認為至少應該有一種方法可以查看不同的頻率(就像波形一樣)並手動進行編輯?
我偶爾使用audacity來編輯音頻,但不知道是否它可以做到嗎?
是的,有可能,但這並不容易。
有很多免費的工具可以在頻域中編輯音頻。我沒有多少運氣與他們隔離特定的聲音,但是我已經能夠進行傳統的音頻編輯器無法做到的一些聲音處理。
Melodyne的最新版本應該能夠從和弦中挑選出各個樂器和音符。我自己沒有用過,而且價格昂貴。但是使用過它的專業人士似乎對此很在意。
回答“否”。 (-:
如果聲音佔據不同的頻率範圍,則可以使用帶通濾波器將它們分開。但是這種可能性極小,因為大多數聲音的大部分範圍都是相同的。
將Audacity切換到FFT視圖,以查看聲音在音頻頻譜中的位置。
總結:不可能達到90%到95%,但是在歌曲還具有器樂性的情況下(與歌曲相同-相同,我是指沒有聲音的實際歌曲部分),那麼,所有要做的是從歌曲中減去器樂(您可能必須分段進行)。如果我沒有記錯的話,這是一些無伴奏製作的家。
寫完這篇文章後,我發現了一些有趣的東西: http://www.crazypellas.net/forum-support-and-feedback-86/tutorial-how-to- make-diy-acapellas-6175 /(上面我提到了相取消法)
深度學習解決了混合雞尾酒問題。 https://www.technologyreview.com/s/537101/deep-learning-machine-solves-the-cocktail-party-problem/
使用機器學習無監督算法,可以解決雞尾酒問題。無監督算法將輸入的不同特徵考慮在內,並聚類為各種有意義的組。此技術可用於將混合語音分為不同的組。以下是可在Matlab中用於將混合音頻分離為單獨的音頻文件的代碼。[W,s,v] = svd((repmat(sum(x。* x,1),size(x,1),1 )。* x)* x');
您還可以在python或R中實現K-Means算法以完成此工作。但是,您需要檢查如何將音頻文件轉換為可以作為該算法輸入的位矩陣。