//

2023年1月19日 星期四

Open AI 發佈 MuseNet,數秒生成不同風格的原創音樂

 

Open AI 發佈 MuseNet,數秒生成不同風格的原創音樂


如果有一首鋼琴和豎琴協奏曲兼具莫紮特(Mozart)和凱蒂·佩里(Katy Perry)的風格,你想聽嗎?好吧,為什麼不呢?因為你現在可以做到,隻需要使用 OpenAI 的最新成果 MuseNet。這是一個機器學習模型,它可以基於對藝術家的瞭解以及幾段現有的音樂小節生成前所未有的原創音樂(萬幸這不會導致人類毁滅)。

這倒不算什麼新鮮事物(計算機生成音樂早在幾十年前就有了),但 OpenAI 的方法似乎具有靈活性和可擴展性,它可以生成各種類型和各種藝術家風格的音樂,並進行相互融合,形成新的風格。MuseNet 跟 OpenAI 的文本生成模型 GPT2 有着很多相同的基因,後者號稱 “太過危險,不適宜發佈”。不過,跟計算機生成真假難辨的假新聞比起來,計算機不受限制地生成音樂危險性似乎要小一些。

研究人員利用數十位藝術家的作品對 MuseNet 進行了訓練,其中有肖邦(Chopin)和巴赫(Bach)那樣的著名歷史人物,也有阿黛爾(Adele)和披頭士(The Beatles)這樣的現代藝術家,此外還有來自非洲、阿拉伯和印度地區的音樂作品。MuseNet 的復雜機器學習系統在模型用來為其下一步創作提供資訊的上下文關係上投註了大量的 “註意力”(attention,這是人工智能領域的一個技術術語)。

以莫紮特的作品為例,如果模型每次隻 “註意” 其中的幾秒鍾,那麼它就無法學習交響樂更龐雜的音樂結構,無法註意到其中的起伏以及音調和樂器的變化。然而,研究人員賦予了 MuseNet 足夠大的虛擬腦空間,讓它可以留存 4 分鍾左右的聲音,足以理解掌握一首擁有緩慢前奏和華麗收尾的樂曲或是基本的 “主-副-主” 結構。

你說仙妮亞(Shania)沒有受到來自海頓(Haydn)Haydn 的直接影響?醒醒吧。

從理論上講,情況是這樣。MuseNet 並不真的理解音樂理論,隻是能夠對音符的排列做出判斷:這個音符要接在這裏,那個音符要放在那類和弦的後面。這些作品的結構是基礎性的,但在聆聽的時候,我們能夠很清楚地聽出它們的確成功地模仿了之前饋入模型的音樂。

MuseNet 令人印象深刻的地方在於,作為單一模型,它能跨越多種音樂類型做到這一點。此前,AI 已經能夠生成以特定藝術家或類别為主題的作品,就像幾周前穀歌為紀念巴赫誕辰發佈的 AI 塗鴉,它可以利用機器學習技術生成巴赫風格的音樂。作為比較,我一直在聽 Generative.fm 上的白噪音,我非常喜歡一邊工作一邊聆聽該網站用機器生成的背景音樂(如果你也喜歡這樣,那麼我要向你介紹一下我最喜歡的音樂廠牌之一:Serein)。不過,這兩種模型生成的音樂在風格上都存在非常嚴格的限制,MuseNet 沒有這個問題。

除了能夠不受限制地生成藍草音樂或巴洛克風格鋼琴曲之外,MuseNet 還能透過一個風格轉換過程將兩者的特徵結合起來。一件藝術作品的不同部份可能擁有不同的特性:在繪畫中,那是指構圖、主題、色彩選擇以及筆觸。想象這樣一幅畫作,它有着前拉斐爾派的主題和構圖,但卻是用印象派的技法畫出來。聽上去很有趣,對嗎?AI 模型很擅長做這樣的事,因為它們能夠將這些不同的方面區分開來。這同樣適用於音樂作品:一首流行歌曲的音符排列、節奏和其他模式可以被分别抽取出來,然後獨立於演奏樂器進行調用——為何不用豎琴來發出海灘男孩(The Beach Boys)的和聲?

然而,模型沒有阿黛爾的煙熏嗓,要呈現這位歌手給人的感覺就有點難,而且 Muse 團隊選擇的合成器非常基礎,這也讓作品的整體效果打了摺扣。在收聽了一小段該團隊透過 Twitch 發佈的 “現場音樂會” 之後,我不太相信 MuseNet 能夠成為下一個熱門音樂創作者。另一方面,這個模型經常能夠奏出美妙的旋律,尤其是在爵士樂和古典音樂的即興創作中,在這裏一點點跑調無傷大雅,而音樂的節奏也不讓人感覺那麼做作。

MuseNet 能用來做什麼呢?事實上,沒有人能夠確定。這個領域是全新的,MuseNet 項目的負責人克里斯汀·佩恩(Christine Payne)對這個模型感到很滿意,她已經為其找到了一些使用者:

作為一個接受過古典音樂訓練的鋼琴演奏者,看到 MuseNet 能夠理解貝多芬和肖邦音樂作品中復雜的諧波結構,我感到特别興奮。目前,我正在跟一位作曲家合作,他打算將 MuseNet 融入自己的音樂創作當中,我很想要看一看人類和 AI 的聯合創作將把我們引向何方。

OpenAI 的一位代表還表示,MuseNet 團隊已經開始在模型中整合當代作曲家的作品,這些人希望看一看 MuseNet 是如何解讀或模仿他們個人風格的。

OpenAI 將開放 MuseNet 供大家試用直至 5 月中旬,屆時他們會將這個模型下線,並根據用戶的反饋意見進行調整。不久(大概是數周)之後,Muse 至少會實現部份開源。我想啊,受到大家歡迎的風格組合以及那些人們一直在聽的音樂作品將在調整之後獲得更大的權重。在這裏,我希望 MuseNet 團隊能夠在 MIDI 的實現上增添更多的表現力,目前的這些作品的確像是由機器人演奏出來的。不過,這些作品也是 OpenAI 工作質量的明證,它們很多都非常好聽。

圖片來源:enjoynz / Getty Images

翻譯:王燦均(@何無魚

MuseNet generates original songs in seconds, from Bollywood to Bach (or both)




沒有留言:

張貼留言

熱門文章