谷歌有一個人工智能可以把文本提示變成音樂

谷歌有一個人工智能可以把文本提示變成音樂

如果圍繞 AI 生成藝術的爭議還不夠,Google 已經創建了 MusicLM,這是一個從文本描述、圖像和簡單旋律生成音樂的系統。如果您認為這聽起來好得令人難以置信,請繼續閱讀以了解更多信息。

谷歌有一個叫做 MusicLM 的人工智能

雖然谷歌尚未正式發布MusicLM,但生成式人工智能係統已經成為頭條新聞。在其研究摘要中,谷歌對該技術的功能進行了抽樣,將其描述為一種“從文本描述中生成高保真音樂”的模型。

該軟件使用超過 280,000 小時的音樂進行訓練,提供多種格式的各種音樂場景。這包括從 Rich Captions 生成音頻Story ModePainting Caption Conditioning——一幅畫與它的描述配對(Google 包含了 AI 生成的音頻樣本)。

兩幅畫,旁邊有文字描述,還有人工智能生成的音頻

谷歌並不是第一個將 AI 用於音樂製作的公司。例如,LALAL.AI 有一個 Cassiopeia 算法,它使用人工神經網絡分離人聲和器樂,無需工程師手動執行。然而,谷歌在創建一個可以僅從文本生成音樂的系統方面取得了巨大的飛躍。

谷歌不會發布 MusicLM:原因如下

不幸的是,谷歌不太可能發布 MusicLM。最明顯的原因是它侵犯了受版權保護的音樂。當谷歌對其進行測試時,他們發現系統吐出的每首歌曲中至少有 1% 與它用於訓練軟件的音樂相同。

這個統計數據可能看起來很低,但它預示著災難,而且谷歌還沒有準備好捲入任何訴訟。

此外,該技術可能在其領域內無與倫比,但仍有一些要素需要提煉;人聲聽起來有缺陷和失真,而且這種語言比現實世界中任何現有的語言都更像 Simlish。

谷歌應該重新考慮 MusicLM

MusicLM 可能對音樂家和非音樂家都有很大的幫助,但除非谷歌做出廣泛的改進,否則它不應該上線。如果要發布該系統,至少需要進行兩個重大更改。

首先,谷歌需要找到一種方法讓 MusicLM 更合乎道德。Shutterstock 使 AI 藝術生成更加合乎道德,用戶更容易獲得,也許 Google 可以效仿。如果谷歌用準備好授權的音樂來訓練 MusicLM,並補償為系統做出貢獻的藝術家,那麼發布它可能是可行的。

其次,谷歌需要改進人聲。如果谷歌找不到解決不切實際的聲音和胡言亂語的方法,它應該完全放棄它們。像 Vocaloid 這樣的軟件將成為標準,如果它不符合相同的質量,那麼該功能就是徒勞的。

不是今天,谷歌

很明顯,MusicLM 有很多複雜性,按原樣發佈軟件是錯誤的舉動。但是技術在眨眼之間進步,所以總是有可能出現更好的東西——只是不是今天。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *