什麼是穩定音訊 AI 以及如何使用它

2024/02/20

人工智慧已經變得無所不在，並被用於廣泛的用途，包括生成圖像、基於文字的內容，甚至聲音和音樂製作。 Stable Audio AI 是目前最好的音訊製作 AI 模型之一。

在本指南中，我們將了解這個人工智慧平台是什麼，以及如何使用它來創建原始音訊而不需要任何樂器。

什麼是穩定音頻人工智慧？

Stable Audio AI 是 Stability AI 開發的 AI 模型，該模型以其穩定擴散 AI 而聞名，可根據用戶提供的提示生成圖像。

Stable Audio 使用先進的人工智慧技術（特別是擴散模型）根據文字描述創建音訊。你輸入你想要的音樂或聲音，它會在幾秒鐘內產生它們。

Stable Audio AI 由 Stability AI 的音訊研究實驗室 Harmonai 創建，允許用戶使用提示生成原始音訊。

這個音訊生成 AI 模型之所以如此令人印象深刻，是因為它接受了來自領先數位音樂庫 AudioSparx 的 19,500 小時音訊資料的訓練。使用了超過 800,000 個音訊檔案來訓練它，這使得 AI 能夠使用 Nvidia A100 GPU 在不到一秒的時間內產生 95 秒的 44.1 kHz 立體聲品質音訊。

它設法使用潛在擴散技術來實現這一點，該技術類似於該公司用於影像生成的穩定擴散人工智慧。與其他音訊生成 AI 模型不同，Stability Audio AI 可用於創建不同長度的聲音。

您可以使用 Stable Audio AI 產生單一樂器的聲音、環境聲音甚至是完整的合奏聲音。現在讓我們了解如何使用它來產生音訊。

開始使用穩定的音訊 AI

您可以嘗試使用 Stable Audio AI 免費使用人工智慧產生音頻，但這需要在 Stable Audio 網站上建立帳戶。免費帳號也有一定的限制。

啟動瀏覽器並造訪Stable Audio 網站。到達那裡後，點擊右上角的藍色膠囊形按鈕，上面寫著「免費試用」。

點擊該按鈕將帶您進入新頁面，您可以在其中建立使用穩定音訊 AI 所需的帳戶。您可以輸入電子郵件地址和密碼來設定新帳戶，也可以透過 Google 帳戶登入。

如果您選擇使用 Google 帳戶登錄，則需要向 Google 授權才能與網站分享您的帳戶詳細資訊。輸入您的 Google 帳戶使用者名稱和密碼後，按一下「繼續」按鈕以提供所需的授權。

登入後，您將看到 Stable Audio AI 平台的主頁。這將包含您必須接受才能繼續的條款和條件。您也可以選擇從此處註冊穩定音訊電子報。點擊“我已閱讀並接受條款和條件”旁邊的按鈕，如果需要，請點擊下面的按鈕來訂閱他們的電子報。然後，點擊底部的“下一步”按鈕。

接受條款和條件將帶您進入穩定音訊儀表板，您可以使用該儀表板根據提示產生原始音訊。

使用穩定的音訊 AI

頁面的左上部分將是您可以輸入音訊產生提示的位置。

Hard rock, concert promotion, metal, 180 bpm您可以在框框中輸入類似的提示。然後，點擊底部的“生成”按鈕開始建立音訊。

產生音訊的另一種方法是使用位於提示部分下方的「提示庫」中的現成提示，您可以在其中存取不同的音訊提示樣式。為此，請點擊標有“無”的膠囊形按鈕。這將打開庫，其中包含您可以選擇添加到音訊中的各種樣式。

要從庫中選擇任何音訊提示樣式，只需單擊它即可。庫上方的提示部分將向您顯示樣式包含的提示。所選樣式將獲得一個播放圖標，提示庫按鈕上的標籤也會變更以反映所選樣式。

在「提示庫」下方，您可以看到用於音訊生成過程的 AI 模型。點選型號名稱（在本例中為“Stable-audio-audiosparx-v1-0”）將顯示所有可用型號。目前只有一種附加模型可用，該模型處於測試階段。您需要升級到 Pro 計劃才能使用 Beta AI 模型。

接下來是“持續時間”部分，您可以在其中控制生成的音訊的持續時間。點擊向下的箭頭將減少持續時間，而點擊向上的箭頭將增加持續時間。 Stable Audio 的免費版本可讓您產生 45 秒長的音訊。如果升級到 Pro 版本，您可以產生 1 分 30 秒長的音訊。

左側的最後一項是「新增額外內容」選項，您可以使用它來自訂音訊。點擊“+”按鈕查看可用選項，目前包括“步數”、“結果數”、“種子”和“提示強度”。

這些額外選項中的每一個都具有可自訂的設定。例如，如果您按一下「步驟」選項，您可以增加 AI 產生音訊所需的步驟數。預設情況下，新增 50 個步驟，您可以透過在提供的方塊中輸入步驟數將其增加到 100。

您可以透過點擊底部的“重置”按鈕返回到預設值。如果您想要完全刪除額外內容，請按一下必須輸入步數的方塊旁的「X」按鈕。

完成後，按一下「產生」按鈕，穩定音訊將開始產生音訊。或者，您可以刪除這些步驟並使用另一個附加功能，例如“種子”選項，它控制音訊生成的隨機性。預設情況下，該選項設定為“隨機”，這意味著 AI 模型將使用不同的音訊排列來產生音訊。您可以透過點擊「隨機」標籤並輸入「222222」等值來輸入不同的值，以使 AI 每次都使用相同的排列。

其他附加功能包括“結果數量”和“提示強度”。前者是 Pro 功能，可讓您控制 AI 為提示返回的曲目數量（最多 5 首），並且在免費版本中不可用。但是，您可以透過點擊嘗試“提示強度”選項。這將彈出一個滑塊，用於控制生成的音訊與所提供的提示的接近程度。預設情況下，它設定為 80%，但您可以向左或向右拖曳滑桿以根據需要減少或增加強度。

調整提示強度後，按一下「產生」按鈕告訴 AI 開始建立音訊。 Stability Audio AI 頁面的右上角還包含一些項目。第一個是音符符號，表示免費用戶擁有的積分數量。只要有積分就可以產生音頻，每月可獲得 20 分。然後，有一個允許您升級到專業版的按鈕、一個檢查帳戶詳細資訊的選項以及一個包含其他選項的漢堡選單。

按一下「升級至專業版」按鈕將顯示可用的定價方案。除了免費套餐外，您還可以選擇 Pro、Studio 和 Max 套餐，價格分別為 11.99 美元/月、29.99 美元/月和 89.99 美元/月。「免費」方案允許每月產生 20 首曲目，而「專業版」則允許每月產生 500 首曲目。「Studio」計畫可達 1,350，「Max」計畫可達 4,500。此外，「Free」計畫中的曲目持續時間為 45 秒，而所有其他計畫中為 90 秒。「免費」方案附帶個人許可證，而您則獲得具有其他選項的創建者許可證。

升級按鈕旁邊的選項顯示您在 Stable Audio AI 平台上的帳戶詳細資訊。單擊它將使您了解當前的計劃及其提供的所有內容。

完善你的提示

透過最佳化提示，您可以微調 Stability Audio 提供的輸出。使用生成式人工智慧時，提示越好，輸出就越好。您可以透過以下一些方法來改進提示。

如果輸出聽起來太電子化或數位化，請考慮在提示中使用“樂隊”或“現場”等詞語。
您可以透過在提示中包含「44.1kHz」、「高品質」和「立體聲」等字眼來提高產生的輸出品質。
在曲目中主導樂器的名稱後面使用“獨奏”一詞可以增強輸出。例如，如果主要樂器是小提琴，您可以在提示中使用“小提琴獨奏”。

透過 Stability Audio AI，您只需使用提示即可輕鬆產生令人印象深刻的音軌。如果您是初學者，免費計劃是嘗試該模型的絕佳方式，而專業音樂家可以升級到付費計劃並查看該平台提供的更高級功能。

什麼是穩定音頻人工智慧？

開始使用穩定的音訊 AI

使用穩定的音訊 AI

完善你的提示

發佈留言 取消回覆

發佈留言取消回覆