谷歌推出先進的Gemini 1.5系列型號並將API定價降低50%

谷歌推出先進的Gemini 1.5系列型號並將API定價降低50%

今天,Google推出了兩款增強型可投入生產的 Gemini 1.5 型號:Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。與 5 月發布的原始 Gemini 1.5 型號相比,這些最新型號提供了漸進式改進。

修訂後的 Gemini 1.5 系列模型在 MMLU-Pro 方面實現了約 7% 的提升,在 MATH 和 HiddenMath 基準方面實現了約 20% 的增強,在視覺和編碼場景方面實現了 2% 至 7% 的改進。此外,谷歌還改進了模型響應的整體有用性。這些模型現在以更簡潔的格式產生回复,預設輸出長度比其前身短約 5% 到 20%。

除了模型功能的改進之外,Google還在定價方面進行了顯著的改變:他們正在降低 Gemini 1.5 系列模型 API 的成本。

  • 輸入令牌減少 64%。
  • 產出代幣減少 52%。
  • 對於低於 128K 令牌的提示,Gemini 1.5 Pro 的增量快取令牌減少了 64%,自 2024 年 10 月 1 日起生效。
Google 1.5 Pro 型號

谷歌還提高了速率限制,使開發人員能夠創建複雜的人工智慧應用程式。 Gemini 1.5 Flash 型號的付費等級速率限制現在為 2,000 RPM,而 Pro 型號的付費等級速率限制則分別從 1,000 和 360 增加到 1,000 RPM。此外,這些新模型還減少了延遲,為開發人員提供了兩倍的預期輸出速度和三倍的延遲。

隨著更新版 Gemini 1.5(-002 型號)的推出,Google 增強了該型號在遵守使用者指令的同時維護安全協議的能力。預設情況下,Google不會在這些最新型號上強制執行人工智慧內容安全過濾器;相反,開發人員可以根據自己的特定需求應用過濾器。

最後,Google推出了 Gemini 1.5 車型的升級版本,稱為「Gemini-1.5-Flash-8B-Exp-0924」。此實驗版本展示了文字和多模式應用程式效能的顯著增強。現在,開發人員可以透過 Google AI Studio 和 Gemini API 存取所有這些更新的 Gemini 1.5 模型。對於大型企業和 Google Cloud 客戶,這些最新更新的 Gemini 1.5 型號可在 Vertex AI 上使用。

來源

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *