谷歌推出先進的Gemini 1.5系列型號並將API定價降低50%

2024/09/24

今天，Google推出了兩款增強型可投入生產的 Gemini 1.5 型號：Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002。與 5 月發布的原始 Gemini 1.5 型號相比，這些最新型號提供了漸進式改進。

修訂後的 Gemini 1.5 系列模型在 MMLU-Pro 方面實現了約 7% 的提升，在 MATH 和 HiddenMath 基準方面實現了約 20% 的增強，在視覺和編碼場景方面實現了 2% 至 7% 的改進。此外，谷歌還改進了模型響應的整體有用性。這些模型現在以更簡潔的格式產生回复，預設輸出長度比其前身短約 5% 到 20%。

除了模型功能的改進之外，Google還在定價方面進行了顯著的改變：他們正在降低 Gemini 1.5 系列模型 API 的成本。

輸入令牌減少 64%。
產出代幣減少 52%。
對於低於 128K 令牌的提示，Gemini 1.5 Pro 的增量快取令牌減少了 64%，自 2024 年 10 月 1 日起生效。

谷歌還提高了速率限制，使開發人員能夠創建複雜的人工智慧應用程式。 Gemini 1.5 Flash 型號的付費等級速率限制現在為 2,000 RPM，而 Pro 型號的付費等級速率限制則分別從 1,000 和 360 增加到 1,000 RPM。此外，這些新模型還減少了延遲，為開發人員提供了兩倍的預期輸出速度和三倍的延遲。

隨著更新版 Gemini 1.5（-002 型號）的推出，Google 增強了該型號在遵守使用者指令的同時維護安全協議的能力。預設情況下，Google不會在這些最新型號上強制執行人工智慧內容安全過濾器；相反，開發人員可以根據自己的特定需求應用過濾器。

最後，Google推出了 Gemini 1.5 車型的升級版本，稱為「Gemini-1.5-Flash-8B-Exp-0924」。此實驗版本展示了文字和多模式應用程式效能的顯著增強。現在，開發人員可以透過 Google AI Studio 和 Gemini API 存取所有這些更新的 Gemini 1.5 模型。對於大型企業和 Google Cloud 客戶，這些最新更新的 Gemini 1.5 型號可在 Vertex AI 上使用。

來源

發佈留言 取消回覆

發佈留言取消回覆