Microsoft Azure AI 內容安全性引進了有害內容偵測的高級方法

2024/09/24

今天，微軟發布了有關生成式人工智慧安全功能的重要公告。其中，Azure人工智慧內容安全框架中引入了一個新工具，旨在偵測和修正人工智慧產生的幻覺內容。此外，微軟透露其Azure OpenAI 服務將開始在透過 DALL-E 3 模型產生的映像中實現不可見浮水印。

此外，微軟持續關注人工智慧安全，在 Azure AI 內容安全服務中公開預覽其創新的多模式 API 。該 API 旨在識別有害或不當內容，無論其來自人類創作者還是人工智慧工具。

根據微軟的一篇部落格文章：

多模式 API 支援文字和圖像輸入。它專為多類別和多嚴重性檢測而設計，允許它對不同類別的內容進行分類，並為每個類別分配嚴重性分數。對於每個類別，系統提供了從 0、2、4 到 6 的嚴重性等級。

這個新推出的多模式 API可以識別文字和圖像中的有害內容，包括表情符號，這些內容可能包含不安全或不適當的主題。這包括露骨內容、仇恨言論、暴力、自殘和性內容。微軟強調，API 可以偵測此類內容，即使它出現在文字和圖像的組合中，否則單獨分析時可能是良性的。

微軟在聲明中強調：

透過實現這些目標，多模式偵測功能可以促進更安全、更尊重的使用者體驗，從而實現創造性且負責任的內容生成。

此外，微軟指出，新的多模式 API 能夠快速偵測有害內容，確保其不會傳播給各種應用程式或服務的使用者。