Microsoft Azure AI 內容安全性引進了有害內容偵測的高級方法
今天,微軟發布了有關生成式人工智慧安全功能的重要公告。其中,Azure人工智慧內容安全框架中引入了一個新工具,旨在偵測和修正人工智慧產生的幻覺內容。此外,微軟透露其Azure OpenAI 服務將開始在透過 DALL-E 3 模型產生的映像中實現不可見浮水印。
此外,微軟持續關注人工智慧安全,在 Azure AI 內容安全服務中公開預覽其創新的多模式 API 。該 API 旨在識別有害或不當內容,無論其來自人類創作者還是人工智慧工具。
根據微軟的一篇部落格文章:
多模式 API 支援文字和圖像輸入。它專為多類別和多嚴重性檢測而設計,允許它對不同類別的內容進行分類,並為每個類別分配嚴重性分數。對於每個類別,系統提供了從 0、2、4 到 6 的嚴重性等級。
這個新推出的多模式 API可以識別文字和圖像中的有害內容,包括表情符號,這些內容可能包含不安全或不適當的主題。這包括露骨內容、仇恨言論、暴力、自殘和性內容。微軟強調,API 可以偵測此類內容,即使它出現在文字和圖像的組合中,否則單獨分析時可能是良性的。
微軟在聲明中強調:
透過實現這些目標,多模式偵測功能可以促進更安全、更尊重的使用者體驗,從而實現創造性且負責任的內容生成。
此外,微軟指出,新的多模式 API 能夠快速偵測有害內容,確保其不會傳播給各種應用程式或服務的使用者。
發佈留言