微軟、蘋果和其他公司正在為有語言障礙的用戶進行語音識別。

2022/10/03

微軟、蘋果、谷歌、Meta 和亞馬遜等主要科技公司正在努力改進殘疾人的語音識別技術。這些公司通過語音無障礙項目與伊利諾伊大學 (UIUC) 合作。

該項目旨在改善患有 ALS 的用戶的語音識別，後者更廣為人知的是 Lou Gehrig 病、腦癱、唐氏綜合症或帕金森病等，這些疾病會改變語音模式。微軟最近使用 AI 改進了 Windows 上的 Teams 呼叫，亞馬遜發布了新的 Echo 設備，例如 Echo Dot 和 Alexa Voice Remote Pro，它們改進了音頻架構。也許在未來，該項目可以幫助將此類產品擴展到具有各種語音模式的人。

帕金森的戴維斯菲尼基金會和格里森團隊等非營利組織也為該項目聯合起來。重點是，儘管語音識別技術和翻譯工具取得了進步，但對於具有不同語音模式的人來說仍然存在障礙。

UIUC 教授 Mark Hasegawa-Johnson 表示：

“每個人都應該可以使用語音界面，包括殘疾人。這項任務具有挑戰性，因為它需要大量的基礎設施，最好是領先的技術公司可以支持的基礎設施，因此我們創建了一個獨特的多學科團隊，在語言學、語音、人工智能、安全和隱私方面擁有專業知識。”

該計劃將從具有各種語音模式或語音障礙的用戶那裡獲取語音樣本，以創建用於訓練機器學習模型的數據集。首先，將聘請有償志願者教授美國英語。

資料來源：Engadget

發佈留言 取消回覆

發佈留言取消回覆