谷歌翻譯通過“零樣本機器翻譯”獲得 24 種新語言

谷歌翻譯通過“零樣本機器翻譯”獲得 24 種新語言
谷歌翻譯現在可以將單詞、句子和整個網站翻譯成 133 種語言。這家搜索巨頭使用零樣本機器翻譯技術,無需查看示例即可進行翻譯,從而大大加快了翻譯速度。

谷歌在 Translate中添加了24 種語言。這意味著谷歌翻譯現在提供 133 種語言的翻譯。谷歌聲稱有超過 3 億人使用這些新增的語言。

幾種新添加的語言誕生於Zero-Shot 機器翻譯,這是一種只看到單語文本的機器學習模型。簡而言之,谷歌開發了一種算法,可以在不看示例的情況下翻譯成另一種語言。

與任何翻譯一樣,這些新添加的語言並不完美,會出現一些問題。谷歌承認這一點,但保證翻譯會改進。谷歌已經擁有一支由母語人士、教授和語言學家組成的團隊,他們不斷為谷歌翻譯平台做出貢獻。

以下是谷歌翻譯現在可用的新語言的完整列表:

  • 阿薩姆語:印度東北部約有 2500 萬人使用阿薩姆語。
  • 艾馬拉:玻利維亞、智利和秘魯約有 200 萬人使用。
  • 班巴拉:馬里約有 1400 萬人使用。
  • Bhojpuri:在印度北部、尼泊爾和斐濟約有 5000 萬人使用。
  • Dhivehi:馬爾代夫約有 300,000 人使用。
  • 在印度北部,約有 300 萬人在使用 Dogri。
  • 綿羊:加納和多哥約有 700 萬人使用羊。
  • 瓜拉尼:巴拉圭和玻利維亞、阿根廷和巴西約有 700 萬人使用瓜拉尼。
  • 伊洛卡諾:菲律賓北部約有 1000 萬人使用。
  • Konkani:在印度中部約有 200 萬人使用。
  • Krio:塞拉利昂約有四百萬人使用。
  • 庫爾德人(索拉尼語):約有 800 萬人使用,主要在伊拉克。
  • Lingala:在剛果民主共和國、剛果共和國、中非共和國、安哥拉和南蘇丹共和國約有 4500 萬人使用。
  • 盧干達:烏干達和盧旺達約有 2000 萬人使用。
  • Maithili:在印度北部約有 3400 萬人使用。
  • Meiteilon (Manipuri):在印度東北部約有 200 萬人使用。
  • Mizo:印度東北部約有 830,000 人使用。
  • Oromo:埃塞俄比亞和肯尼亞約有 3700 萬人使用。
  • 蓋丘亞語:秘魯、玻利維亞、厄瓜多爾和鄰國約有 1000 萬人使用。
  • 梵文:在印度約有 20,000 人使用。
  • Sepedi:在南非約有 1400 萬人使用。
  • 提格里尼亞語:厄立特里亞和埃塞俄比亞約有 800 萬人使用。
  • 特松加:被斯威士蘭、莫桑比克、南非和津巴布韋約 700 萬人使用。
  • Twi:加納約有 1100 萬人使用。

有趣的是,大多數新語言並未在全球範圍內使用。但在一些地方廣泛使用。這有助於提高世界欠發達地區的識字率。而且,古代使用梵文等語言。這可以幫助許多人使用谷歌翻譯翻譯舊經文。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *