Meta發表AI模型 可轉換1100種語言 - 工程師

By Christine
at 2023-05-23T19:22
at 2023-05-23T19:22
Table of Contents
https://ec.ltn.com.tw/article/breakingnews/4310639
Meta發表AI模型 可轉換1100種語言
2023/05/23 15:58
https://img.ltn.com.tw/Upload/business/page/800/2023/05/23/4310639_1.jpg
Meta發表MMS模型,擴展文字轉語音及語音轉文字技術的應用範圍。(業者提供)
〔記者徐子苓/台北報導〕世界上許多語言正面臨消失的危機,Meta今(23日)發表一系
列的AI模型,可轉換超過1100種語言成語音或文字,Meta還透露訓練模型的秘訣是使用《
聖經》資料,未來將開源這項技術的原始碼及模型。
Meta的大規模多語言語音(Massively Multilingual Speech,MMS)模型,擴展文字轉語
音及語音轉文字技術的應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,
還能夠辨識超過4000種口語語言。
Meta表示,這項技術已有許多應用案例,從VR、AR至訊息服務,不僅能夠使用偏好的語言
操作,更可理解每個人的聲音。Meta將開源這項技術的原始碼及模型,讓研究社群能夠以
現有的工作成果為基礎繼續開發,一同保存全球的語言,並拉近人們之間的距離。
Meta也解釋如何訓練語言模型,過去最大型的語音資料庫最多僅涵蓋100種語言,因此開
發此技術所面臨的第一個挑戰就是「蒐集數千種語言的語音訓練資料」。為了克服這項挑
戰,Meta使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如《聖經》,
作為語言的文字訓練資料。
聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的
資料集,蒐集超過1100種語言的《新約聖經》有聲讀物資料集,平均為每種語言提供32小
時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已
涵蓋超過 4000種語言。
雖然資料集收錄的聲音以男性居多,但Meta發現,測試成果顯示,不論是男性或女性的聲
音,此語音模型皆能同等準確地辨識。此外,上述的語言訓練資料大多為宗教相關的內容
,但Meta分析顯示,這並不會使模型傾向於生成出更多的宗教性質的語言。
Meta表示,將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識
,並努力克服現有語音技術難以處理方言的挑戰。
--
佛沒說小乘、大乘。上座部佛教馬哈希尊者《具戒經講記》拆穿假佛教大乘經典的騙局。
上座部佛教明昆《南傳菩薩道》是真釋迦牟尼佛的菩薩成佛之道 大乘是假菩薩成佛之道
妙法蓮華經 華嚴經 心經 金剛經 楞伽經 梵網經菩薩戒 圓覺經 楞嚴經 是 大乘假佛經
阿彌陀佛 藥師佛 是 大乘假佛 觀世音 文殊 普賢 維摩詰 龍樹 地藏王 是 大乘假菩薩
https://www.ptt.cc/bbs/IA/M.1588944610.A.D9C.html
上座部佛教目犍連子帝須和那先破偽經大乘十方諸佛
--
Meta發表AI模型 可轉換1100種語言
2023/05/23 15:58
https://img.ltn.com.tw/Upload/business/page/800/2023/05/23/4310639_1.jpg

〔記者徐子苓/台北報導〕世界上許多語言正面臨消失的危機,Meta今(23日)發表一系
列的AI模型,可轉換超過1100種語言成語音或文字,Meta還透露訓練模型的秘訣是使用《
聖經》資料,未來將開源這項技術的原始碼及模型。
Meta的大規模多語言語音(Massively Multilingual Speech,MMS)模型,擴展文字轉語
音及語音轉文字技術的應用範圍,從最初的100種語言,至今已可轉換超過1100種語言,
還能夠辨識超過4000種口語語言。
Meta表示,這項技術已有許多應用案例,從VR、AR至訊息服務,不僅能夠使用偏好的語言
操作,更可理解每個人的聲音。Meta將開源這項技術的原始碼及模型,讓研究社群能夠以
現有的工作成果為基礎繼續開發,一同保存全球的語言,並拉近人們之間的距離。
Meta也解釋如何訓練語言模型,過去最大型的語音資料庫最多僅涵蓋100種語言,因此開
發此技術所面臨的第一個挑戰就是「蒐集數千種語言的語音訓練資料」。為了克服這項挑
戰,Meta使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如《聖經》,
作為語言的文字訓練資料。
聖經譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的
資料集,蒐集超過1100種語言的《新約聖經》有聲讀物資料集,平均為每種語言提供32小
時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已
涵蓋超過 4000種語言。
雖然資料集收錄的聲音以男性居多,但Meta發現,測試成果顯示,不論是男性或女性的聲
音,此語音模型皆能同等準確地辨識。此外,上述的語言訓練資料大多為宗教相關的內容
,但Meta分析顯示,這並不會使模型傾向於生成出更多的宗教性質的語言。
Meta表示,將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識
,並努力克服現有語音技術難以處理方言的挑戰。
--
佛沒說小乘、大乘。上座部佛教馬哈希尊者《具戒經講記》拆穿假佛教大乘經典的騙局。
上座部佛教明昆《南傳菩薩道》是真釋迦牟尼佛的菩薩成佛之道 大乘是假菩薩成佛之道
妙法蓮華經 華嚴經 心經 金剛經 楞伽經 梵網經菩薩戒 圓覺經 楞嚴經 是 大乘假佛經
阿彌陀佛 藥師佛 是 大乘假佛 觀世音 文殊 普賢 維摩詰 龍樹 地藏王 是 大乘假菩薩
https://www.ptt.cc/bbs/IA/M.1588944610.A.D9C.html
上座部佛教目犍連子帝須和那先破偽經大乘十方諸佛
--
Tags:
工程師
All Comments

By Todd Johnson
at 2023-05-21T14:47
at 2023-05-21T14:47

By Faithe
at 2023-05-23T23:00
at 2023-05-23T23:00

By Jack
at 2023-05-21T14:47
at 2023-05-21T14:47

By Oliver
at 2023-05-23T23:00
at 2023-05-23T23:00

By Mia
at 2023-05-21T14:47
at 2023-05-21T14:47
Related Posts
應材投40億美元設晶片研究中心 賀錦麗劉

By John
at 2023-05-23T14:38
at 2023-05-23T14:38
包子副工二月記

By Sierra Rose
at 2023-05-22T22:51
at 2023-05-22T22:51
Nvidia在台招募元宇宙工程師 傳新人年薪

By Delia
at 2023-05-22T22:06
at 2023-05-22T22:06
被歐盟處以天價罰款 Meta表示要上訴

By Rebecca
at 2023-05-22T20:49
at 2023-05-22T20:49
聯電經營團隊去年大加薪 酬金破億增為5人

By Hazel
at 2023-05-22T20:08
at 2023-05-22T20:08