Meta英翻台 全靠閩南語劇 - 工程師

Table of Contents

https://www.chinatimes.com/newspapers/20221028000240-260204?chdtv

Meta英翻台 全靠閩南語劇

04:10 2022/10/28 工商時報 何英煒

https://images.chinatimes.com/newsphoto/2022-10-28/1024/A13A00_P_02_01.jpg
Meta AI軟體工程師陳鵬仁,是該公司UST部門的主要研發人員,負責語音對語音即時翻譯
,第一個成功做出來的語系為閩南語。來自台灣的他,也透過閩南語的繪本,教小孩熟悉
閩南語。圖/業者提供

Meta上周發表AI技術支援非書寫語音翻譯系統,首先推出的是閩南語系。負責這項開發專
案的AI軟體工程師陳鵬仁來自台灣。26日晚間陳鵬仁接受越洋訪問時表示,此次語言資料
庫來源靠的是台灣閩南語連續劇,這研發過程中,也獲得台大教授李弘毅及陽明交通大學
廖元甫教授實驗室的鼎力相助。

陳鵬仁表示,現在所有的語言翻譯都是以文字為基礎,Meta是第一個實踐語音直接翻譯成
語言的公司。而這也與Meta的目標一致,希望未來在元宇宙時代,大家即時互動時,可以
直接用語言交談,即使是不同語言及語系,可以直接翻譯,不需要透過文字。

Meta負責語音對語音即時翻譯的團隊為Universal Speech Translator(UST,通用語音翻
譯工具),在做出閩南語系的語音翻譯後,陳鵬仁表示,未來的目標將希望語音翻譯更精
準、更順暢、更即時,延遲時間更縮短。

談到研發的困難,他表示「最困難的是資料的蒐集」,沒有文字書寫的語言,通常是資源
匱乏的語言,也沒有足夠的資料以供機器訓練和學習。尤其是閩南語的七聲八調,特定語
氣代表不同意義,是非常不容易的事情。

陳鵬仁表示,研發過程中,獲得許多人的幫助,例如台大的李宏毅教授及陽明交通大學的
廖元甫教授,均將研究室語音資料庫提供給Meta,而來自台灣的閩南語連續劇,也成為資
料庫重要的來源。

至於接下來還會考慮什麼樣的語系,陳鵬仁說,目前尚未定案,但是客語及原住民語言都
是考慮範圍內。目前Meta的語音對語音翻譯還屬於研發及實驗階段,商業化時間點預計在
2~5年後。

Meta創辦人兼執行長祖克柏(Mark Zuckerberg)上周與陳鵬仁在臉書上秀出一段英語與
閩南語對談的即時翻譯影片,該影片獲19萬人按讚,並有184萬人看過。

陳鵬仁表示,該影片上線後,的確收到很多詢問,像是他開民宿的伯父就問他那裡可以買
得到嗎?因為當有外國客人投宿時,此系統將可幫助彼此溝通順暢。

#語系 #語言 #研發 #教授 #資料

--
沒說小乘大乘上座部佛教馬哈希尊者《具戒經講記》拆穿佛教大乘經典的騙局
上座部佛教明昆《南傳菩薩道》真釋迦牟尼佛的菩薩成佛之道 大乘菩薩成佛之道
妙法蓮華經 華嚴經 心經 金剛經 楞伽經 梵網經菩薩戒 圓覺經 楞嚴經大乘假佛經
阿彌陀佛 藥師佛大乘假觀世音 文殊 普賢 維摩詰 龍樹 地藏王大乘假菩薩
https://www.ptt.cc/bbs/IA/M.1588944610.A.D9C.html
上座部佛教目犍連子帝須那先偽經大乘十方諸佛

--

All Comments

Sierra Rose avatarSierra Rose2022-11-01
台代表閩南語?
Hedy avatarHedy2022-11-01
以下開放客家人靠北
Rosalind avatarRosalind2022-11-01
支那閩南語=支語不用翻啦
Tristan Cohan avatarTristan Cohan2022-11-05
結果5年後Meta已經倒了
James avatarJames2022-11-01
笑死人一邊說沒文字一邊又有系統能餵ai,靠通靈?
Irma avatarIrma2022-11-05
誰說資料只能是文字….
Blanche avatarBlanche2022-11-01
這個臉是誰截圖的
Blanche avatarBlanche2022-11-05
這概念很有趣,AI跳過文字學講話,這更貼近自然
Catherine avatarCatherine2022-11-02
結果根本都是台語不是福建話阿
Delia avatarDelia2022-11-01
這是把Python當C++了
Elma avatarElma2022-11-05
若要佛法興,唯有僧讚僧,南無阿彌陀佛
Edward Lewis avatarEdward Lewis2022-11-01
北七
Queena avatarQueena2022-11-05
上面噓的那個肯定是雲DL 菜
Wallis avatarWallis2022-11-02
噓之前自己科普一下很難?
Ida avatarIda2022-11-01
噓的到底?
我搜了一下這位作者 他有做unsupervised的 意即不需
要pair data 很酷
Kumar avatarKumar2022-11-05
Hokkien 、台灣話都是自然語言形成的名詞,但中時真
的很政治正確,用一個一百年前不存在的名詞套用在這
個語言上
Harry avatarHarry2022-11-01
音訊也是sequence 為什麼不能餵AI?誰規定一定要有
文字的?
Madame avatarMadame2022-11-05
額 語音翻譯不是很久了嗎 google助理 siri alexaY
Enid avatarEnid2022-11-01
那樓上目前現有的siri可以即時翻台語嗎
Anonymous avatarAnonymous2022-11-05
懷念的小房間
Irma avatarIrma2022-11-01
推推
Sarah avatarSarah2022-11-05
以後到國外出差,就不能用台語講秘密了
Agnes avatarAgnes2022-11-01
用文字就是他說的資料量取得簡單太多
Victoria avatarVictoria2022-11-05
不用給娘家版權費嗎
Carolina Franco avatarCarolina Franco2022-11-01
干安捏
Audriana avatarAudriana2022-11-05
閩南話或福佬話才是正確用法 不過會有閩南人小動作
偷改成"台語"
Carol avatarCarol2022-11-01
看到有閩南人急著拉客家人出來引戰 就知道某族群喜
歡搞仇恨值
Frederica avatarFrederica2022-11-05
有些臺灣福佬人真的很愛吃其他族群豆腐,東京都知事
對臺灣福佬人的防疫宣導影片,都知道用臺灣閩南語這
個正確名稱,某些臺灣福佬人真該學學日本人的正確觀
Dinah avatarDinah2022-11-01
現在只會台語的人也差不多失智了,用不到
Caroline avatarCaroline2022-11-05
若要佛法興,唯有僧讚僧,南無阿彌陀佛