國際口語翻譯先進(jìn)研究聯(lián)盟(U-Star)日前在倫敦發(fā)布23國語言翻譯實(shí)驗(yàn)系統(tǒng),以多國語言翻譯服務(wù)迎接奧運(yùn)。作為該聯(lián)盟的發(fā)起單位之一,中科院自動化所承擔(dān)了其中中英互譯項(xiàng)目。
此次發(fā)布會由日本情報(bào)通信研究機(jī)構(gòu)(NICT)主辦,來自26個(gè)研究機(jī)構(gòu)的代表出席發(fā)布會,會上進(jìn)行了多人同時(shí)運(yùn)用不同語言的在線翻譯展示。
U-Star此次發(fā)布的系統(tǒng)名叫“Voice Tra4U-M”,涵蓋了世界應(yīng)用較為廣泛的23個(gè)語種,并能同時(shí)支持5人以移動終端在不同地點(diǎn)用不同語種進(jìn)行實(shí)時(shí)對話�;谠撓到y(tǒng),會話用戶在手機(jī)上以各自語種通話,系統(tǒng)會將各方的語音信息通過網(wǎng)絡(luò)傳送到后臺云計(jì)算中心,計(jì)算中心首先對口語語音進(jìn)行識別,并將語音信息轉(zhuǎn)換為文本信息,隨后將文本信息翻譯為會話各方所需語種的文本信息,最后通過文本轉(zhuǎn)語音模塊,將翻譯后的目標(biāo)語音發(fā)送到相應(yīng)會話用戶的手機(jī)上,從而實(shí)現(xiàn)跨語種對話。
實(shí)現(xiàn)無障礙的跨語言溝通一直是機(jī)器翻譯追求的目標(biāo)。從1945年信息論先驅(qū)Warren Weaver提出機(jī)器翻譯的可計(jì)算性,計(jì)算機(jī)自動翻譯之路已走了60多年。而由于語音識別因口音問題帶來的大量模糊,以及周圍環(huán)境中的噪音影響,正確可靠的口語翻譯并不是一件容易的事,科學(xué)界一度將此技術(shù)突破的難度比作“人類登陸火星”。
近年來,互聯(lián)網(wǎng)海量數(shù)據(jù)的爆炸性增長、大規(guī)模云計(jì)算技術(shù)應(yīng)用為口語翻譯技術(shù)的突破提供了有力的技術(shù)支撐,而基于3G移動通信技術(shù)的智能終端普及為該項(xiàng)技術(shù)從實(shí)驗(yàn)室走向應(yīng)用提供了理想的平臺,降低了此技術(shù)的應(yīng)用門檻,使其快速發(fā)展起來。
“我們要讓普通民眾都可以應(yīng)用此項(xiàng)技術(shù),僅僅通過手機(jī)終端就可進(jìn)行無語言障礙的流暢對話。”NICT發(fā)言人堀智織教授介紹。但目前,翻譯速度受到網(wǎng)絡(luò)環(huán)境的影響,在網(wǎng)絡(luò)條件良好的條件下,整個(gè)翻譯交互過程在數(shù)秒鐘之內(nèi)即能完成,為用戶帶來了便捷和高效的使用體驗(yàn)。
該項(xiàng)目中,中科院自動化所承擔(dān)了其中中英互譯項(xiàng)目,其中包括漢語普通話識別、中文-英文雙向翻譯以及漢語普通話合成等四大任務(wù)。據(jù)中科院自動化所副所長徐波介紹:“我所研究成果的最大突破,便是無專業(yè)領(lǐng)域的限定。例如以往總是考慮在旅游中會用到的詞匯,而在真實(shí)情況下很難判斷語句實(shí)際應(yīng)用的可能性,使得系統(tǒng)的可靠性很難保證。云計(jì)算技術(shù)和3G技術(shù)的推進(jìn),讓我們能獲取海量數(shù)據(jù)信息,運(yùn)用有效的算法進(jìn)行翻譯轉(zhuǎn)換,因此該系統(tǒng)并沒有限定翻譯領(lǐng)域。”
目前,該所自主研發(fā)的基于Android和iPhone手機(jī)的中文-英文雙向口語翻譯系統(tǒng)“紫冬口譯Beta版”(又名“由你說”)已開發(fā)完成,并將于倫敦奧運(yùn)會前在Android和iphone平臺上免費(fèi)提供下載。該系統(tǒng)加入了奧運(yùn)場館、競賽項(xiàng)目等奧運(yùn)相關(guān)詞匯。在奧運(yùn)期間,用戶可以在3G或者無線局域網(wǎng)環(huán)境中通過該軟件獲得在線中英口語翻譯服務(wù)。









