助力大灣區深度融合

澳大研發普粵機器翻譯系統
07/01/2020
20747
收藏
分享
澳大研發普粵機器翻譯系統
澳大研發普粵機器翻譯系統
澳大研發普粵機器翻譯系統

澳門大學自然語言處理與中葡機器翻譯實驗室(NLP2CT)是該領域的佼佼者。(澳門大學提供圖片)

澳大研發的「粵語普通話翻譯系統」已經上線,圖為系統操作介面。(澳門大學提供圖片)

澳門大學機器翻譯研究團隊期望透過機器翻譯領域的突破,為粵港澳葡四地交流掃除障礙。(資料圖片)

中央政府將澳門的角色定位為「一中心、一平台、一基地」,身負中國與葡語國家聯繫、中華文化與多元文化交流合作的重任,加上澳門作為粵港澳大灣區發展的核心樞紐,「交流融合」的工作是重中之重。

為了將語言上的阻礙降至最低,澳門大學機器翻譯研究團隊在粵語及普通話翻譯上實現技術創新,推出澳大「粵語普通話翻譯系統」,期望對促進粵港澳大灣區區內經濟、文化、旅遊各領域深度融合發展發揮作用。

由澳大自然語言處理與中葡機器翻譯實驗室(NLP2CT)研發推出的「粵語普通話翻譯系統」,是因應「一帶一路」、粵港澳大灣區建設等國家戰略的需要,以及澳門經濟文化的獨特優勢,以「跨語言共性與多樣性聯合建模的無監督深度學習方法」為題進行研究,相關研究獲國際頂級的人工智能會議AAAI 2020錄用。目前,「粵語普通話翻譯系統」已在實驗室上線,同時NLP2CT也正在進一步開發粵語與葡語之間的口語翻譯和同傳系統,為澳門三文四語優勢創造更有利的創新融合條件,該系統是繼「在線中葡英輔助翻譯平台」(UM-CAT)利用全球領先技術提升中、葡、英雙語或三語互譯效率後的創新突破。

無監督機器學習方法 提升翻譯品質

研究團隊指出,「粵普翻譯」屬方言翻譯的一種,兩者雖存在一定程度的相似性,但兩者語法有別,同時粵普之間的平行語料異常缺乏,難以使用現有的機器翻譯方法來構建理想的翻譯模型。因此,澳大提出嶄新的神經機器翻譯模型,運用「Pivot-Private詞嵌入矩陣」,同時把模型編碼端與解碼端深度相同的語義表示對齊,利用兩者的共性和異性,藉此抽取粵語和普通話在詞法、句法及語義級別的對齊信息。在僅依賴單語數據的情況下,利用無監督機器學習方法實現技術突破。此方法大大提升了翻譯品質,機器自動評價和人為評價結果均證實了此方法的有效性和準確性。

該實驗室的跨學科團隊曾憑「葡中機器翻譯系統技術與應用」項目獲特區政府頒發澳門科學技術獎科技進步獎二等獎。研究人員更開發出多套基於神經網絡的英中機器翻譯系統,於第13屆全國機器翻譯研討會主辦的「英中機器翻譯評測」大賽中奪得多個獎項。

該實驗室表示,未來將繼續緊隨時代發展趨勢,在機器翻譯領域尋求突破,進一步掃除粵港澳葡四地間的語言障礙,滿足澳門與大灣區及葡語國家間不斷增長的文化交流需求。

檢舉
檢舉類型:
具體描述:
提交
取消
評論
發佈

力報會員可享用評論功能

註冊 / 登錄

查看更多評論
收藏
分享

相關新聞

推薦新聞

找不到相關內容

七日預報