首頁 > 財經 >

分別是多語種語音識別受限任務的第一名和多語種語音識別開放任務的第一名

發布時間:2022-01-29 14:18   來源:TechWeb   閱讀量:19023   

日前,由廈門大學,清華大學,海天瑞聲,西北工業大學及昆山杜克大學聯合主辦,中國計算機學會語音對話與聽覺專委會,中文信息學會協辦的第六屆OLR2021東方語種識別國際競賽研討會在線上成功召開網易互娛AI Lab在本次競賽中以絕對領先的優勢奪取了多語種語音識別賽道雙料冠軍,分別是多語種語音識別受限任務的第一名和多語種語音識別開放任務的第一名

分別是多語種語音識別受限任務的第一名和多語種語音識別開放任務的第一名

東方語種識別競賽主要專注于東亞以及東南亞地區的語言研究此次比賽多語種語音識別任務突破了歷屆比賽僅識別語種的任務限制,在不給定測試語音語種標簽的情況下,參賽隊伍模型需要識別出多語種混合測試集的語音內容今年已經是OLR比賽的第六屆,本屆比賽吸引來自中國,加拿大,印度 等國家的高校和企業參加

圖1. OLR歷屆冠軍隊伍及2021參賽隊伍信息

本次比賽多語種語音識別賽道的任務是構建包含13種語言的混合語音識別系統而其中受限任務賽道每種語言僅提供約10小時帶標簽訓練數據,訓練數據資源的稀缺使得設計相應模型具有較大的挑戰針對比賽中的難點,網易互娛AI Lab采用基于Hybrid和E2E的結構,針對普通話,粵語,上海話,日語和印尼語,使用Hybrid結構并訓練相應單語種語音識別模型,該方法在低資源數據場景下,可以獲得比E2E模型更好的結果,針對其他語言,由于缺少發音詞典和文本數據,則使用多種語言混合訓練E2E結構比賽通過語種識別模型將多語種模型和單語種模型進行耦合,進一步提升性能

比賽使用CER作為評價指標,CER越小表示系統識別率越高在受限任務賽道上,網易互娛AI Lab取得13.1%的平均CER,字符錯誤率比官方基線系統相對降低66%,比第二名相對降低28%值得一提的是,網易互娛AI Lab的多語種單模型亦超過第二名的融合系統在實際工業級語音識別應用中,使用單系統部署可以降低服務成本,也便于快速更新維護

圖2.多語種語音識別受限賽道排名情況

在開放任務賽道上,網易互娛AI Lab基于受限賽道系統,融合了中文普通話,日語,印尼語等三個利用外部數據的模型,取得12.6%的CER,字符錯誤率比第二名相對降低30%。

圖3.多語種語音識別開放賽道排名情況

目前,網易互娛多語種語音識別的應用價值主要在海外業務應用場景對于海外語音識別,僅根據用戶手機語言設置,IP所在地區進行相應語言,語種的判斷,無法做到非常高的準確率通過使用多語種語音識別系統,在一定程度上可以解決/緩解語種不匹配導致的語音轉文字語種混亂問題針對東南亞地區,網易互娛AI Lab目前已支持集印尼,馬來,英語三種語言于一體的多語言混合語音識別系統,該系統可以同時支持3種語言的語音識別

網易互娛AI Lab成立于2017年,隸屬于網易互動娛樂事業群,在廣州,杭州,上海均有分部,是游戲行業領先的人工智能實驗室實驗室致力于計算機視覺,語音和自然語言處理,以及強化學習等技術在游戲場景下的研究,應用和落地,旨在通過AI技術助力互娛旗下熱門游戲及產品的技術升級,目前技術已應用于網易互娛旗下多款熱門游戲,如《夢幻西游》《哈利波特:魔法覺醒》《陰陽師》《天下3》等等

隨著互聯網和信息技術的發展,新聞行業正在發生顛覆性的變化,新聞生產在新聞傳播的時效性和表現形式的差異化方面面臨著更高的要求和挑戰。AI主播的出現,不僅會給傳統紙質媒體的讀者帶來全新的視聽體驗,也將以更高效,更智能的內容自動化制作方式,取代過去主要依賴人工的新聞制作流程,有助于傳統媒體的融合轉型,推動新聞制作的智能化轉型。

(責編:張璠)

鄭重聲明:此文內容為本網站轉載企業宣傳資訊,目的在于傳播更多信息,與本站立場無關。僅供讀者參考,并請自行核實相關內容。

版權聲明:凡注明“來源:“生活消費網”的所有作品,版權歸生活消費網 | 專注于國內外今日生活資訊網站所有。任何媒體轉載、摘編、引用,須注明來源生活消費網 | 專注于國內外今日生活資訊網站和署著作者名,否則將追究相關法律責任。

欧美人与性动交α欧美精品|国产自产一线在线视频|晚上你懂在线一区二区|久久狠狠中文字幕2020|亚洲中文字幕在线第二页