阿里雲智能昨(1)日發布聚焦音視頻內容的人工智能(AI)新產品「通義聽悟」,即日起進行公測。 阿里雲智能CTO周靖人表示,通義聽悟是依托通義千問大模型及音視頻模型的AI助手產品,可進行實時語音識別、對話實時記錄、多語言翻譯、發言總結、提取PPT、內容規整等。
阿里雲表示,作為國內首個開放公測的大模型應用產品,「通義聽悟」接入了「通義千問」大模型的理解與摘要能力,可成為用戶工作學習中的AI助手,幫助隨時隨地高效完成對音視頻內容的轉寫、檢索、摘要和整理。公測期間,用戶可領取100小時以上「聽悟」免費轉寫時長。
另外,「聽悟」已與阿里雲盤打通,一鍵就能轉寫雲盤上的音視頻內容,公測期間註冊的「聽悟」用戶後續還將獲得更大的阿里雲盤存儲空間,在雲盤內線上播放視頻時也可自動出字幕。
阿里雲智能首席商業官蔡英華表示,阿里雲以雲計算為基石,以AI為引擎,參與到粵港澳大灣區的數字化建設進程中,助力大灣區打造國際科技創新中心。目前,阿里雲已服務粵港澳近75萬付費客戶,助力中小企業在雲上數字化轉型和融通發展。
阿里雲昨日正式發表音視頻AI「通義聽悟」。(網絡圖片)