10 月 6 日至 17 日,國際電信聯盟第二十一研究組(簡稱 ITU-T SG21)在瑞士日內瓦召開全體會議,兩項數字人國際標準 ITU-T F.748.63「Framework and general technical requirements of foundation model enhanced digital human system」(基礎模型增強的數字人系統框架及通用技術要求)、ITU-T F.748.64「Requirements of digital human service platform」(數字人服務平臺要求)順利通過結項,計劃于 2026 年正式發布。

值得關注的是,科大訊飛與中國信通院共同擔任這兩項標準的編輯人。這意味著科大訊飛在數字人標準的技術框架、核心定義及規范要求制定中發揮了重要作用,既是對其數字人技術實踐能力的認可,也體現了中國科技企業在全球人工智能與數字人領域日益提升的參與度和影響力。
1 硬核 AI 實力,為數字人注入「智慧靈魂」
此次科大訊飛能夠主導國際標準的制定,離不開它在人工智能領域長期的技術積累和廣泛的產品應用。
技術積累:全棧式 AI 能力
國際標準的制定,往往源于產業實踐的廣泛凝練與共識。ITU 標準中涉及的交互處理、多模態輸入、多模態輸出等維度與訊飛 AI 虛擬人交互平臺長期聚焦的技術路徑高度契合。科大訊飛自主研發的星火大模型為數字人提供了更深層次的認知理解能力;在語音合成與識別、自然語言處理等核心領域的多年深耕,則為實現自然流暢的人機交互奠定了堅實基礎。這些技術能力,為其參與國際標準討論與制定提供了重要的技術積累。
實踐驗證:平臺能力獲得行業認可
技術價值需要通過市場來檢驗。此前,科大訊飛的 AI 虛擬人交互平臺通過了中國信通院人工智能研究所組織的大模型數字人基礎能力分級測試,并獲得最高等級 L5 認證,也進一步證明了訊飛 AI 虛擬人交互平臺技術方案的先進性與成熟度。

2 多場景落地應用,秀出真本領
將深厚的技術積累轉化為成熟、可用的產品能力,是科大訊飛主導數字人國際標準制定工作的重要基礎。訊飛 AI 虛擬人交互平臺與移動數字人等產品,構建了覆蓋云端與終端、軟硬一體的全方位數字人解決方案體系。
在產品能力上,訊飛 AI 虛擬人交互平臺提供虛擬 IP 資產(虛擬偶像、虛擬主播、虛擬角色和虛擬品牌代言人)的構建、AIGC內容生產(視頻配音、新聞視頻、培訓視頻和廣告視頻等)、多模態交互等軟硬件技術和產品。同時,平臺提供低代碼搭建、多模板選擇及多語義配置,并支持多語種及方言交互,以滿足多樣化交互需求。

移動數字人則以移動行走的透明屏為載體,支持 360°聲源定位、避障移動導覽,融合多模態超擬人自由交互解決方案,采用多人交互、手勢識別、視頻理解的多人交互技術展示,可在指定區域內實現自主移動與智能講解,為參觀者帶來沉浸式的互動體驗。



在應用場景上,這些數字人解決方案已在媒體、教育、企業營銷、文旅、金融、政務等多個行業成功應用。跨行業、多形態的成功落地經驗,不僅驗證了訊飛 AI 虛擬人交互平臺技術方案的普適性與創新性,也為數字人產業的場景拓展與技術落地提供了可參考的實踐案例。
深厚的 AI 技術積累與經過市場驗證的產品實踐,為科大訊飛主導數字人國際標準的制定工作奠定了堅實基礎。此次科大訊飛能夠擔任數字人 ITU 國際標準的編輯,既是對其技術實力與產業貢獻的國際級認可,也為其在未來更深入地參與全球協作、貢獻中國方案搭建了更高層次的平臺。
未來,訊飛 AI 虛擬人交互平臺將繼續深耕數字人技術,通過「AI + 行業」專精模型建設,進一步提升數字人的認知能力與場景適配能力。
