近日,第33屆ACM國際多媒體會議(ACM MM 2025)在愛爾蘭都柏林舉行,智象未來團隊成功摘得最佳演示獎,成為中國首個獲此殊榮的多模態生成式人工智能初創企業團隊,彰顯了智象未來在多模態生成式AI領域的頂尖科研實力和卓越創新能力。

ACM國際多媒體會議由國際計算機學會(ACM)主辦,致力于推動多媒體全領域的研究創新與產業應用落地,是全球多媒體領域最具權威性與影響力的學術盛會之一。每年會議評選的最佳演示獎,具有極高含金量和行業認可度,代表著評審委員會和與會學者對該技術創新性、實用性、成熟度和現場展示效果的最高肯定。
智象未來獲獎的“靈感智能體”(Chat Generation)統一多模態智能體,以革命性技術將復雜的視覺內容創作,轉化為直觀的對話體驗。其核心優勢在于突破碎片化多模態技術工具的局限,在單一界面內無縫整合了文本生成圖像、指令式圖像編輯及文本/圖像生成視頻功能,有效解決了跨模態語義對齊的行業難題。該技術基于170億參數量的HiDream-I1模型,依托稀疏擴散Transformer(DiT)結構與動態混合專家(MoE)設計,在HPS、GenEval等國際權威基準測試中表現優異。而針對指令式圖像編輯任務,團隊通過上下文視覺條件優化HiDream-I1模型,使其能夠實現精準的圖像修改效果。

該智能體開創了可及性、交互式視覺敘事和多模態生成AI中協作內容創作的新方式,通過將生成和編輯融合于一個對話驅動的體驗中,降低了高質量視覺內容創作的門檻,并顯著縮短了迭代周期,實現從想法到優質產出的 “一次會話” 創意循環。目前,這一技術原型已成功迭代應用于智象未來旗艦產品vivago.ai的對話生成功能中,為用戶提供更自然、個性化的多模態對話交互體驗。

此外,在本次ACM國際多媒體會議上,智象未來舉辦了Identity-Preserving Video Generation(IPVG)挑戰賽。賽事吸引了北大、上海交大、騰訊等國內外頂尖科研及企業團隊參加,參賽者需要在生成視頻的過程中保持給定身份的一致性,完成人臉或全身身份保持的任務。智象未來擔任本次賽事主辦,是國際頂會對其多模態視覺生成能力處于世界前沿的權威認證,彰顯了其研發團隊在行業內的強大號召力。


智象未來研發團隊持續致力于將前沿學術成果落地,以核心技術驅動產品體系迭代升級,并在激烈市場競爭中贏得業內認可。自創立以來,智象未來對行業變革和市場發展保持敏銳嗅覺,無論是對基礎模型的研發創新,還是對產業化發展的深度理解,均處于行業領先地位。此次獲得ACM國際多媒體會議最佳演示獎,更是智象未來在技術、產品兩側均具備硬實力的權威體現,印證了團隊科研成果的前瞻性和突破性。
智象未來成立于2023年3月,由加拿大工程院外籍院士梅濤創立。在堅持自主研發的同時,智象未來持續推進高質量模型的開源開放,并打造出首個登頂國際權威榜單的中國自研生成式AI模型。作為多模態生成式人工智能初創企業,智象未來正以自主創新為核心驅動力,持續推動中國生成式AI技術邁向更高水平,并以開放、務實的姿態積極融入全球人工智能創新生態,展現中國AI技術實力與創新擔當。
