智象未來團隊榮獲ACM Multimedia 2025最佳演示獎，多模態生成式AI技術領跑全球

每日快訊

2025

11/06

14:18

評論

近日，第33屆ACM國際多媒體會議（ACM MM 2025）在愛爾蘭都柏林舉行，智象未來團隊成功摘得最佳演示獎，成為中國首個獲此殊榮的多模態生成式人工智能初創企業團隊，彰顯了智象未來在多模態生成式AI領域的頂尖科研實力和卓越創新能力。

圖片1.png

ACM國際多媒體會議由國際計算機學會（ACM）主辦，致力于推動多媒體全領域的研究創新與產業應用落地，是全球多媒體領域最具權威性與影響力的學術盛會之一。每年會議評選的最佳演示獎，具有極高含金量和行業認可度，代表著評審委員會和與會學者對該技術創新性、實用性、成熟度和現場展示效果的最高肯定。

智象未來獲獎的“靈感智能體”（Chat Generation）統一多模態智能體，以革命性技術將復雜的視覺內容創作，轉化為直觀的對話體驗。其核心優勢在于突破碎片化多模態技術工具的局限，在單一界面內無縫整合了文本生成圖像、指令式圖像編輯及文本/圖像生成視頻功能，有效解決了跨模態語義對齊的行業難題。該技術基于170億參數量的HiDream-I1模型，依托稀疏擴散Transformer（DiT）結構與動態混合專家（MoE）設計，在HPS、GenEval等國際權威基準測試中表現優異。而針對指令式圖像編輯任務，團隊通過上下文視覺條件優化HiDream-I1模型，使其能夠實現精準的圖像修改效果。

圖片2.png

該智能體開創了可及性、交互式視覺敘事和多模態生成AI中協作內容創作的新方式，通過將生成和編輯融合于一個對話驅動的體驗中，降低了高質量視覺內容創作的門檻，并顯著縮短了迭代周期，實現從想法到優質產出的 “一次會話” 創意循環。目前，這一技術原型已成功迭代應用于智象未來旗艦產品vivago.ai的對話生成功能中，為用戶提供更自然、個性化的多模態對話交互體驗。

圖片5.png

此外，在本次ACM國際多媒體會議上，智象未來舉辦了Identity-Preserving Video Generation（IPVG）挑戰賽。賽事吸引了北大、上海交大、騰訊等國內外頂尖科研及企業團隊參加，參賽者需要在生成視頻的過程中保持給定身份的一致性，完成人臉或全身身份保持的任務。智象未來擔任本次賽事主辦，是國際頂會對其多模態視覺生成能力處于世界前沿的權威認證，彰顯了其研發團隊在行業內的強大號召力。

圖片3.png

圖片4.png

智象未來研發團隊持續致力于將前沿學術成果落地，以核心技術驅動產品體系迭代升級，并在激烈市場競爭中贏得業內認可。自創立以來，智象未來對行業變革和市場發展保持敏銳嗅覺，無論是對基礎模型的研發創新，還是對產業化發展的深度理解，均處于行業領先地位。此次獲得ACM國際多媒體會議最佳演示獎，更是智象未來在技術、產品兩側均具備硬實力的權威體現，印證了團隊科研成果的前瞻性和突破性。

智象未來成立于2023年3月，由加拿大工程院外籍院士梅濤創立。在堅持自主研發的同時，智象未來持續推進高質量模型的開源開放，并打造出首個登頂國際權威榜單的中國自研生成式AI模型。作為多模態生成式人工智能初創企業，智象未來正以自主創新為核心驅動力，持續推動中國生成式AI技術邁向更高水平，并以開放、務實的姿態積極融入全球人工智能創新生態，展現中國AI技術實力與創新擔當。

THE END

廣告、內容合作請點擊這里尋求合作

免責聲明：本文系轉載，版權歸原作者所有；旨在傳遞信息，不代表砍柴網的觀點和立場。

智象未來團隊榮獲ACM Multimedia 2025最佳演示獎，多模態生成式AI技術領跑全球

相關熱點

最新文章

相關推薦

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！

蘋果計劃在美國生產 Apple Car 汽車電池

關注我們