騰訊混元團隊今日正式推出HunyuanWorld-Voyager(混元Voyager)模型,標志著AI在3D空間智能領域取得重大突破。這款業(yè)界首創(chuàng)的原生3D重建超長漫游世界模型,在斯坦福大學李飛飛團隊制定的WorldScore基準測試中表現(xiàn)卓越,綜合能力位居榜首。
該模型在視頻生成與3D重建兩大核心任務上展現(xiàn)出顯著優(yōu)勢。其創(chuàng)新性地采用空間與特征融合技術,實現(xiàn)了原生3D記憶和場景重建功能,有效規(guī)避了傳統(tǒng)后處理方式帶來的精度損失和延遲問題。通過輸入端3D條件精準控制畫面視角,輸出端直接生成3D點云,為虛擬現(xiàn)實、游戲開發(fā)等應用場景提供了更高效的解決方案。
混元Voyager突破了傳統(tǒng)視頻生成技術的局限,能夠創(chuàng)建具有空間一致性的長距離漫游場景,并支持將視頻內(nèi)容直接轉(zhuǎn)換為3D格式。該模型與已開源的混元世界模型1.0完美兼容,不僅能擴展原有模型的漫游范圍,還能提升復雜場景的生成質(zhì)量,同時支持場景風格化編輯功能。
在應用層面,該模型展現(xiàn)出強大的多任務處理能力,包括視頻場景重建、3D物體紋理生成、視頻風格定制化處理以及深度估計等3D理解與生成功能。其獨特的深度信息處理技術為各類3D應用提供了更豐富的可能性。