
[CNMO科技音信]5月26日,小米汽车厚爱发布XiaomiAutoWorldModel全新框架,为业界扶持驾驶全国模子提供了新的框架旅途,鼓励行业从“场景感知”向“默契推演、场景进化”的高阶花式跃迁。

小米汽车
该框架是小米初次将三维重建与视频生成深度耦合的一体化架构,以“重建锚定几何、生成填补念念象”的新范式,冲破行业长久罗致的重建与生因素离的时刻阶梯。在Waymo、nuScenes等主流基准测试中全面获取SOTA,并已在小米汽车合成数据、仿真测试、智能座舱三大中枢场景完成业务落地。

CNMO科技能干到,该框架将重建模块(WorldRec)与生成模块(WorldGen)深度耦合。WorldRec通过寥落三维锚点表征,高效构建精准的3D场景几何;WorldGen则在重建不休下补全未不雅测区域和改日帧,复古最长1分钟的视频生成。两者相互增益,尊龙凯时中国官网入口杀青了高清醒性、高一致性、高真确性的协同适度。
在重建限制,WorldRec在公开的Waymo数据集上全面开头此前SOTA才调DGGT,PSNR达到28.48,超出约1个点;在nuScenes零样本泛化测试中照旧保抓开头,亚博·体育世界杯(中国)官方网站对新场景稳妥才调强。在生成限制,WorldGen在H20GPU上单视角生成速率达0.19秒/帧,三视角为0.46秒/帧,比同为自总结才调的Epona(1.06秒/帧)快5.6倍。复古高达81帧邻接生成(10Hz/30Hz,最长1分钟),而大广大公开基线仅能生成8-16帧。在nuScenes数据集上,WorldGen获取FVD64.97和FID7.04的得益,FVD贪图卓越了统统对比的同类模子。


值得一提的是,XiaomiAutoWorldModel已在小米汽车三大实质场景中落地:
合成数据生成:已请托高出10万clips高质地合成数据,平直用于感知模子锤真金不怕火,进步车辆在危急场景下的识别才调。
球赛投注中国app官方版下载仿真测试:构建闭环仿真环境,优化测试服从,可在仿真中复现真确事故进行定向优化。
扶持驾驶学堂:运用全国模子动态生成第一东说念主称驾驶教悔视频亚博·体育世界杯(中国)官方网站,当今已上线小米全车型的扶持驾驶学堂-实景模拟场景。