您的位置:汽车专家网 > 动态

仅需千分之一数据量!国产视频模型即可实现物理操作

时间:2025年07月26日 20:06 来源:新华网-北京 编辑:苏小糖   阅读量:6926   
导读:我国科技企业生数科技携手清华大学25日发布具身基座模型Vidar。这一模型能够用更少的数据,使虚拟世界中的“视频指令”变成真实世界的“执行操作”,真正实现机器人的“指哪打哪”。 “仅用20分钟的机器人真机数据,即可快速泛化到机器人,所需数...

我国科技企业生数科技携手清华大学25日发布具身基座模型Vidar。这一模型能够用更少的数据,使虚拟世界中的“视频指令”变成真实世界的“执行操作”,真正实现机器人的“指哪打哪”。

“仅用20分钟的机器人真机数据,即可快速泛化到机器人,所需数据量约为行业均值的千分之一,显著降低了机器人对数据的需求门槛。”生数科技创始人兼首席科学家朱军介绍,模型创新性地构建了支持机器人双臂协同任务的多视角视频预测框架,在保持高性能的同时,展现出显著的少样本学习优势。

Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身基座模型。“行业主流的视觉-语言-动作模型高度依赖大量优质数据,并且这些数据往往只适配特定的机器人本体及其采集的特定任务集,然而数据收集费时费力且成本高昂。”朱军说。

而Vidar的核心突破在于其通过解构具身任务的执行范式,充分利用“大量通用视频-中等规模具身视频数据-少量机器人训练特定数据”构成的三级“数据金字塔”,以实现“更少数据、更高效能”。

为使模型更加“见多识广”“见机行事”——实现多类型机器人操作的密切配合、灵活适应更多样的物理环境,研发团队还创新性地研发出一种全新的具身预训练方法,进一步增强对物理世界控制的精准度。

为突破现有具身智能数据被任务“过度捆绑”、规模难以做大的瓶颈,团队创新构建了高精度预测逆动力学模型,实现了低成本、高效率、高精度的机器人动作预测。

“我们希望以多模态大模型推动数字世界与物理世界的深度融合与协同进化。”朱军说,一方面,我们通过打造新一代数字内容创作引擎,使AI成为人类创意的延伸;另一方面,我们通过高效训练具身视频基座模型,实现虚拟与现实的深度互动。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

相关
  • 福维克全新一代美善品174;TM7多功能智能料理机亮相2025CBME国
    7月16日至18日,全球瞩目的2025CBME国际孕婴童展于上海国家会展中心(NECC)隆重召开。百年德企福维克携旗下重磅新品——美善品#174;TM7多功能智能料理机亮相展会,并于7月17日盛大举行“德系精工,烹饪非凡”新品上市发布会,正...
    2025-07-26 18:12:32
  • 胜不宜迟士在必得捷豹路虎重磅推出豪车税全额补贴政策
    根据财政部、国家税务总局2025年第3号公告,自7月20日起,超豪华小汽车消费税起征点下调至90万元。为积极响应这一政策调整,并持续为中国消费者提供卓越的产品与服务体验,捷豹路虎中国宣布:自2025年7月20日新政开始执行起至7月31日期间...
    2025-07-26 14:41:58
  • 预计售价20-25万元iCarV27将于8月1日发布
    近日,车质网从相关渠道获悉,iCarV27将于8月1日在迪拜正式完成全球首秀。届时,iCar还将同步官宣其海外品牌名“iCAUR”。除了V27之外,iCarV23和iCar03也将一同亮相中东市场,展示品牌在新能源越野领域的产品布局。 据...
    2025-07-26 13:11:59
  • 蛰伏半年,埃安渴望脱胎换骨
    随着集团的深度整合进入新阶段,今年上半年对于广汽集团旗下的每个板块来说,都堪称新领导班子主理下的又一历史性时刻。 广汽丰田、广汽本田纷纷再续“中国化”,铂智3X和P7的上市,无论结果如何都带着很强的本土化印迹,造适合中国用户的电动车成了两...
    2025-07-26 11:46:24
  • 英国今年上半年乘用车和商用车产量同比下降11.9%
    盖世汽车讯7月23日,英国汽车制造商和贸易商协会公布的数据显示,今年上半年,英国新乘用车和商用车产量同比下降11.9%至417,232辆;其中,乘用车产量同比下降7.3%至385,810辆;因生产工厂重组,商用车产量同比大幅下滑45.4%,...
    2025-07-26 09:09:59

业内

头条