视觉语言动作模型如何重塑自动驾驶竞争格局

数智人2025-02-21产业资讯6
本报记者龚梦泽纵观自动驾驶技术的发展历程,人工智能的不断突破显著提升了自动驾驶的感知性能。2025年以来,一种全新的技术范式,即视觉语言动作模型(VLA,Vision-Language-Action)正在加速崛起。新技术崛起VLA模型最早见于机器人行业,其通过输入给定的文本和视觉数据,输出机器人可执行的动作,天然带有AI与物理世界交互的基因。2023年7月28日,谷歌DeepMind推出了全球首个控制机器人的VLA模型。如今这一模型概念正快速扩散到智驾领域。不少智驾人士将VLA模型视为当下端到端方案的2.0版本。中国自动驾驶产业创新联盟调研员高超对《证券日报》记者表示,VLA模型的核心突破在于其“思维链”的推理能力。VLA模型可以从传感器数据中提取丰富的环境信息,借助语言模型理解人类指令并生成可解释的决策过程,最后转化为驾驶操作指令,期间可向用户展现系统推理过程,解释为什么这么开,让用户更信任智驾,进而推动智能驾驶从“功能时代”迈向“体验时代”。“VLA模型极有可能在未来两年内改写智能驾驶市场的竞争格局。”在高超看来,VLA模型将端到端与多模态大模型更彻底地融合,能够根据感知直接生成车辆的运动规划和决策,更接近“图像输入、控制输出”的端到端智驾理想状态。预计2025年VLA模型的量产落地,将推动城区NOA渗透率提升。现阶段,智驾市场竞争焦点已从单纯的功能实现转向了更深层次的技术范式竞争,强调技术架构的先进性和可持续性。高盛最新自动驾驶报告显示,到2030年,VLA模型主导的端到端方案可能占据L4级市场60%份额,这意味着传统一级供应商的价值链地位面临重构。电车巨头特斯拉或将成为这场变革的潜在受益者。据悉,特斯拉的Dojo超算中心已形成20000多片自研的芯片集群,专门针对视觉数据的时空连续性进行优化。国内企业也在发力布局。北京理想汽车有限公司(以下简称“理想汽车”)曾在2024年三季度财报电话会议上表示,内部已经启动了L4级别自动驾驶的预研,在当前的技术路线基础上,研发能力更强的车端VLA模型与云端世界模型相结合的强化学习体系。作为“车位到车位”的提出者,华为技术有限公司(以下简称“华为”)通过智驾3.0融合GOD(通用障碍物检测)网络与VLA模型,在无高精地图区域实现厘米级定位;百度集团股份有限公司Apollo则依托文心大模型,将VLA模型的交通场景理解准确度大幅提升。据新战略低速无人驾驶产业研究所统计,2024年,国内自动驾驶领域公开185起重要投融资事件,较2023年增加30%,端到端技术公司表现活跃;披露的融资总金额超370亿元(含收并购、IPO募资),较2023年增加76%。市场竞争激烈在进入规模推广之前,下一代端到端方案还面临很多现实挑战。现阶段车端芯片硬件不足以支撑多模态大模型的部署落地。有行业人士向记者透露,将端到端技术与视觉语言模型二合一后,车端模型参数变得更大,既要有高效实时推理能力,同时还要有认识复杂世界并给出建议的能力,这对车端芯片硬件有相当高的要求。“目前,高阶智驾的算力硬件基本为2颗英伟达Orin-X芯片,算力在508Tops左右,以现有的车端算力很难支撑VLA模型的部署。”上述人士表示,如何将端到端技术与多模态大模型的数据与信息进行深度交融,也考验着头部智驾团队的模型框架定义能力、模型快速迭代能力。与此同时,商业化之路并非坦途。据《证券日报》记者统计,2024年成功上市的7家智能驾驶领域相关企业中,6家企业处于亏损状态,研发费用远高于营业收入。另据麦肯锡调研报告显示,虽然中国消费者对智能驾驶的接受程度在上升,但对智能驾驶的支付意愿却出现了下滑。受访者中,愿意对智能驾驶进行支付的用户占比,从2022年的42%下降到了2024年的28%。供应链的暗战同样激烈。据悉,英伟达Orin芯片虽占据75%的市场份额,但北京地平线机器人技术研发有限公司征程6的BPU架构专门针对VLA模型进行优化,能效比提升3倍。这场芯片架构之争背后,是每年价值数百亿美元的车载计算市场主导权的争夺。“VLA模型引发的技术变革正在重塑自动驾驶产业格局,这场变革的终局或许不是某条技术路线的完胜,而是催生出分层市场。”中国乘用车产业联盟秘书长张秀阳告诉记者,在Robotaxi(无人驾驶出租车)领域,混合运营架构(有人+无人)可能长期共存;而在量产车市场,未来VLA模型有望成为高阶智驾的标配。这不是单纯的技术竞赛,而是整个汽车和智驾行业认知范式和技术范式的迁移。“当软件定义汽车进入2.0时代,真正的较量才刚刚开始。” 原文链接://shuzhiren.com/post/166900.html

相关文章

我国公民具备科学素质比例超10% 意味着什么

中国科学技术协会日前举办新闻发布会,公布了第十一次中国公民科学素质抽样调查结果。调查显示,2020年我国公民具备科学素质的比例达10.56%,比2015年的6.20%提高了4.36个百分点,圆满完成了...

回归消费产业投资母题 头部直播机构躬身入局

5月18日,德尔玛以发行价14.81元/股在创业板成功上市。这家以生活小家电为主营业务的企业在过去三年推出了多款创新设计产品的同时,找准了新电商发展红利期的经营策略。借直播助力进入快车道发展的消费企业...

肉价连降9周 预计元旦春节肉价低于上年同期

近一段时间以来,一些地方猪肉价格下降,引起消费者关注。目前全国猪肉价格走势有何变化?生猪生产恢复如何?明年元旦和春节,百姓碗里的猪肉是否有保障?记者日前就此进行采访。在济南市玉函路的银座超市“金锣冷鲜...

抢抓农时各地夏收夏种压茬推进

全国麦收进入尾声,各地抢抓农时,科学高效统筹调度农机,夏收夏种压茬推进。截至17日,全国已收获冬小麦面积超过2.97亿亩。四川、湖北、安徽、河南、江苏等地麦收相继告捷。目前,山东麦收进度已过九成半。在...

中消协公布去年十大消费维权舆情热点:“菜刀不能拍蒜”等在列

“菜刀不能拍蒜”争议。中国消费者协会今天公布“2022年十大消费维权【进入黑猫投诉】舆情热点”,分别是:“价格刺客”有违明码标价诚信原则;“科技与狠活”折射消费者对食品非法添加的担忧;医疗美容风险与陷...

中铁二十三局集团一公司成功晋升公路工程施工总承包特级资质企业

1月28日,国家住房和城乡建设部发布《住房和城乡建设部关于核准2022年度第一批建设工程企业资质名单的公告》,公布了审查核准的公路工程施工总承包特级资质企业名单。中铁二十三局集团第一工程有限公司榜上有...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。