大家都在搜
别克GL8
15万mpv
速腾迈腾哪个好
新车官图
独立悬挂
取消

卓驭科技陈晓智:L3落地还需要2-3年时间

卓驭科技陈晓智:L3落地还需要2-3年时间

在2025中国电动汽车百人会论坛期间,卓驭科技AI首席技术官陈晓智博士就当前关注的智驾领域分享了自己的见解。在陈晓智看来,今年各大车企都在说的全民智驾和智驾平权,卓驭科技在2023年已经把全国无图高速领航下放到10万元出头的车型上,当然现在的市场大环境对企业来说也非常好,卓驭科技将跟更多客户加深这些领域的合作。而在谈到L3级别自动驾驶功能何时会落地的问题时,他表示今年肯定会有一些落地,但大规模还需要一些时间,可能还需要2-3年。

以下为采访实录(有删改):

提问:刚才您讲到了L3,但是没有详细展开那页PPT,我想问一下我们L3落地有时间表吗?另外,大家都知道卓驭在成本方面是很厉害的,现在在全域智驾背景下,我们有没有预计成本还会不会下探,导致更多平价车型搭载更多的高阶智驾?

陈晓智:关于L3、L4,我们今年要做的事情是会把L3、L4的硬件做出来,包括控制器、传感器,满足L3、L4冗余的架构需求,这个传感器除了视觉摄像头,还会增加激光雷达来满足冗余;控制器也会有主系统和备份系统的架构设计。

再下一步,软件功能的落地,这块我们认为还需要一段时间,今年更多要做的事情就是先把硬件预埋,把落地的事情先做了,整个行业我们认为可能也会是这样的趋势,先预埋L3、L4的硬件,等算法,包括安全接管率,效率、接管率都提上去之后,我们再在一些特定场景把L3、L4的功能释放出来。

第二个问题,关于全民智驾跟性价比的问题,全民智驾这个事情跟我们卓驭一直以来倡导推动的高阶智驾普及是比较一致的,过去几年也一直在做这样一个事情,比如2023年,我们把全国无图高速领航下放到10万出头的车型,2024年,我们又把记忆城市领航下放到10万出头的车型,我们过去比较擅长的是把高阶的智驾功能下放到更低价位区间的车型,今年大家都说智驾标配、全民智驾,对我们来说是一个比较好的事情,我们也会跟更多客户加深这方面的合作,帮助他们更轻松地标配这些智驾功能。

刚刚提到成本,我们现在比较关心的像城市领航的功能,它的成本肯定能做到更低,比如目前用的7V摄像头,再加32tops的算力平台就可以跑城市领航,这对于目前大家常见到的动不动跑城市领航要有激光、要有几百tops算力的平台还会有比较大的成本,要下放到更低价位区间的车型还是会有一些压力和挑战,我们能支持更简单的硬件就能跑城市领航,可能会有一定的优势,对于我们的客户来说推动标配会更容易一些。

提问:L3实现还是没有时间节点吗?

陈晓智:肯定今年会有一些落地,软件我们认为还需要一些时间,可能是两三年的维度。

提问:当前有很多主机厂选择了自研+供应商合作的技术模式,供应商的角色从单纯的方案交付者转变到技术赋能者的地位,您认为供应商和车企的协作模式未来将发生哪些结构性的变化?在哪些技术环节上会有一些深化合作的可能?

陈晓智:这是关于跟车企的合作以及车企自研的问题。

首先,卓驭是作为供应商,我们给我们客户的提供方式本身是比较灵活的,我们在硬件、软件、算法各个层面都可以提供相应的合作,比如有的客户想要一个交钥匙方案,软硬件都给他,我们也可以做整套方案给他们;有的客户可能自己做硬件,或者我在第三方采购硬件,我们也可以只提供软件算法,甚至有的客户有自研团队,你能不能赋能我们,给我们提供工具链,或者只要部分的算法,我们也是可以提供的,我们卓驭的合作模式本身比较灵活,会针对不同客户提供不同的合作选项。

对于自研,现在大家都看到自研,但是自研这个事情本身会有一定挑战,未来不同的车企自研占多大比重可能还是得看持续的产品迭代能做到什么程度。

提问:想请问您今年DeepSeek开源对于整个AI领域也会有影响,对于卓驭来说,我们对于这样一个开源的技术有什么运用领域,或者我们目前有什么效果?

陈晓智:我先回答这个问题,DeepSeek开源大家都看到很多应用场景都有在探索,但是对于自动驾驶算法来说,它的作用跟原有的大模型区别不大,目前它比较多的还是自然语言的能力,多模态能力可能也是比较常见的,也没有特别突出,对于自动驾驶的应用更多是技术上对我们会有一些启发,比如它引入强化学习,以及在训练的成本上控制得很好,是通过整个训练系统的优化,使得它使用更少的成本把这个大模型训出来,在这些技术方面对我们启发是比较大的,但是直接用这个模型放到我们车上去跑,或者怎么去开车,其实是不太行的,不太能直接去用它,更多是借鉴它的技术,像强化学习、推理的能力。

提问:现在国内的车厂会提出智驾平权,比如10万元以内我也给你配更高阶的智能驾驶,其实也会有一些困惑对于消费者来说,比如我一个10万以内的车也有这个技术,一个二三十万的车也有这个技术,对于消费者来说他实际体验上感知区别会怎么样?对于用户来说,比如他可能想省钱,但是他会疑惑,9万块钱买一辆车和20万买的车,他不知道智驾方面的区别会在哪里,您能介绍一下吗?

陈晓智:这个其实要取决于每家车企对不同价位车型所放的功能的区别,我们也不能判断别的车企是怎么做的。

对于卓驭来说,我们对于不同价位方案的区分度,绝大部分场景能力要做到它们是一样的,只有在一些比较极端的工况会有区别,类似于不同的车可能会有不同的电机,有的单电机,有的双电机,从开车的角度其实没有区别,你用单电机还是双电机都能完成开车驾驶这个任务,没有区别,你可能只在一些特殊场景,比如说地面湿滑,容易打滑的场景,或者下雪天,双电机可能会好一点,可能会有这些区别,或者追求极致运动,我等红绿灯的时候,希望有声浪的声音出去,可能会有这些区别,但是基本能力是没有变成,智驾也是做到类似这样的区别,大部分场景都有相同的安全性、舒适性、拟人性,只有在一些具体场景有区别。

举个例子,比如可通过性可以有区别,比如说相对低成本的方案,可能在一些狭窄的路段不能通过,它就会告诉用户说不能通过或者我就刹停,停在这里等待接管,它有这个能力,但是不要影响它的安全性,只是不能通过,它只是没有这个能力通过,但是你的安全性、舒适性不能变;更高成本的呢,在更窄的路可以通过,可能在通过性的配置上会有区别,这是一个例子。

提问:因为我们现在已经公布的定点企业主要是自主品牌和大众,我们知道豪华品牌现在也在找本土化的智驾供应商,接下来我们有没有一些合作的可能性?

陈晓智:除了我们目前正在合作的客户,我们也一直在跟一些全球客户在深入交流,相关的合作未来一定还会有增加的,具体是哪些可能需要再过一段时间,大家可以等官方的消息,我们也一直在拓展这些海外客户,包括他们在本土化的车型、海外车型。

提问:我们用AI只是一个语言模型,比如用DeepSeek或者用ChatGPT,我们觉得它的模型量或者数据量比较小,但是智驾是非常复杂的情况,它怎么能做到千人千面以及动态调节呢?它的复杂程度在哪里?以及我们怎么实现?

陈晓智:我们上午在会场上也提了一个议价能力,就是千人千面和智驾的能力,它背后的技术关键是在于我们在研发端到端的世界模型,它跟传统的端到端区别在于,传统的端到端是基于模仿学习,你从大量的驾驶员数据中学习他的行为,就是模仿司机的行为,但是因为你的数据里面各种风格的司机都有,你学出来的风格其实就是一个平均的司机,你没有区分度,所以它很难做到千人千面,并且它的推理过程也是基于直觉式的,端到端,就是看到一个传感器输入就做一个驾驶动作,它是直觉式的一次性动作的预测。

为了做到千人千面,其实要有一些推理的能力,并且要区分不同的风格,我们通过世界模型,世界模型的特点不是直觉式的,它有推理能力,它可以生成未来可能发生的N种情况,就类似N个平行宇宙,N个平行宇宙里面可能有非预期的,有一些不符合用户驾驶意图的,你可能需要一个推理过程结合用户意图选择最有可能的驾驶轨迹,大概是这么一个思路,背后的技术核心,一个是世界模型的推理能力,在训练过程中会引入强化学习去克服模仿学习本身的局限性。

陈晓智:数据量其实没有太大区别,更多是算法上的创新,引入强化学习之后,在长尾数据积累,这种数据还能减少,因为模仿学习,你要模仿一些极端场景的行为,你得采集这个场景的数据,有一些场景数据又是很难覆盖的,强化学习可以通过仿真手段生成这种场景,它可以降低数据采集的需求。

提问:您提到低成本和高成本的智驾方案对于路况的解决,我想请您展开聊一下,您提到狭窄路况通过的情况,很简单,高成本会过,低成本的话以安全为准则可能就停下了,比如大家最关注的三个场景,一个是丝滑绕行,一个路口的灵活交付,还有驾驶预判,这个低成本和高成本,从我们的角度来说,它是一个什么样的解决思路?谢谢。

陈晓智:首先对于安全性、舒适性,包括拟人性,我们认为在常规场景,不同成本方案还是可以做到非常接近的,但必然会有个别的场景确实会有差异,差异的地方可能会在高动态的场景,需要精密操作的场景,比如说突然快速横穿一个外卖小哥的车,高成本方案可能会刹得更快一点,响应更快一点,而低成本方案可能会慢一点,但是它也能刹住,安全性是有,但是它可能就是响应慢一点,可能硬件的时延在里面,这是一个例子。

另一种,高精密操作,比如非常复杂的人车混行,各种快速响应周围行人,或者电动车的交互,这时候你如果高成本的,你这个模型处理的分辨率更大一些,或者算力更大一些,它在这方面还是会体现出来一些更安心的感觉,但是在绝大部分场景,我们认为区别不大。

提问:想问一下端到端世界模型的问题,业内也有一些厂商在尝试往这方面做,比如您刚才说的推理,它其实是在发生环境去做,但是推理相比于强化学习是比较耗时的,要迅速做出判断,我们怎么把在虚拟环境下的能力在最后部署上车的时候实现这方面的能力?第二个问题,业内也在谈论自动驾驶的终极解决方案,像前面有一些大佬说他觉得VLM可能只能做到L2+,如果要往L3或者往更高级别L4去做的话,可能要做VLA的大模型,不知道您对这个自动驾驶解决方案怎么看?您觉得有这个终极方案吗?

陈晓智:先回答第一个问题,推理相关的能力在车端怎么实现。这个问题,大家如果了解像思维链、慢思考或者推理这些能力,慢思考要处理时间更长,可能没办法做到比较高的频率去处理,在车端应用并非这种用法,车端使用更多是慢思考或者推理更多是做长时的任务规划,就是对于驾驶的策略它可以做分解,比如说根据导航,我要大概什么时候左转绕行,遇到复杂的路况怎么保证我走对路,它需要更多的规划,并不是像原来直觉式的端到端,我看到一帧数据就输出一个动作,它可能会出错,如果通过更长时的规划可以做出更加合理的决策,它会是一个结合的过程,这是部署角度的一个方式。

第二个问题,我们认为L3、L4,无论是VLM还是VLA,跟是否L3、L4没有什么必然关系,L3、L4跟L2是安全责任的区别,谁来承担事故责任,并不是功能的区别,L3、L4就是你的接管率要足够高,你可能要比人类司机要高几个数量级,MPI要高,你选用什么技术,端到端也好,VLM也好,VLA也好,只是影响你的接管率,接管率本身的优化,但是接管率即使做到很低了,也不代表你能做到L3、L4,L3、L4更多为了实现安全责任,驾驶员不接管,意味着系统必须还有另外一个备份系统代替驾驶员去监管这个车,L3、L4的区别是你得有一个备份系统代替这个人,对于主系统跑的是端到端还是VLA没有太大关系,至于VLA能不能满足L3、L4,其实没有什么关系。

提问:我们在电动化时代,刚开始的时候,续航其实是有泡沫的,很多用户会对续航非常焦虑,但这个过程大概用了10年时间,现在可能大家不会在乎也不会过多讨论这个,在智驾行业也存在这样的情况,但是挤泡沫的过程看起来比电动化稍微快一些,您怎么看这个趋势?从用户层面他觉得这个东西是相对安全的,不会过多讨论大概多长时间?

陈晓智:泡沫可能是会不会有一些宣传过度,您说导致消费者有一些理解上或者使用上的误区。

对于这一块必然会有这样一个过程,毕竟是新技术,但是我们也看到,智能驾驶的功能,比如像高速领航,在两年前很多人不敢用、不愿意用,但现在很多人会愿意用了,并且觉得好用,其实需要大家使用的过程,一旦用户用了,他确实可能就回不去了,他用了之后就回不去了,它确实能在高速场景解放他的疲劳。

城区的功能,像城市领航,目前确实还没达到成熟度,在这种功能上必然也会经过像高速领航的阶段,后面也会逐步让更多消费者觉得它安心,愿意用它,但现在其实还是有一定的距离。

对于城市的功能,我们认为在两年左右就会达到类似高速领航的成熟度。

提问:去年卓驭公布了和英伟达的合作,基于索尔,我想问问现在基于索尔开发的一段式端到端方案进度怎么样?另外一个,相比于低算力这些方案它的优势是什么?它的搭载车型有哪些?

陈晓智:索尔是我们今年重点在做的一个平台,最快实车体验下个月上海车展大家可能就能体验到,会是我们一个初步的版本,也会部署端到端的能力。

对于这个平台,它跟我们原来比如100tops、几十tops平台的主要区别是,我们可以上刚才提到的端到端世界模型这种技术,这种技术可以引入像大语言模型这种比较耗算力的模型,你要用100tops去跑确实比较困难,但是有1000tops可以跑VLA也好,世界模型、大语言模型都能跑,跑这些模型从功能上的区别就是能支持刚才我们说的千人千面的驾驶风格,个性化驾驶,还有语音控制,自然语言控制车辆的行为,这些能力可能是中低算力平台比较难做到。

索尔因为算力大,所以这个芯片我们在上面部署,我们也能支持座舱的使用,座舱也想部署LLM,智驾也想部署LLM,部署两套LLM比较费算力,我们会提供一个共享部署的方案,一个LLM解决两个域的问题,索尔平台也能支持这种功能。

(责编:李德喆)

网友点评

    二手车

      查看更多二手车
      还有2个信息需要填写哦~
      获取底价
      微博
      微信
      朋友圈
      关闭
      相关推荐
      取消
      取消

      海报生成中

      请稍后

      ...

      长按上图保存
      文章