楼主
发表于2024-05-21 14:41:00查看 4691回复31浏览 4691

昨天小鹏汽车举行了 AI Day,这条微博结合昨天 AI Day 和发布会之后采访何小鹏的内容,系统性地聊聊小鹏现在在做什么以及接下来的思考。

 

昨天的 AI Day 上基本是把小鹏最新的、全量推送给用户的 5.1.0 版本的新功能详细介绍了一遍。

 

至于为什么要专门开个 AI Day 来说,因为新功能太多了,光更新日志就 1.3 万字,详细的功能在这里:。

 

不过这场发布会最核心的一点就是向外界表达小鹏现在从座舱到智驾都开始接入 AI 的能力了。

 

座舱上接入了 AI 之后,能力上最大的变化有 2 个:

 

1. 语音助手本身的能力提升了,之前只能规矩的去执行车控相关的指令,现在你可以以非常模糊的感受去下一些指令,同时也可以问语音助手很多和车控无关的问题,可以理解为一个 xxxGPT 或者一个语音版本的搜索引擎;

 

2. 现在的车可以主动感知周围的环境,比如你问语音助手,我们前面是什么车,系统就会告诉你前面是小鹏 X9。

 

单看这个功能现在的能力,可能价值有限,但是这个事儿的想象空间很大。

 

如果接下来持续迭代,能识别的不止前面是什么车,而是可以刻画出整个周围环境,并把里面所有的元素通过逻辑关联起来,构建出世界模型,那对智驾的帮助就非常大了。

 

现在行业里也有不少企业在这么做,依托 AGI 大模型对开放世界的理解,赋能只能驾驶。

 

当然,这个是理想形态,真正实现还需要很长时间。

 

现在 AI 对智驾的帮助主要是通过大模型神经网络替换部分规则算法。

 

之前车展的时候何小鹏提到上了大模型之后能让智驾能力快速提升。这次小鹏给了一些量化的数据,上了大模型之后,智驾的能力提升了 2 倍。

 

现在小鹏这套智驾由 3 大核心板块构成:

 

- XNet 鹰眼视觉负责看

- XBrain 大脑负责意图推测

- XPlanner 小脑负责控制

 

从 OTA 更新日志里我们可以得知,现在新上了端到端的是 XPlanner,可以提升路口行驶路径和车道选择的合理性和拟人化程度。

 

换句话说就是,通过学习人开车的轨迹训练神经网络,让神经网络具备拟人的行车轨迹。

 

在这样的算法能力加持下,小鹏目前可以做到每 2 天迭代 1 次,目标是:

 

- 智驾能力 18 个月提升 30 倍

- 2024Q3 实现全国每条路都能开

- 2025 年城区智驾体验比肩高速智驾

 

关于上端到端,大家最关心的一个问题就是,神经网络是一个黑盒,输出的结果存在不可解释性,小鹏如何用好这个东西?

 

关于这一点,小鹏汽车自动驾驶负责人李力耘表示,AI 的优势是可以在一个非常不确定、非常模糊需要博弈的空间里找出一个非常好的解,如果运用好模型架构的能力、很好的体系,AI 还可以具备自己进化和学习的能力。

 

遇到不可解释性的问题,首先即使是端到端的大模型,也有不同部分的侧重区域,XBrain 侧重于大场景的认知,XNet 侧重于感知、侧重于语义,XPlanner 跟像脑和手。

 

在工作的时候,他们是紧密协调的,并且是联合训练标注,是非常有机的成为一个整体的。

 

当在我们的工程的实践中,如果真正有了问题,其实每一个部分其实有它侧重的部分,我们能够很轻易的能够去理解,到底是因为我们的理解出了问题,还是因为我们没看见?还是因为我们看见了也理解对了,但是我们动作错了。

 

这也是小鹏能够真正去量产端到端大模型的一个最重要的一个前提。我们之前的所有的努力也都是可以用来兜底的东西。

 

采访环节大家也问了一些比较尖锐的问题,比如现在大家都在卷大模型,小鹏如何保证下来的遥遥领先?

 

何小鹏的看法是:「自动驾驶是一个非常困难的事情,不是靠钱、靠人就能做到,它有成功的概率,有非常大的数据的门槛,而且越越往后实际上越难成,因为头部效应会越来越明显。

 

换个角度可以看到,中国去年开始大模型的创业风,但大模型真正从模型到应用,到汽车里面有一个工程落地的难度,远超大家想象。

 

我们这个升级也只是第一步,但是我们看到了一个方法论,并把他真实落地,能够每 2 天一次内部 OTA,以前靠人根本做不到,完全做不到。

 

以前我们自动驾驶的规则估计有 10 万条这个级别,现在我们用大模型可以做到 10 亿条规则或者更大,当然不能完全这种同比,因为它是一个推理的模型。

 

但实际上它的逻辑完完全全跟以前的道路不一样,所以我认为包括小鹏,包括少部分企业,会跟绝大部分在做以规则为主的智能辅助驾驶会甩得越来越远。」

 

这里衍生出来的新问题是:智能驾驶这个赛道,这个赛道的赢家已经确定了吗?后来者还有机会吗?

 

在何小鹏看来,中国没有一家车企拿到船票,都有机会。

 

小鹏在这个里面走得非常专注,有的企业最近几年时间都在追,但是实际上这个事儿不是仅仅靠一些人,几年就可以追上来,这是一个非常长期的事情。

 

但是何小鹏相信这个行业将来会有少数几家能够把无人驾驶或者完全自动驾驶做到中国最好、全球最好,但是不会太多,因为难度还是非常高的。

 

就看现在的大模型,真正的原生的大模型在中国、在全球不多见,而且推进的速度有的很快,比如 Open AI。

 

但也有很多推进的并不快的,实际上拼的是一个长期的专注和走合的能力,综合能力包括数据的规模、技术的实力和商业的思路都是需要的。

 

关于商业的思路,何小鹏也提出一个新的观点:在大模型时代甚至很难有 Tier 1。

 

传统的 Tier 1 卖辅助驾驶,后面只是做 Bug fix 或者少量更新,但是大模型需要大量的数据且让数据循环起来,就小鹏而言一年花在算力和训练上的费用就是 1 个多亿美金。

 

所以,以前用 Tier 1 做集成商,在资本的软件时代是可以的,但是在大模型时代是非常困难的,整个合作方式在将来都会有质的颠覆。

 

最后就 18 个月能力提升 30 倍这个点,在发布会后的媒体采访中也聊到了这个问题。

 

何小鹏在采访中确认,18 个月能力提升 30 倍是在当前的硬件下,就软件升级即可实现,当然这个前提是需要巨大的训练过程。

 

换句话说,小鹏目前的这套辅助驾驶硬件依然可以持续更新迭代非常长的时间。

 

在何小鹏眼里,18 个月后的能力形态是在城市内部所有道路包含小区能够做到极低的接管率跟极高的安全。而且你不会感觉到它比较傻、开得慢,或者比较蠢老是在那里僵住这种感觉。

 

对应到发布会上对 2025 年的预期就是做到类 L4 级的智驾体验。