星空·综合体育官网入口 特斯拉删除99%代码,FSD却更好用了!智驾的终极答案竟然是它?
前段时间,特斯拉的“全自动驾驶”FSD推出了最新的V12版本。
此次更新对于整个智能驾驶行业的发展来说绝对是一次里程碑式的革命!
一般的智能驾驶更新基本上都是在原来的基础上增加几行代码,或者优化一个参数,重点是小修小补。
对于特斯拉来说幸运的是,他们不但没有增加基础,反而进行了大幅削减:他们将FSD原本超过30万行的C++代码削减到只有3000行,减少了99%!
想想看,如果一个人突然发生意外,失去了99%的脑细胞,即使侥幸活下来,也很有可能成为植物人。
但吊诡的是,只剩下3000行代码的FSD V12不但没有成为人工智障,反而比之前的任何版本都要聪明!
在国外,很多长期测试FSD的博主都表示:“刹车和转向的犹豫减少了很多,前所未有的舒适平稳。决策时也很有信心,就像真正的车一样。”开车的人。”
比如星空综合体育app下载,当两侧有大型车辆遮挡视野时,老版FSD会直接大胆超车,如有可疑则立即应用AEB紧急制动;现在它会提前减速,就像经验丰富的驾驶员的防御性驾驶一样。
另一个例子是遇到车辆较多的复杂路口时。以前,我只是停下来,等到路口人车都不那么复杂的时候星空体育平台官网入口,再往前走。现在它会继续低速蠕动,找到车流中的一个缺口,然后小心翼翼地钻过去。
如果你在驾驶FSD时突然在路上遇到一只猫,汽车会与猫争夺路权——先慢慢接近它,然后继续前进,直到猫跑掉。
包括以前处理不好的环岛、调头路段,现在都可以处理得更顺畅了。即使你手动将车开到尴尬复杂的路段,然后打开FSD,系统也能正确接管。
中国自主智能驾驶品牌领军CEO之一何小鹏在听说FSD这次史诗级更新后,毅然前往美国亲自试驾。随后,他在微博上发文,用“优秀”二字称赞新版FSD太棒了。
虽然本次FSD更新相比旧版本有了明显的进步,但新的问题也出现了——
有时系统会显得有点“太聪明”,会自己随机产生一些意想不到的想法。
例如,在按照导航应直行的路段,汽车并入左转车道,成功左转。
又比如,有时汽车会误将持续闪烁的红灯误认为是红绿灯并停下来,即使有汽车经过。
但令人惊讶的是,第二天,我们仍然遇到了红灯闪烁。车停稳后,前面的施工人员向车挥手,示意可以继续前进,车似乎听懂了。就像工人的手势一样,他竟然开始向前穿过路口!
现阶段,FSD V12版本确实还存在不少Bug,就像薛定谔的猫一样神秘。但总体来说,新版本的性能更好,有时甚至表现出与人类相同的决策能力。
别忘了,新版FSD只有3000多行代码,这和20世纪80年代“霸王”上的热门游戏《坦克大战》的代码行数几乎相同!
虽然现在的智能驾驶领域已经不再是代码越多、越复杂、代码越多功能越强大的时代。毕竟还有一种叫做“祖狗屎山密码”的东西。
但特斯拉仅仅通过重构代码就能实现近乎完美的智能驾驶体验,这确实远远超出了大家的想象。他们到底是怎么做到的?
这就不得不提到最近智能驾驶圈非常流行的一个新术语——“端到端”。这也被不少业内人士认为是智能驾驶的终极答案。
当我第一次听到“端到端”这个词时,我认为它的字面意思是“从 A 端到 B 端”。毕竟,这才是我认为自动驾驶的最终目标。
后来我发现端到端根本不是这个意思。
端到端的英文名称是“end to end”。如果是指起点到终点,就应该叫“起点到终点”。
其实,端到端指的是:根据摄像头等传感器的图像数据,直接生成车辆的转向、制动、加速信号来控制车辆,即“感知决策与执行一体化”。
这个词有点晦涩难懂,我打个比方吧。过去是三个人一起工作,瞭望员负责看路,指挥员负责决策,舵手负责驾驶。
至于特斯拉这次的FSD V12,不需要三个人来做,一个人就可以搞定!
看到这里,可能有人会说,现在车企做智能驾驶不都是这样的吗?其实不是。
目前智能驾驶厂商大多采用串行结构框架,是几个人协调的解决方案。
即首先通过摄像头和雷达获得感知图像,然后将感知图像处理成机器可以理解的数字信号,然后将数字信号发送到智能驱动芯片进行逻辑运算,处理成加速、减速和转向信号,然后传递给电机和舵机执行控制,每个环节由独立的模块控制。
具体来说,目前头戴式智能驾驶厂商从感知到决策阶段,大多采用BEV鸟瞰+Occupancy网络+Transformer模型的组合。
BEV鸟瞰是将雷达和图像信号从前视图转换为俯视图的技术,以便更清楚地确定车辆的位置,即观察者可以站得更远,看得更清楚。
Occupancy占据网络,将二维图像信号转换成一个小的方形三维空间,有点类似于《我的世界》,用于防止车辆撞上障碍物。
变压器是一种大型模型。前几年流行的ChatGPT中的“T”,其实就是指Transformer。
它的作用是让机器在处理信号时过滤掉关键信息并进行计算,而不是一次性完成所有计算,从而提高计算能力的效率,这意味着指挥员可以更聪明,更快地做出决策。
在串联架构中,与BEV+Occupancy+Transformer相结合,就形成了我们现在接触到的所谓“高端智能驾驶”。
然而,这种目前主流的智能驾驶解决方案有几个难以避免的缺点。
首先,串行架构本身需要时间与三个人沟通,这会导致整体系统响应速度缓慢,体现在智能驾驶体验上,让汽车感到犹豫。
毕竟,从感知到决策再到执行的过程很可能需要零点几秒甚至更长的时间。在不断变化的交通流量中很难立即做出调整。这就是很多聪明司机“不敢频繁变道”的根本原因。
其次,如果消息从第一个传递到最后一个,那么中间很可能消息会发生变化,即信息会被扭曲。尤其是在复杂场景下,发生事故的概率会增加。
再者,在传统的智能驾驶解决方案中,如果想让系统更准确地响应更复杂的场景,采用的方法一般都是“加法”,比如在原来的基础上多写几行if、else等。逻辑代码。
久而久之,整个智能驾驶系统会变得越来越复杂,就像你的手机系统一样,用久了肯定会卡壳。
而且即使加入越来越复杂的判断逻辑,也不可能面面俱到,因为总有极其复杂的场景是机器无法处理的。
如果真的遇到这样的场景,就算你充分利用了芯片的运算能力,也应付不了。可能会直接导致系统崩溃,这在智能驾驶圈里常被称为“corner case”。
相比之下,端到端智能驾驶将感知、决策、执行三个环节整合到一个大模型中。只要输入摄像头和雷达信号,就可以直接产生控制信号来控制车辆的转向、加速和减速。星空·体育中国官方网,消除了原来的逻辑判断过程。
可以简单地认为,端到端的智能驾驶相当于把智能驾驶系统的分析判断变成了和有经验的驾驶员一样的“本能行为”。就像学霸学过无数遍题一样,只要看题就能写出正确答案。
前面提到的FSD V12的3000行代码实际上不是普通代码,而是3000行神经网络代码。
它有点像动物神经元细胞,能够产生神经反射等快速反应。因此,端到端智能驾驶的运行速度远高于传统智能驾驶解决方案。
换句话说,端到端更像是生物学的运行逻辑。人类开车时,眼睛看到的图像本质上是二维的,但这并不妨碍我们做出正确的驾驶操作。在这样做之前,我们不需要将头脑中的“前视图”转换为“俯视图”。 “2D 到 3D”。这太复杂了。
本质上,端到端智能驾驶算法的出现是对传统BEV+Occupancy算法的彻底颠覆,也是降维攻击的另一种形式。
传统智能驾驶系统需要准确识别和标记车辆、人、车道线、障碍物等要素;端到端智能驾驶将更加注重宏观场景的识别,比如天气好坏、鬼探头盲点等,都会纳入识别范围。 。
毕竟,传统的智能驾驶依赖于僵化的逻辑,而端到端的智能驾驶依赖于大数据反馈的体验。
由于它依赖于经验,如果要保证智能驾驶系统做出正确的决策,就需要将大量的“驾驶视频+人类驾驶动作”数据喂入大型模型训练中,就像“海量答题”一样。
因此,在端到端智能驾驶时代,数据比编码员重要得多!
这也解释了特斯拉前段时间在全球范围内大规模裁员的原因。理想正式宣布进军端到端智能驾驶的同时,也对原有智能驾驶部门人员进行了大刀阔斧的“优化”。
相比之下,计算能力已经成为非常重要的资源。今年 7 月,马斯克又从 Nvidia 购买了 35 万块显卡,只是为了更快地处理数据。
虽然端到端的解决方案在质量上优于传统智能驾驶解决方案,但目前并不能保证体验会100%优于传统智能驾驶解决方案。
事实上,今年1月特斯拉刚开始推送FSD V12版本时,用户的抱怨远远多于点赞,还出现了各种以前闻所未闻的Bug。
马斯克第一次做FSD V12直播测试时,差点闯红灯。
直到半年更新了几个小版本,特斯拉 FSD V12 才逐渐展现出威力,让用户感觉自己在开车。
毕竟训练FSD端到端大模型的数据源本身就来自于全球大量的特斯拉车主。所以表面上看是FSD驾驶,但实际上是它本身在驾驶,而且是全世界特斯拉用户在驾驶的集合。
当然,这也可能是FSD V12有时会随机产生“独立思想”的原因。毕竟,人们在驾驶时有时会犯错误,如果输入“不干净”的数据,智能驾驶模型就会变得愚蠢。
这时,端到端智能驾驶相比传统智能驾驶解决方案的一大劣势就会暴露出来。
过去可以通过修改代码来修复的BUG现在被发现并不能及时纠正,因为大模型本身就是一个充满未知的“黑匣子”。纠正错误的唯一方法是提供更多数据。减少犯错误的机会。
端到端启动虽然弱于传统智能驾驶,但演进速度更快,理论能力上限更高。
随着大量数据的积累,端到端的智能驾驶将在几年内跨越拐点,在能力上超越传统智能驾驶,并达到无限接近人类驾驶水平的结果。
这也是为什么小鹏、华为、理想、蔚来等国内一线智能驾驶厂商都开始宣布进军端到端。
毫无疑问,特斯拉直接将智能驾驶底层逻辑改写为“端到端”是非常激进的,某种程度上这也可能成为FSD在中国“过关”的障碍。
相比之下,已经宣布进军端到端智能驾驶的国内车企采用的是“部分端到端”的解决方案,并不像特斯拉那么激进。
之所以保留部分传统智能驾驶架构,大多是为了安全“遮底线”,防止系统误判造成极端事故。
至于这些公司之间具体的端到端差异,今天限于篇幅我就不继续和大家聊了。等到下次再单独写一篇文章和大家一起分析一下。
写在最后
我记得20年前,诺基亚统治了手机行业。
Android刚出现时,内核代码数量只有1000万行多,仅为Symbian系统的1/3。
虽然早期的Android应用程序很少,并且不如诺基亚的Symbian那么好用,但随着Android应用生态系统呈指数级扩张,诺基亚和Symbian最终被淘汰,成为历史的尘埃。
如今端到端智能驾驶技术的出现,在某种程度上预示着智能驾驶将迎来新一轮革命。
真正意义上的AI正在汽车中生根发芽,其势头势不可挡。
我要评论