半岛·BOB官方网站 智能车的「ChatGPT时刻」,还有多远?| 模力时代
奥飞寺的鱼和羊
量子比特 | 公众号QbitAI
如果问今年“科技春晚”CES上最吸引眼球的是什么,智能汽车绝对是其中之一。
毕竟,一旦大模型上车,智能驾驶舱就卷起来了,如下所示:
让车内的数字助理帮助你记录你的就餐时间表,它还可以帮你预订餐厅。
△骁龙座舱平台效果展示
路线规划也变得更加巧妙,数字助理会根据你的习惯主动询问你:“路上要不要买杯咖啡?”
△骁龙座舱平台效果展示
随着智能汽车上下游厂商纷纷亮出肌肉,也难怪不少在第一线参展的朋友感叹:CES堪称是一场汽车展。
事实上,随着大屏应用的重心从云端转向设备端,不仅手机厂商在设备端布局大屏,车载大屏也成为关注焦点之一:
智能汽车是当今最重要的智能移动终端之一,大模型被认为是AI规模化应用的关键。
不仅基于大模型和生成式AI能力构建的智能座舱,特斯拉引发热议的端到端自动驾驶解决方案,也代表着通过大模型把感知、预测、规划各个模块串联起来的新技术趋势。
也就是说,在大模型重构一切带来的“模型强国时代”,从智能座舱到自动驾驶,“汽车机器人”的真正实现,正全方位围绕大模型展开。
那么,问题来了——
智能汽车真的需要大车型吗?
前面提到,大屏车型最火的两大趋势就是自动驾驶和智能座舱。
自动驾驶方面,随着CVPR 2023的最佳论文颁给了自动驾驶大模型,业界出现了一个共识:
端到端自动驾驶是产业的未来,新的突破将基于大模型技术。
△CVPR 2023 最佳论文
与传统的基于规则的自动驾驶算法不同,端到端模型可以直接基于传感器输入(例如摄像头数据)学习如何控制输出,而无需手动设计复杂的中间表示。
比如在端到端的自动驾驶解决方案中,如果你想让模型学会不闯红灯,不需要设计规则,只需要用更多高质量的红绿灯视频来训练它。
这意味着端到端模型可以更好地处理复杂的流量场景:与依赖手写规则相比,此类模型可以对实际场景进行推理,并且能够更好地解决由极端情况引起的应用程序实施问题。
量子位智库在《2023年十大前沿技术趋势报告》中指出,端到端自动驾驶技术特点是所有模块都是神经网络,对规则的依赖性低,具有智能涌现能力和跨场景应用潜力。
在CVPR 2023最佳论文《面向规划的自动驾驶》中BOB半岛·体育在线登录,研究人员通过实验证明,增加主干网络可以带来感知分数的提高,这可能会进一步提升模型的预测和规划性能。
也就是说,更大的模型可以提供更丰富的特征表示和更复杂的任务处理能力,能够更好地支持自动驾驶场景中复杂的数据处理和决策。
如果说大车型驱动的自动驾驶还在探索之中,那么生成式人工智能与智能座舱的结合,已经快一步有了具体的落地案例。
这在今年的CES上就可以看到。
例如吉利Galaxy E8在车内搭载了大模型,实现车内影音娱乐与AI交互的个性化:基于文声图大模型,可秒生成定制壁纸、精准推荐音乐,并根据音乐心情生成风格化壁纸,AI数字精灵拥有“个性”更人性化……
高通骁龙数字底盘概念车更直观地展示了边缘生成式AI的高效用例。
例如,如果仪表板上出现警告灯,您可以询问数字助理并立即得到答案,而无需研究车主手册。人工智能甚至可以帮助您当场安排维修预约。
△youtube@HotHardware
关键在于,部署在车侧的大模型,也就是终端侧AI模型,可以“不下车”保护用户数据,同时结合本地数据提供更加个性化的座舱服务,既保障了用户的隐私安全,又缓解了云端处理带来的延迟问题。
此外,充分利用端侧算力,也能大大缓解用户规模增长带来的云计算力成本压力。
不难看出,对于自动驾驶领域来说,大车型的技术浪潮带来了突破当前技术瓶颈的新路径。因此也有业内人士做出这样的判断:要真正实现通用场景的L4、L5级自动驾驶,大车型必不可少。
值得注意的是,虽然云端基础大模型及其应用在过去一年取得了快速进展,但将大模型投入到车辆上仍面临相当大的挑战。
首先是数据问题,相比于互联网上的海量数据,自动驾驶领域本身的数据量要小得多,而对于训练端到端的模型来说,来自优秀人类驾驶员的高质量数据更为关键。
第二是算力问题,无论是智能驾驶中路况的实时推理,还是智能座舱中用户意图的理解、功能调度,都对端侧算力有更高的要求。
第三是安全性的问题,一方面涉及到端到端自动驾驶模型的可解释性,另一方面是如何保证端云融合过程中用户隐私数据不被泄露。
从硬件角度来说,这些问题其实对汽车芯片提出了更高的要求。
“模型强国时代”,智能汽车需要什么样的芯片?
如果说骁龙8155(第三代旗舰骁龙座舱平台)在过去几年中已经成为了座舱是否智能的事实标准之一,那么在CES“车展”上频频出现的另一个关键词,则揭示了“车型时代”智能汽车竞争的新方向——
骁龙8295(第四代至尊骁龙座舱平台)。
从国内新车厂商到奔驰、宝马,骁龙8295已经成为CES上亮相的最新量产汽车的新标准。
△搭载骁龙数字底盘解决方案的宝马i7
在大屏化车的趋势下,车载芯片的最新演进方向是什么呢?我们以骁龙8295为例,来详细了解一下。
骁龙8295采用5nm工艺打造,算力方面,其CPU算力达到230K DMIPS,是骁龙8155的8倍;GPU可实现每秒2.9万亿次单精度浮点运算(2.9TFLOPS)或者每秒58000次半精度浮点运算(5.8TFLOPS)。相比8155,整体性能提升2倍,3D渲染性能提升3倍,可同时驱动车内11块屏幕,远超市面上其他车机芯片。
更重要的是,骁龙8295配备了双核NPU,AI算力从8155的4TOPS直接跃升至30TOPS。
这样的参数表现远超其他车规级芯片,功能上更是实现了大模型、多模态交互、离线语音,甚至车机泊车、座舱一体化等。
以搭载骁龙8295的极悦01为例,将云端的语音识别算法模型直接放在车侧,实时响应时间可从1.5秒缩短至700毫秒。
除了常规的自主停车外,车辆还可在车外通过语音控制实现自主停车。
在车机上,在骁龙8295的支持下,极悦01可以识别不同的说话人,也就是支持多人语音功能,配合离线语音库,即使没有网络连接也可以实现全功能语音识别。
此外,车内智能交互不再局限于语音半岛·综合体育官网入口,眼神、动作等多模态交互如今已能在车内实现。比如在车内想开窗,无需详细解释,只要说一声“开窗”,跟随目光,车内AI就能秒懂车主意图。
值得一提的是,作为可扩展的自动驾驶SoC平台,骁龙8295拥有广泛的软件生态系统,包括视觉感知、停车和驾驶员检测软件堆栈等。
对于车企来说,这意味着基于骁龙座舱平台做一些花哨的事情会更加方便、快捷。
从消费者角度来看,座舱智能体验的升级才刚刚开始。
终端侧AI是AI规模化的关键
大模型带来的变化最核心的是人与计算机交互方式的改变。
作为被赋予厚望的“智能空间”,智能汽车自然成为这场技术变革风暴中不可忽视的重要组成部分。
没人能准确预测智能汽车的“ChatGPT时刻”何时到来。但至少在软件和硬件准备方面,以高通为代表的玩家已经率先做好了爆发的准备。
事实上,这种逐渐聚焦终端的新“ChatGPT时刻”的期待,在这场2024年开始的CES上可以说随处可见。智能汽车备受关注,但远不是一切。
从火爆的AI掌上游戏机Rabbit R1,到AI PC半岛·体育中国官方网,再到AR/VR、实体智能机器人,AI与终端的结合几乎遍布CES会场的每一个角落。
“模型强国时代”新阶段的变化趋势也日益明显:大模型/生成式AI技术在端侧的落地,是新一轮AI机遇爆发的关键。
对此,高通总裁兼首席执行官阿蒙在 CES 主题演讲中表示:
生成式AI的发展正在从第一阶段走向第二阶段,目前整个产业已经将生成式AI应用在处理器中,下一步将是使用场景和应用的开发。
核心原因是,哪里有数据,哪里就有AI推理。
一方面,随着大模型应用用户数的增加和模型参数规模的增大,云端计算推理的成本快速上升,需要充分利用终端侧的算力来平衡成本;另一方面,只有终端能够运行AI大模型用例,才能在保护的前提下充分利用个人数据,实现真正个性化的大模型应用。
总之,2024年伊始,“模范强国时代”的终端变革的一角,被进一步展现在大众眼前。
可以预见,变革的风暴不会就此停止,更多的智能化变革或许在今年通过智能终端更加贴近你我的生活。
-超过-
我要评论