ChatGPT改造汽车的序幕已经拉开,奔驰率先出手。
不久前,梅赛德斯-奔驰将ChatGPT集成到了车机上,开启了为期三个月的测试,结果显示,它的语音助手不仅可以完成简单地指令,还能进行连续多轮对话,理解能力和响应质量都有较大提升。
(资料图片仅供参考)
理想、创维、蔚来等汽车厂商随即蜂拥而入,用前沿的GPT能力让车机智能化程度更上一层楼。车机也彻底从最初的“收音机”变成了功能丰富的智能终端,加上GPT“大脑”后,又开始从木讷、鸡肋的机器向行车伙伴AvoeA转变。
而人车交互不是AI上车的尽头,自动驾驶才是未来。以往的自动驾驶解决方案过于依赖高精地图,一旦地图更新跟不上瞬息万变的路况,行车安全将受到威胁。AI大模型的进化升级,让车企们看到了机会。
让AI主动感知和决策,放弃对高精地图的依赖,正在成为一种主流趋势。几天前,理想汽车开启城市NOA(导航辅助驾驶)内测,它将BEV(Bird’s eye view,鸟瞰图)大模型作为主要解决方案,让汽车模仿人类“脑回路”驾车。通过连续学习,城市NOA还能被训练成用户通勤路线上“代驾”。
接棒互联网,AI正在对汽车进行更深层次的改造,四个轮子的大家伙越来越神似变形金刚。
车机+GPT 奔驰先出手
一场由内而外的“变形记”正在席卷汽车圈,从传统燃油动力到新能源,从驾驶工具到智能化产品。多年以来,科技驱使下,汽车不断变幻着外貌和内在,互联网改造汽车后,人工智能又来了。
梅赛德斯-奔驰在这股新浪潮中一马当先,要把ChatGPT移植进车机。
6月16日,奔驰为期3个月的ChatGPT测试计划在美国启动,它与微软合作,通过Azure OpenAI服务将ChatGPT集成到车机中。车主可以通过Mercedes me APP选择使用ChatGPT,还有更直观测试方式——直接在车内使用语音命令“Hey Mercedes,我想加入测试计划”,奔驰的MBUX信息娱乐系统就会将语音助手“Hey Mercedes”自动接入ChatGPT。
过往,Hey Mercedes可以提供体育、天气等信息,并回答有关车辆周围环境的问题,还能控制用户的智能家居,这都是制式化的。ChatGPT加入把问答变灵活了,用户能询问目的地详细信息,获得晚餐建议,可以不断提出问题,连续收到回复。这是ChatGPT的看家本领。
当前,仅在美国地区约90万辆配备MBUX的奔驰汽车可以优先测试ChatGPT,奔驰打算利用这个初始测试期深入了解用户提出的请求,来确定未来开发的优先事项,以及调整不同市场和语言的推出策略。
关于接入ChatGPT这事儿,奔驰给了一个充满感性的声明,“一切目标都围绕着重新定义您与梅赛德斯的关系。”奔驰要让ChatGPT重塑人车交互体验,更形象的类比是,车机从一个木讷的注重功能性的机器“活”起来了,向着车内生活伙伴的角色转变。
奔驰之后,国内的汽车厂商率先跟上。
6月19日,理想汽车推出了自研的认知大模型“Mind GPT”,这个大模型由理想的空间算法团队研发。据说大模型训练的开始日期早在ChatGPT发布之前,MindGPT基于数10TB的原始训练数据,使用了1.3万亿个Token进行基座模型训练,能识别声纹和语音内容,还能听懂方言,同时能为车主提供出行规划,甚至具备AI绘画和AI计算等功能。
理想透露,Mind GPT发布后,理想汽车将新增LUI(用户语言界面)交互方式,“比如你想吃个火锅,只需要呼叫理想同学,车机界面就会生成火锅的图片供你选择,随后自动算好出行路线。”
创维汽车也在近日宣布,旗下两款车型创维EV6Ⅱ及创维HT-iⅡ在智能车机上集成了ChatGPT,此外,长城汽车、蔚来汽车、小鹏汽车、奇瑞汽车四家车企都在上个月申请了GPT相关商标。
GPT上车成为一股潮流。奥纬咨询董事合伙人张君毅认为,GPT技术的接入能够提升车的人机交互能力和综合环境问题的互动能力。今后车企在同一价位段的硬件方面的品牌差异会越来越小,当舒适性、安全性、动力和续航里程上竞争难以产生太大的差异时,卷智能就成了必然选择。
给智能座舱装上“大脑”
ChatGPT上车又是汽车进化史上可书的一笔,最前沿的自然语言处理大模型应用到了人类的出行工具上,更丰富的车内生活体验将会出现。
回望30多年前,车载娱乐功能和车机智能化,尚是一片空白。第一代车机诞生于上世纪80-90年代,当时人们普遍的关注点还是汽车的发动机、底盘和变速箱“三大件”,突然有一些车型不仅能听收音机,还能吞进磁带,自由播放音乐,汽车有了一些第二生活空间的影子。
第二代车机则加入了DVD播放、MP3,娱乐性凸显的同时,汽车又向驾驶体验迈了一步,加入了车载导航。此时,解决“路盲”问题成为一个主流趋势。许多老司机一定记得,在没有车联网的时代,凯立德车载导航成了高端车型的标配,它使用GPS卫星定位和存在车机里的地图包数据,实现相对准确的导航精度。
但除了导航和听歌、收音之外,当时的人们并不对车机抱有太多期待,车机也往往不是决定购车与否的主要因素。
进入21世纪,电子数码技术不断发展,手机的形态先变了。循着这个进化思路,车机上出现大屏,智能化成为新卖点。基于linux、WinCE、安卓等系统的车机陆续被汽车厂商采用,而后汽车不仅可以免费实时导航,还具备全景可视系统、汽车驾驶辅助系统,比如360度影像等。
当汽车连了网,一切由变得更不一样。在线观影、路书、语音控制、预约保养、远程诊断等功能被加入车机,中控台的屏幕越来越大,功能越来越多,一些厂商直接在驾驶室装上了比平板电脑还大的显示屏,甚至厂商们近来卷起了“全面屏”,就连副驾和后排都要装上屏幕。
终于,“第三块屏”的概念越来越显眼,主机厂们希望,车机能够成为继电脑和手机之后,影响人类生活的第三代智能终端。用富含科技感的车机占领用户心智,拓展更多的商业模式,成为现在的车企们攻坚的方向。
现在,“车机”这一原始概念逐渐被“智能座舱”所替代。蔚来甚至造出了“第二起居室”的新词,不仅车机越来越智能化,车企们开始卷内饰用料、音响系统、灯光系统,蔚来还发布了一款AR眼镜,支持随车巨幕观影;理想L9甚至配备了一个后排冰箱,让汽车成了可移动的房子。
但无论是车机还是智能座舱,语音对话一直都是发展相对滞后的功能,考虑到驾驶安全性,语音操控又十分必要。
过去近十年来,几乎所有车企和大量的AI创业公司,在自然语言处理领域投入颇多,希望优化车内的语音交互体验。许多车机都能回答简单的预设命令,比如调高温度、预报天气等,升级和创新围绕拓宽自然语言口令展开,比如当用户说“有点热”后,车机可以打开空调制冷或调低温度。
但想让车机听懂更多“人话”,比如用各种方言规划路线、甚至找餐馆,可能还真不如车主自己用手机地图和大众点评来得有效,更丰富的语音式人车交互陷入瓶颈,直到ChatGPT出现。
自然语言大模型产品(ChjavascriptatGPT、文心一言、通义千问等)直接开放给C端使用,使智能座舱的开发者们看到了曙光。强大的理解能力和逻辑推理能力,有望让车机成为行车助手,暗藏商业可能。
比如,车主可以告诉语音助手,“帮我找出目的地附近有团购优惠、评分超过4.5的火锅店,一会有5个人用餐,给我预定一下位置,再看一下哪里停车方便。”放在以前,车机绝对无法一次性理解如此多的信息,但对ChatGPT来说,这只是它的基操,只要实时数据源足够多,需求被满足的可能性能够无限大。
GPT的加入并不只是让对话更流畅了,而是让车机具有了“大脑”,不仅能回答问题,还能理解需求并生成答复。至于智商有多高、反应有多快,取决于汽车厂商对上车大模型的训练能力,以及敢不敢“氪”金上更牛的硬件(芯片)。
AI如何让自动驾驶“脑回路”更像人?
车内生活的丰富,让汽车逐渐成长为一个充满温情的载体,它不再是枯燥、冰冷的代步工具,转而成为一个舒适的生活空间。
而AI主导的汽车进化还不止于GPT上车,它对自动驾驶的技术推动更加意义重大。
传统的自动驾驶研究方法是通过采集大规模的驾驶数据、测试更长的驾驶里程来覆盖所有可能的驾驶场景,以确保发生突发状况时汽车有预先设定的应对方案。但突发状况的复杂程度往往难以预料,一旦系统中没有应对某种特殊突发状况的预案,驾驶安全就将受到极大的威胁。
这也是为什么当前javascript的辅助驾驶系统,必须要求驾驶员手扶方向盘以应对实时突发情况。而AI的学习能力将有可能改变这个现状。
不久前,清华大学研究团队提出了自动驾驶“可信持续进化”技术,该技术是基于动态评估AI的可信赖程度进行学习训练,保证自动驾驶汽车在遇到陌生新场景时,其驾驶能力可从基础性的主动避让开始持续提升,在确保安全前提下达到更好的驾驶表现。
简单理解,利用AI,自动驾驶功能的汽车能主动学习、熟悉各种新遇到的场景,进行持续进化,随着驾驶里程与数据量的累积,性能得到持续提升。
理想汽车正将AI大模型用到自动驾驶领域。6月17日,理想宣布开启城市NOA(导航辅助驾驶)内测,并将在下半年向用户开放通勤NOA功能。与常规解决方案不同的是,理想采用了BEV(Bird’s eye view,鸟瞰图)大模型,来实时感知和理解环境中的道路结构信息,让汽车更能模仿人类驾驶员的操作习惯。
以往多数汽车上的辅助驾驶系统,大多是采用高精地图方案,相当于实时把路况投喂给自动驾驶系统,让其做出决策。但在复杂的城市道路中,总会有高精地图无法覆盖和无法及时更新的区域,这成为了该方案的一大缺点。而采用BEV大模型后,相当于AI主动感知实时路况,自主决策驾驶操作。
当然,BEV也有缺点,例如在一些跨度较大的路口,通行车辆较多,传感器视野容易被遮挡,导致车端实时感知的结果会丢失局部的信息。为了弥补这一不足,理想据称搭配了神经先验网络(NeuralPriorNet,简称NPN)和端到端的信号灯意图网络,前者的作用相当于每当车走过自动驾驶车队走过的路口,都有图像参考;后者则是学习大量人类司机在路口对于信号灯变化的反应,帮助自动驾驶系统理解交通信号。
使用NPN网络弥补BEV模型缺陷
根据实际的测试反馈,理想城市NOA还不能够完全实现自动驾驶,它存在转弯不够及时和不擅长超车的问题,此外,面对一些特殊障碍物,算法无法做出决策,必须进行人工接管。
不过,相比于传统的训练方式,大模型的引入最大的改变还是让自动驾驶系统有了更强的学习能力,这意味着自动驾驶能力会逐渐提升。典型的案例是,理想汽车推出了通勤NOA功能,在开启该功能之前,车主需要先设定通勤路线,通过日常通勤时的自动化训练积累NPN特征,大约1至3周时间后,AI可以成长为通勤路段的“代驾”。
这个过程体现了AI大模型加持下的自动驾驶汽车操作思路:先学习和熟悉路况,再进行辅助驾驶,“脑回路”更像人类了。
用AI大模型研发自动驾驶鼻祖不是理想,而是特斯拉。早在2021年,特斯拉就曾推出基于Transformer架构的BEV感知方案,随后华为、百度等企业也在“BEV+Transformer”上展开布局,目前,特斯拉、小鹏汽车、问界汽车等都在落地和不断优化类“城市NOA”功能。
大模型的持续进化,很可能让车企们找到了自动驾驶技术的突破方向,摆脱对高精度地图的依赖是第一步。现在的自动驾驶还停留在“辅助驾驶”阶段,未来,你很有可能会将你的交给AI接管。