智能化终局之战,极越下出胜负手-pg电子官方网址
机器人何必是“人”?
在看完首届极越ai day后,不少人都发出了这样的感叹。如果说内燃机/电机驱动了汽车的肉体,ai则为汽车赋予了灵魂。
3月25日晚,在的百度总部,舞台中央的极越汽车ceo夏一平自信的说道,“在智能汽车3.0时代,‘机器人化’将是发展趋势,具备自然交流、自由移动、自我成长三种能力的汽车就是汽车机器人,才是真正意义上的‘ai car’。”
无独有偶,在前不久的百人会上,也有资深业内人士表达了类似观点,称“具车智能”大概率会发生在“具身智能”之前,“具车智能”也大概率会发生在中国的车企。他判断,ai将会成为智能汽车的胜负手。
得益于百度ai大模型生态支持,目前极越01已经深度融合文心一言、apollo、百度地图、小度等技术能力。极越01创造了全球范围内率先实现ai大模型“上车”、国内唯一/全球唯二的纯视觉高阶智驾、首个occ占用网络升级、首个ai语音算法全量本地化等诸多行业领先。
当晚,夏一平发布了ota v1.4.0新版软件,自动驾驶、ld地图、人机交互领域的百度三项最新ai原生科技惊艳亮相。这表明,百度ai大模型生态正在深度赋能极越汽车机器人,加速其进化。
显而易见,作为行业首个举办汽车ai技术大会的玩家,极越无疑引爆了汽车界的ai之战。
“今年,如果谁还没有落地 ‘智驾全国都能开,谁就一定会在智能化浪潮中掉队。”
在现场数百家媒体的见证下,夏一平宣布,2024年极越即将实现——只要百度地图能导航的地方,就可以使用ppa智驾。
夏一平表示,基于百度apollo纯视觉高阶智驾能力和安全体系赋能,极越完成了occ占用网络升级,已形成“b.o.t”完整技术体系。在本次ai day上,百度apollo自动驾驶视觉大模型vta(vision takes all)正式发布,大幅升级包括动静态检测、时序跟踪、实时建图、场景理解等能力。
升级后的occ占用网络感知能力大幅提升。在拥有比肩激光雷达的厘米级3d模型刻画的基础上,对障碍物的识别种类再度增加,不仅包括施工牌、围栏、路障、防撞桶等单个静态障碍物,而且对道路临时施工的围栏、靠边停靠的故障车辆、临时堆放的大垃圾桶等障碍物也能精准感知。
值得一提的是,v1.4.0版本新增occ 3d地图彩蛋,用户可以通过车机屏幕清晰地看到汽车机器人眼中的世界。在现场演示中,屏幕里如同积木一样不同颜色的方块标识出车外的障碍物/绿化带/其他车辆等,还有卡通的3d人物标识出过往的行人。
得益于occ感知能力的提升,极越点到点领航辅助ppa也大幅升级,可以应对更复杂的行车场景。夏一平举例说,在路况复杂路口,前车转弯太慢、电瓶车贴靠太近,ppa都能主动绕行。在突遇道路施工围栏、路边故障车辆、临时堆放杂物等情况,ppa可以灵活绕开或及时刹停。针对很多用户因为长实线或大车挡道而错过高速匝道出口的问题,ppa也能合理规划路线,找准变道时机。
同时,v1.4.0版本还升级了一系列行车体验优化,如:新增自动转向灯功能、新增ppa高速高架变道风格设置、转向自动图像辅助新增盲区预警等,并优化了前向碰撞预警fcw和自动紧急制动aeb之类的adas功能体验。
智驾开城堪称2023年智驾圈最激烈的战争,而到了今年,战火依然继续。当晚,夏一平宣布,城市ppa又新开一城——广州,这也是继北京、上海、杭州、深圳之后的第5个城市。对于较为特殊的北京城市路段,ppa也进一步完善,扩大了覆盖范围,可全面覆盖五环内城区的主要道路。
在ai day上,百度副尚国斌直言有些友的全国可用是“文字游戏”,是pr式发布。号称全国都能开,但其实很多城市只有几条路可以开;有的只是lcc全国可用;还有的是期货,落地遥遥无期。但极越ppa智驾的覆盖里程即将超过50万公里。2024年,基于百度apollo、百度地图的ai大模型能力赋能,ppa智驾“全国都能开、路路好体验”的目标指日可待。
夏一平和尚国斌之所以敢立下“只要百度地图能导航到的地方就能用ppa智驾”的军令状,得益于百度的ai加持。与华为和小鹏等玩家的激光雷达方案不同,极越一开始走的就是更为艰难的纯视觉路线。
百度智能驾驶事业群组首席研发架构师、idg技术委员会主席王亮认为,一图胜千言。激光雷达蕴含的信息量,相比图像(视觉)来说少好几个量级。摄像头的采样密度是今天主流激光雷达的160倍,等接下来最好的激光雷达上市之后,摄像头的密度仍然是它的20倍。激光雷达的优势在于可以很快上车,但依靠激光雷达肯定走不到智驾终局。
但如此复杂多样的信息,如何才能让模型具备泛化的能力?百度的解法是大模型 ai 原生。百度构建了一个自动驾驶视觉大模型vta(vision takes all)。大模型首先会对海量的驾驶场景进行自监督训练,让大模型对世界有更多的基础通用的理解,使其具备目标检测、实时建图、时序跟踪、场景理解的核心能力。然后,大模型会针对性地做出如景深识别等专业性的训练。
在大模型时代指导ai研发的一条规律就是openai在2020年提出的scaling laws概念,中文译成规模法则。规模法则里面很重要的一条是算力,多大算力决定你的模型能走多远。王亮透露,百度目前坐拥北京、苏州、阳泉三大计算中心,仅投入到智驾的算力就累计达到了 2.2 eflops,数据缓存高达 30pb,智驾有效训练时长占比 98%,百度对极越的算力投入并不设限。
当然,极越ppa全国都能开肯定开离不开百度地图的赋能。过去由于成本高昂,高精地图让业内又爱又恨。在ai day上,尚国斌透露,仅是在广州完成一次高精地图的绘制,成本就上亿。但百度ld地图(ld即车道级导航)的出现扭转了这一局面。ld地图对传统高精地图地图的要素、精度等最小化的要求,保留最必需的要素和精度;同时,增加了经验图层、安全图层、实时图层等传统高精地图不具备的要素。
更重要的是,ld地图彻底重构了传统的地图生产模式,实现端到端地图生成新范式,突破了车道级地图规模化的瓶颈。据悉,百度向全国道路投放数百辆 l4 采集车,并通过大模型生成地图,颠覆了过往99%人力生成地图的生产方式。
尚国斌说,去年上半年,百度开城速度约为一季度一城市,到了第三季度,单季度就能开 30 座城市。而现在,百度的开城速度是过去的100倍,成本是过去的1/20,能够做到一天开一城。目前,百度地图已经完成了全国360万公里的道路生成,ld 地图覆盖360个地级市。
“ld地图具备‘全国城市都能开’、‘手机/舱驾都能用’、‘智驾有图才安全’三个特点,真正的全国360城全覆盖,全球唯一将自动驾驶原生地图应用在手机和汽车上,让智驾像人一样开,比人更安全。”正是因为全面融合了百度地图的核心能力,尚国斌才放言,“只要百度地图导航能到的地方,极越01的ppa智驾就能用。”
除了智驾,极越汽车另一个黑科技就是无出其右的语音交互能力。其让汽车机器人在与用户的交互过程中更聪明、反应更快,也更加像一个真正的人。
百度语音首席架构师贾磊表示:“更超强的技术一定是端侧大模型模型,让车机在任何网络环境下,都能快速响应用户交互需求并解答车辆相关操作的问题。”极越01凭借车载语音的“全域全端侧”已经将语音助手simo打造成了语音天花板,识别速度快至500ms。夸张的说,其使用体验接近钢铁侠的贾维斯。
官方信息显示,simo从极越01交付第一天起,背后就得到了大模型能力的支持——百度文心一言,提供了车外语音控制、多模态融合交互、无网弱网全程在线、主驾驶免唤醒、车内四人同时说等其它智能座舱产品不具备的功能。
在v1.4.0版本中,simo新增基于大模型的主动推荐和用车知识自由问答,支持音乐推荐、视频信息问答、景点推荐和查询、功能解答等功能。例如,在车上和朋友聊到某个电视剧情,但想不起其中细节,便可通过询问simo迅速找到该剧情并播放相应剧集。
夏一平透露,目前simo的日均语音交互渗透率达98%,日均语音交互次数高达63次,是行业友商的10倍。其中,每车日均调用文心一言服务达7.1次,占日均语音交互次数比例约11%。自极越01上市5个月以来,通过simo收到了23,323个用户反馈,每个问题都会以秒级效率对接给研发中心,24小时内反馈用户。
多媒体娱乐生态服务向来是用户高频次使用的功能。v1.4.0版本新增无线投屏应用,支持投屏到车机端播放;新增车载wi-fi热点,供车内设备共享流量。同时,还上线了《全明街球派对》、《小三角大英雄》游戏。
当然,这些还不是智能交互的全部。夏一平预告,极越v2.0版本即将发布,届时将升级全新的语音大模型、全国都能开的ppa智驾等重磅功能。
自1886年诞生到现在,汽车已经经历了 100多年的发展。这100多年来,汽车革命经历过“燃油车1.0时代”和“电动车2.0时代”,而在当下的“智能汽车3.0时代”,底层驱动力正是来自于ai大模型技术。
当晚的ai day上,夏一平说,智能汽车3.0时代是汽车机器人的时代,时代变革起点是汽车“驾驶权”由人类向ai转移。这无疑是一座难以逾越的高山。
但极越在ai day上展示的能力,让外界看到了其正在越过这座关山,走向一个新世界。
>>点击查看今日优惠<<