访谈|后摩智能吴强:存算一体有机会挑战英伟达-pg电子官方网址
9月28日,2023全球智能汽车产业大会(giv2023)在安徽合肥举行。后摩智能创始人兼ceo吴强在大会上做了主题演讲。会后,吴强接受了太平洋汽车等多家媒体的采访,他表示,用传统方式挑战英伟达,机会太渺茫了,用存算一体等新的技术路径挑战不一定一举成功,但是机会大很多。
汽车智能化正在快速发展,一方面算法、模型在持续演进和变得多样化,比如从最初的cnn模型,到最近的transformer 、bev这样的大模型。另外一方面,未来几年智能驾驶的体验会有一个质的提升,比如从现在的l1/l2、高速noa,快速普及通勤noa或者城区noa。毫无疑问,这些对计算芯片的处理能力都提出了更高的要求,需要更强处理能力的芯片。
那么,如何才能让芯片具有更强性能的同时,把芯片的成本也降下来,后摩智能给出的答案是存算一体,通过技术创新去解决芯片计算效率提升过程中的一些本质问题。吴强说,芯片计算效率的提升主要面临两个本质问题。一个是存储墙,计算效率的提升很大一个问题取决于计算和存储的距离,本质其实是计算和存储之间的距离太长,比如电在硅上的速度很明确就是每秒钟6万公里,芯片时钟在3ghz左右,每个时钟周期电移动就是20毫米左右的距离,这是物理的规律。如果存储和计算分的很远,就会有很长的存储的延时。另外一个本质问题就是功耗。研究显示,移动数据的功耗比计算本身的功耗高2到3个数量级,大概是几百倍甚至千倍的水平。
如果不能拉近存储和数据的距离、提高访存的带宽和减少访存的功耗,那么芯片效率提升面临的是一个不可逾越的障碍和挑战。传统的解决办法是希望增加dram的带宽、减少darm访存的开销。比如我们电脑里面l2缓存,宽带从100 gb/s到200 gb/s;英伟达的游戏卡,带宽几百gb/s到 tb/s左右;英伟达的h100,带宽到了1tb/s到3tb/s左右。但这种方式的成本越来越高,容量也有一定的限制。
针对上述痛点,很早以前,人们就想到了一种解决方法:如果计算和存储的距离太远,为什么不把它拉近一点甚至可以重新融合在一起,这个就是所谓的将存储和计算融为一体的想法。广义存算一体分为两种,一种是近存计算、一种是存内计算,近存计算是说把计算和存储拉得更近,存内计算是说完全融合在一起。最近10年,ai逐渐爆发,存算一体技术终于迎来了最好的场景,就是ai计算。的dojo用的就是近存计算。
吴强表示,对于智能驾驶来说,用存算一体技术来做智驾芯片的意义主要有两个,一方面是上限更高,存算一体本身是底层架构的创新,计算效率对比传统架构能有一个数量级以上的提升。另一方面是它的底限稳,用成熟工艺仍然可以做出媲美国外巨头的芯片产品,比如28纳米存算架构,可以做出类似7纳米传统架构的性能效果。
事实上,2023年5月,后摩智能正式推出了存算一体智驾芯片后摩鸿途™h30,物理算力达到256tops,典型功耗仅为35w。根据后摩实验室及mlperf公开测试结果,在resnet50性能功耗对比上,采取12nm制程的h30相比某国际芯片巨头的7nm同类芯片性能提升超2倍,功耗减少超50%。
当问及为什么国外芯片大厂不做存算一体,更多是创新创业公司在做时,吴强解释说,国外的创新公司也在做。但像英伟达、amd这样的芯片大厂却很难去做,因为他们在传统的架构体系中有很深的积淀,与之配套的整个软件生态已经走得很远,改变架构就需要他们舍弃太多原来积淀下来的东西,软件生态既是它的优势,同时也是它的历史包袱。在吴强看来,后摩智能真正的壁垒是差异化的产品性能。他透露,跟国际大厂相比,后摩智能的产品性能可以提升好几倍,不是1到2倍,而是5倍甚至更多。
对于未来的前景,吴强表现的很乐观。他认为在智能驾驶领域,未来会是传统芯片和存算一体芯片并存的局面。大家一定会用新的方式和技术去挑战英伟达,因为用传统的方式去挑战它难度太大了。此外,这几年汽车芯片本土化、国产化进程不断在加速,创业公司迎来了难得的历史机遇,政策环境和创业土壤给了后摩智能这些技术创新型企业一个生存的机会,可以度过前面短暂的黑暗周期,他相信,后摩智能一定可以靠高性能产品跑出来。
>>点击查看今日优惠<<