有请下一位讲者,地平线机器人的李星宇。

李星宇:非常高兴接受到吴总的邀请和大家探讨比较专业的话题——自动驾驶的处理器。

很多人动自动驾驶大的产业有很多的了解,但是自动驾驶如何真正落地?什么样的因素才是这个产业的核心因素之一?我们有很多的思考。

这里先给大家看一个数字,整个自动驾驶领域最核心的大脑是处理器,也就是芯片。现在Intel和英伟达是半导体产业前三的公司。英伟达在过去三年内增长了十倍,现在在1300-1400亿之间。Intel一直在企业领域,但是始终不佳,去年有一个大手笔收购了以色列Mobileye,当时收购价格153亿美元,那时候很多人置疑这么高的价格是不是做亏了?后来事实证明,收购结束以后不到一年时间Intel市值增长了50%。为什么会有这么大幅度的提升?根本原因在于自动驾驶的主战场就是在自动驾驶处理器。

现在自动驾驶有很多初创企业出来,从百度分出来的公司十家都不止,大部分公司是围绕自动驾驶算法展开研发,但在这个时代我们要注意到一点,单单有算法是不是能够真正意义上落实?我们看到绝大部分的初创公司都在英伟达TPU做开发,为什么这样?因为他在TPU平台最成熟。但这带来一个问题,同质化的竞争不可避免,真正的话语权事实上还掌握在英伟达手里面。更进一步的来讲,这样的平台是不是能真正的做好自动驾驶?大家可以看到,在低等级的L2领域,70%的市场份额是Mobileye不是英伟达,因为Mobileye是把算法和架构结合在了一起。所以这也反映了一点,如果没有把自动驾驶处理器做好,从算法开始驱动构架建设,然后打造一款极致的解决方案。

今年的图灵奖第一次颁发给计算机构架的两位学者:John、David。John是谷歌董事长、David是谷歌TPU研发专家。过去图灵奖绝大部分颁发给编译器、程序员,为什么第一次图灵奖会颁发给处理器构架的学者?因为他知道现在单单靠软件不够,必须把构架和算法结合在一起,才能打造一个极致的处理器,效能才会最好。

过去我们看到深度学习的计算平台发展,从CPU、GPU、FPGA到订制化的都是从这个里面走的BPU,地平线也是忠实的实践者,去年推出了第一款人工智能处理器。

这是Autopilot2.5版本,可以看到有两个水管是用来散热的,很难想象过去仅仅是一块电路板分散就够了,甚至不需要分散,而到达AI时代需要水冷。但是水冷的后果也是严重的,也就是说它会带来额外的稳定性负担,你能够在时间的维度上持续保证水冷可靠运行其实是巨大的挑战。这促使我们反思,如果我们要去打造一款真正符合汽车环境领域的自动驾驶处理器,我们就必须关注能耗。事实上现在自动驾驶的实验是高等级的,它的计算平台整个服务超过一台典型的家用空调,可以想想电动车上面背着家用空调,这个对续航里程有多大的考验。

在过去10-15年间整个地方工业驱动力事实上来自于手机,但现在我们看到随着自动驾驶的高速发展,对自动驾驶处理器的要求已经远远超过手机无论是在算例对实时性的要求、可靠性的要求以及对安全性的要求,或者全面的移动通讯应用。这一点提出了新的挑战,整个计算业界传来最大的应用就是自动驾驶应用。

这是现在已经有的最典型的人工智能处理器,人工智能芯片的成功应用案例。我们特别能够感受到一点,各个业界之间算例之间差别巨大,有不到1个TOPS,有超过300个TOPS,不管算例如何巨大都完成了特定的产品。比如苹果就完成了人脸识别。这就给我们提出一个启发,面对一个产品其实通用的处理器是不完善的,我们需要专业的处理器应对专业的问题,自动驾驶是封闭产品的,必须要打造专业的处理器,这也是地平线的目标。

这里有更加量化的指标,可以看到地平线自己的第二代GPU跟英伟达GPU效果的对比,过去老的算法上面我们GPU提升是他们的5倍,而现在可以达到100倍。如果要把你的算法效能发挥到极至必须要做对应的构架才能大幅度提升它的性能。

地平线计算构架的宽图,我们采用了非常复杂的异构多指令、多数据的计算架构,这个非常复杂,如何协调单元和吞吐的关系,都是非常有挑战性的。简而言之,这里面反映了一点,算法和构架要同步去处理。

这里有一个清晰的动画可以展示出来,底下是存储,上面是运算单元,必须要精准的匹配才能做到效能的最优。好比流水线上传送带和工人的关系,传送带太快还是太慢,或者工人太快或者太慢都使流水线上的传输受到影响,最完美的是传送带和工人的速度做到匹配。

地平线针对自动驾驶处理器做什么样的功能?这里面有直观的体现:感知、决策和中间建模。对于传统汽车行业来讲我们一直抱着敬畏的心态,做你擅长的东西,不擅长的东西跟传统汽车行业的老板去配合,这样最高效。谈到决策,很多人觉得基于规则的决策系统就够了,事实上对于高等级的自动驾驶一定要用AI的技术去解决,因为人工智能的适应性比规则系统要广泛得多,这也带来一个问题,他事实上对算例要求很高。过去在谷歌AlphaGo是180个TOPS支撑,但围棋规则是固定的,所有的信息全透明完备,但是对于驾驶产品来讲事实上我们面临的场景非常复杂,不完备的信息获取,300个博弈主体、不确定的规则,使得这样的事情变得更加艰难,这就要求我们要有更大的算例。

所以地平线在处理其构架方面也有三代:第一代高斯构架去年已经推出,面向低等级的构架感知;第二代贝努利构架,今年也发布了这个平台;第三代贝叶斯构架,面对复杂的网络问题,这是真正意义上的挑战。

第一代产品,地平线是一家面向解决方案的公司,而不是简单的提供芯片公司,我们的理念是用自己的经验把完整的产品做出来,这样的优势在于可以极大的缩短从芯片找到产品的时间,这对于一个芯片数的开发来说至关重要,如果你直接把芯片给到客户,事实上你要求客户有足够对AI的理解能力才能把这个用起来,这实际上是地壳的模式,现在市场上并没有很多客户对AI芯片有足够的了解。

这是更加直观的对比,地平线芯片和英伟达智能摄像机的对比。这里清晰的看到,专业的处理器相对于通讯处理器来讲效能有多大的提升,非常明显。

第一代处理器和第二代处理器效能上面的对比,可以看到第二代处理器已经从第一代检测框进行了整个轮廓的识别,这实际上对每个图像进行了分割,所以它更加清楚。

这是加州路测的结果,整个环境无论是填空还是路面以及移动目标全都被准确识别,而且即使在车辆高速遮挡的情况下也能准确的识别,这是传统的检测框很难做到的。

更具挑战性的产品是在城市规划上,高密集的人流是不是能准确的识别,这里给出了很好的答案,甚至可以把人体的外骨骼描绘出来,这对行人的预测有了很好的基础。

总体来看,我们认为未来的趋势就是对全场景的理解能力,对于象素级的感知能力。

地平线的目标就是通过算法和计算构架的结合,打造极致的自动驾驶芯片,能够在这样一个自动驾驶主战场发出自己的声音,我们的目标是希望到2025年为3000辆车装上自己的处理器,谢谢大家!