2018年,百度发布了大规模自动驾驶数据集Apollo Scape,并宣布加入加州大学伯克利DeepDrive深度学习自动驾驶产业联盟(Berkeley DeepDrive)。在还未干掉老牌数据集KITTI和NuScenes当下,百度又面前出现了一位更强大的新对手——Waymo。
美国西部时间6月16日,在加州长滩市举办的“2019计算机视觉和模式识别大会”(Computer Vision and Pattern Recognition 2019,CVPR 2019)大会上,Alphabet旗下自动驾驶公司Waymo发布了其对外开放的用于自动驾驶的新型高质量多模式传感器数据集,命名为“Waymo开放数据集”(Waymo Open Dataset)。
开放数据集,Waymo完成战略转型
Waymo首席科学家Drago Anguelov在CVPR 2019自动驾驶研讨会上的演讲中表示,像KITTI这样的传统开源数据集对于当今领先的自动驾驶公司来说太小了,这将迫使研究人员和工程师花费大量时间进行数据增强和防止数据过度拟合。此外,他还认为,KITTI的算法结果无法推广到大型数据集。
基于上述情况,Waymo最终决定自己创建数据集。Anguelov强调,基准数据集对自动驾驶技术的发展至关重要,“Waymo开放数据集”未来将应用于外部的学术研究和实验测试领域,该公司将会受益于基于数据集发展出的、超越其技术标准的全新技术模型。
(Waymo开放数据集的数据搜集车,图片来自syncedreview)
根据规划,Waymo将在7月发布包含1000个视频的第一部分数据集,并在不久的将来发布更多数据集。Anguelov表示,该公司还将发布自身的标准并组织相关竞赛。“Waymo开放数据集”的发布标志着Waymo公司在战略层面已经完成了从“闭门造车”到“拥抱开放”的转变。
自2009年成立以来,Waymo的自动驾驶技术一直依靠内部开发,而这已足以支撑其成为行业最顶尖的自动驾驶技术公司。随着其转型开源式研发,该公司今后的发展脚步或将继续加快。
同样是数据集,Waymo究竟强在哪儿?
“Waymo开放数据集”包含大约3000个驱动场景、时长为16.7小时的视频数据。该视频共计60万帧,大约2500万个3D边界框和2200万个2D边界框。Waymo的数据采集自动驾驶汽车上的传感器包括5个激光雷达、5个摄像头和一些未公开的雷达。Anguelov还强调,Waymo在雷达与相机同步方面比KITTI或NuScenes做得更好。
(Waymo开放数据集的数据情况,图片来自syncedreview)
全球成立最早的自动驾驶数据集为发布于2009年的KITTI数据集。该数据集由德国卡尔斯鲁厄理工学院和芝加哥丰田技术学院联合创办,其数据规模曾长期位居业内第一。该数据集的每张图象最多显示15辆汽车和30名行人。
BDD100K数据集由加州大学伯克利分校于2018年发布,这是目前来说最大规模也是最多样化的驾驶视频数据集,这些数据具有四个主要特征:大规模、多样化、在真实的街道采集、带有时间信息。该数据集有累计超过1100小时驾驶体验的超过10万个高清视频序列,每个视频以30帧每秒的速度运行40秒。
百度的Apollo Scape数据集提供的图像分辨率为3384×2710,定义了共26个不同语义项的数据实例(例如汽车、自行车、行人、建筑、路灯等),而且将进一步涵盖更复杂的环境、天气和交通状况等。Apollo Scape数据集包含20万帧的图像数据,包含对应的像素级标注和姿态信息,数据量是KITTI和CityScapes的10倍。此外,整个数据集包含逐像素标注的高分辨率图像序列,以及场景语义分割级别的稠密3D Point的RGB视频。
显然,与上述对手相比,Waymo开放数据集在数据量和运算速率方面拥有一定优势。此外,据Anguelov介绍,“Waymo开放数据集”还在数据多样性方面有所升级,将天气、行人、光线、骑车人和建筑等变量也考虑在内。
百度们“方”了吗?
在自动驾驶行业,Waymo已经于2018年开启L4级自动驾驶的商业化运营,而百度等绝大多数企业的商业化最多也仅停留在简单场景的L3领域。相较于Waymo,百度Apollo此前最大的优势就在于更懂中国市场和“开放”平台之后带来的强大伙伴和海量数据。
在百度等企业还未实现超越的当下,Waymo便已开始走上“开源”的道路,这些对手的开放优势可能会被快速抹平。除了“Waymo开放数据集”针对现有数据集的优化外,Waymo还有长期以来在自动驾驶行业的领跑地位,将会为其吸引到更多合作伙伴。
与此同时,百度、小马智行和文远知行等中国自动驾驶企业长期以来引以为傲的“更了解中国市场和中国路况”并未转化成更优秀的商业化产品。而Waymo已经于2018年在上海注册了公司,随着Waymo在中国市场的逐步发力,百度等企业的所谓的“本土化”优势将越来越小。
在未来的自动驾驶大战中,百度和其他竞争对手又将采取何种措施来应对这一“灭霸”级的强者?除了“中国优势”之外,百度、小马智行和文远知行这样的本土企业还有哪些能力与Waymo匹敌呢?