个人信息不会泄露给第三方
随着人工智能的发展,发端于上个世纪70年代的自动驾驶技术,在近年以来备受关注、迅速发展。Google、苹果、 Uber、百度等科技公司,NVIDIA、Intel等芯片厂商,丰田、宝马、沃尔沃、日产、福特、通用、戴勒姆、奥迪、丰田、现代、Tesla等新老车厂都已入局。这个领域的创业公司,诸如Otto、Cruise Automation、Lytx、NuTonomy 、 Comma.ai 、Civil Maps 、FiveAI、Navya、Itseez、地平线、驭势、图森等均已获得融资。
国内另一家创业公司Momenta,想要利用深度学习技术研发实时环境感知、高精度地图,以及自动驾驶决策算法,打造自动驾驶的大脑,目前已经完成500万美元A轮融资, 蓝湖资本领投,创新工场、真格跟投。
本质上,驾驶决策就是道路环境到驾驶行为的映射,通俗的说就是这种情况应该怎么开,那种情况应该怎么开。基于目前的深度学习技术,如果获得海量的环境和行为数据,就可以并让机器学会无人驾驶决策。这其中,获得海量的环境与行为数据,并有能力让机器学习并学会这些数据就是两个关键。
目前,环境数据的获得主要有两种方式,一种是高精度雷达,也是Google、百度无人车等采用的方式,但是造价昂贵,一种是通过计算机视觉,成本相对低廉,但对算法要求更高。Momenta 的团队有多年计算机视觉方向的研究经验,采用了后一种方案,高精度雷达仅作为补充。因为团队在算法方面的优势,最终的方案即使使用普通摄像头,也可以达到市面同等效果。
一般来说,一套比人更加安全的无人驾驶的系统需要测试的总里程达到1000亿公里,按照一辆车一年10万公里总里程计算,也需要100万辆车一整年的时间,成本高昂。即使Google,从2009年开始研发测试,目前也只进行了500万公里里程的测试。如果要自己造车、控制车来搜集数据,也需要一笔不小的投入。
Momenta 则通过众包来解决这一难题。不同于Tesla直接使用真实车辆进行众包测试,Momenta 设想在目前已有的运营车辆上安装数据采集的设备,收集路上的环境数据、司机的驾驶行为数据。
这些数据,除了解决高精度地图的生成问题,不仅算法适用于实时环境感知,也提供了驾驶决策训练的可能。原理上来说,Momenta 的模型可以预测驾驶轨迹,也记录了真实驾驶轨迹,所以预测轨迹和真实轨迹进行比对,如果一致,说明测试通过,如果不一致,说明测试失败,找到问题,重新进行训练。
CEO 曹旭东告诉36氪,之所以选择这种方式,一是避免了可能造成的致命事故,更加安全;二是不需要造车、改车、控制车,可以降低前期经济投入。
视频数据信息量大,在收集到了足够训练的数据后,如何处理并学习这些数据也是一个难题,这也是Momenta 的竞争力之一。Momenta团队中有不少深度学习专家,基本都是来自清华大学、麻省理工学院、微软亚洲研究院,包括了图像识别领域知名框架Faster R-CNN和ResNet的作者,ImageNet 2015、MS COCO Challenge 2015多项比赛冠军。
在数据处理方面,目前团队主要通过非监督、算法辅助、渲染生成等方式生产大量标注数据,同时还在构建的标注平台可以把标注成本降低到市面价格的1/3~1/4。
在训练模型方面,Momenta并没有采用目前常见的ResNet、GoogleNet、VGGNet等常见的深度学习模型,而是自己设计了新的深度学习模型,通过设计模型结构、训练过程、学习目标等,将模型提速10~100倍,模型压缩100倍,精度几乎不受损失。
在计算力方面,搭建了数百块GPU组成的训练平台,保证算法实验及产品迭代的速度。虽然有钱就可以买到GPU,但如何提升GPU集群性能也是一个难点。这方面,团队的孙刚此前曾在百度工作,2015年1月参与设计了包含144块GPU的深度学习训练系统“Minwa超级计算机”,是当时世界上第一个用大规模GPU集群做深度学习的系统。
Momenta未来的产品将包括硬件、软件算法、云端部分。硬件部分与其他厂商合作完成,集成了团队自己研发的自动驾驶决策算法,云端有高精度地图可供调用。不过,团队表示,出于竞争的考虑,暂时不方便透露算法、项目方面的进展及未来具体规划。
CEO曹旭东毕业于清华大学,曾先后任职于微软亚洲研究院和商汤科技,有近百人研发团队管理经验、产品落地经验,对无人驾驶环境感知,高精地图,驾驶决策有长时间研究。研发总监任少卿,是中国科技大学与微软亚洲研究院联合培养博士,提出适用于物体检测的高效框架Faster RCNN和图像识别算法ResNet,后者相关论文于2016年获得计算机视觉领域顶级会议CVPR 的Best Paper Award。
这种使用深度学习技术做高精度地图及驾驶决策的方案,很容易让人想到comma.ai,后者的产品前段时间刚刚被美国交通部叫停。曹旭东认为,双方其实并不相同。comma.ai 与NVIDIA类似,学习的是摄像头输入到刹车油门方向盘输出的直接映射,需要大量额外数据和计算,当更换车辆时还需要重新学习。因此,团队选择了先将这些复杂问题进行拆解,拆解成一系列子问题,再通过端到端深度学习解决,避免了上述问题,并提高了学习效果。
基于高精度地图的自动驾驶近期进展很快。美国方面,Google无人车的方案中包括了Google Map;Uber投资5亿美元开发全球地图,并与Digital Globe达成合作,以摆脱对Google的依赖;通用汽车投资了高精度地图初创公司Civil Maps。欧洲方面,宝马、戴姆勒、奥迪一起收购了Here地图;TomTom与博世合作研发适用于自动驾驶的地图;NDS协会也在推动高精度地图标准。亚洲方面,日本多家车厂及地图制作商Zenrin正在推动名为“Dynamic Map Planning”的项目,为东京奥运会自动驾驶服务提供支持。国内百度、高德、四维图新、光庭等也都开始了高精度地图的研究。
(文章来源:36氪)