如果说2022年是Robotaxi商业化元年,那么8月就是第一年的1月。
8月1日,中国首部智能网联汽车管理条例在深圳正式生效,深圳成为首个允许全无人驾驶自动驾驶汽车上路的城市。过去十年,开创性的公司和资本在自动驾驶的研发上投入了大量的资金,都是在赌一个节点。对于自动驾驶这样的高爆行业来说,虽然前期漫长,但到达落地拐点后的结果将是一场盛宴。深圳在立法层面做出的这一举措无疑是一大亮点。
这个立法能给局里的公司带来什么?还有哪些问题没有解决?8月,36Kr在深圳测试了市民经常在路上看到的自动驾驶汽车,并可以预约试运营。他也来自总部位于深圳的荣源七星公司,并与他的副总裁兼合伙人刘璇讨论了自动驾驶目前的发展方向。
在他看来,这次试运营不同于以往所有路测的里程碑意义在于两点:1。立法,2。一个人都没有。前者赋予自动驾驶合法性,后者赋予自动驾驶算法系统更真实的“养料”。之前的路测有很多局限性:主驾驶载人,测试路段有限……有限条件下的自动驾驶路测显然无法为真正落地提供足够有力的支撑。
没有人有另一个重要的价值:商业模式帐户可以更容易地计算。改装的硬件成本使得Robotaxi本身比传统出租车更贵。如果要求安全员节约司机成本,一个比出租车还贵的Robotaxi很难落地。
合法获得无人驾驶的牌照后,自动驾驶公司接下来要解决的问题就是硬件成本。成本越低,无人驾驶公司越容易被主机厂和运营平台接受,钱越多,能积累的数据就越多。荣源的答案是前装的量产计划,去年发布,将改装价格降至1万美元以下。
在试驾现场,我们看到,与大多数自动驾驶道路测试车不同的是,搭载荣源L4方案的汽车顶部没有凸起的雷达,而是在车身内嵌了一个传感器;汽车后备箱不再有一个大黑匣子,里面有工业电脑和散热平台,汽车的计算平台也“瘦身”成一个小盒子,里面有两个NVIDIA Orin芯片。
刘璇告诉36Kr,制约前置设备量产的因素有两个,一个是成本,一个是功耗。在成本方面,他们通过更换激光雷达,抛弃了之前业界普遍使用的机械式激光雷达,转而选择固态激光雷达来解决。固态激光雷达的点云虽然不如机械激光雷达清晰,但价格只有前者的1/50,毁伤率低。在公司研发的多传感器融合感知算法系统中,仍然可以清晰感知周围200m以上的物体。在功耗方面,该公司自主研发的推理引擎将计算速度提高了6倍,支持高级自动驾驶系统在整体功耗仅为150瓦的计算平台上运行。
以我们试驾的车为例。原车是樊菲漫威R,市场价21-27万左右。荣源改装后在路上的费用大概在30万左右。相比很多滴滴司机选择的比亚迪E6,上路价格要30万起。
对成本的重视贯穿了这家自动驾驶公司的每一个动作。这家公司成立于2019年,主营业务有两项:自动驾驶乘用车和自动驾驶轻型卡车。在自动驾驶轻型卡车业务方面,荣源七星与德邦合作,提供同城货运代理服务。刘璇告诉36Kr,自动驾驶轻型卡车与Robotaxi的技术栈和应用场景类似,操作经验可以在Robotaxi上重复使用,这意味着不需要再进行研发支出。
除了政策成本,我们还和刘璇谈了一些关于Robotaxi的争论,比如驾驶数据馈送系统之外是否存在路径,深度学习的黑匣子是否是制约自动驾驶的核心因素,以及近年来流行的驾驶距离竞赛是否有意义等。对于自动驾驶来说,在到达临界点之前,必然是一条错误的道路,伴随着无数的争论。这条路可能只有一个路标:低成本,多落地,优质生存。
以下是36Kr与荣源的对话:
36Kr:这项立法在业界引起了很大反响。这次立法和之前路考有什么区别?
刘璇:这是深圳第一次从立法的角度允许真正无人驾驶的自动驾驶道路测试。我认为它仍然是一个非常重要的里程碑。更何况我们上路的是用户能接受成本的车,而不是三四百万成本的实验车。普通用户有可能在未来两年内买到。
36Kr:成本是自动驾驶的一大话题。你是怎么做到的?
刘璇:最重要的是前期大规模生产。主要指三个方面。第一个方面是使用可以在量产车上使用的汽车仪表传感器。我们使用了固态激光雷达,加上一个融合传感系统,如相机。
其次,我们使用的是汽车标准的计算平台,比如功耗更低,价格更便宜的计算芯片,比如英伟达的Orin,华为的MDC。以前整个后备箱都是密密麻麻的设备。现在新能源汽车有里程焦虑,大家都不想把电都算进去。我们公司通过自主研发的AI推进引擎可以将我们的计算速度提高6倍。
第三个方面是适应量产的高精地图。
以上三点结合起来,可以称之为一个可以预装量产的L4。其成本低,在用户可接受的范围内。控制功耗和成本,这和过去老的自动驾驶有本质区别。
36Kr: Robotaxi经常使用机械激光雷达。为什么用固态?
刘璇:传统的旋转式机械激光雷达成本非常昂贵,单台可能要几十万人民币。而且因为是机械结构,可靠性不是特别好。如果传感器必须两年更换一次,用户肯定不会为此买单。
固态激光雷达的云成像质量稍弱。我们在软件和算法上做了很多优化。用更弱更便宜的传感器,探测距离并不比以前的机械激光雷达弱,甚至可能更远更安全。
36Kr:软件弥补硬件是经典路径。在雷达感知上是怎么做到的?
刘璇:我们团队率先在自动驾驶行业提出多传感器融合技术。我们在原始层面融合激光雷达、相机等不同的传感器数据,类似于将其等效为一个超级传感器。比如激光雷达可以带来3D位置信息,相机可以带来与色彩能力相关的信息。这些融合在一起就是一个高维的数据,每个传感器只起到其中的一部分作用。我们可以利用这个深度神经网络更好地进行准确识别。
36Kr:荣源的推理引擎可以比主流框架快6倍,而且成本更低。它是怎么做到的?
刘璇:深度学习一般分为两个阶段。第一阶段是线下训练,第二阶段是线上推理。更重要的是在线推理。我们必须保证它足够快,足够高效,功耗要尽可能低。
我们重写了一个深度学习的推理系统,优化了自动驾驶的模型。在业界被广泛用于一些通用的深度学习框架,比如人脸识别或者带深度学习的动物识别。
但是对于自动驾驶,我们只需要支持自动驾驶特定任务的深度学习框架。在多传感器融合模式下,该框架能够准确检测出这些障碍物的大小、尺寸和速度。如何预测他们应该如何行动,他们下一步应该做什么,以及如何做出决定。
我们可以忽略这些通用深度学习框架中多余的东西,然后针对具体的任务,将它们共有的一些重复性工作进行组合压缩。相当于现在一步,过去可能相当于五六步。
36Kr:实现预组装量产的最大意义是什么?
刘璇:前装量产最大的意义在于,我们把渐进式和跳跃式结合起来,只保留他们的优势。我们的算法能力和leap L4一样,可以安装在用户在一线城市闹市区高峰期可以买到的量产车上,不用人接手。同时,我们的成本和渐进的成本是一样的。
这样我就可以把这两条路线的优点结合起来。跃进的好处是算法强,也就是足够安全。渐进式的好处是,它是一个产品,用户可以帮我积累数据。
36Kr:目前自动驾驶的核心壁垒是数据馈给的需要,但很多人也在等待深度学习黑匣子的突破。
刘璇:以城市中的乘用车或者轻卡来说,场景足够复杂,现阶段的水平足以帮助用户解决很多问题。所以我觉得没必要等到深度学习的下一次大规模突破。其实已经有很多产品可以应用了,未来2~3年可能就是这种形式。
另一方面,自动驾驶是一个非常复杂的系统,深度学习对于自动驾驶非常重要,但是自动驾驶并不完全依赖于深度学习。其实我们很多人也会用到强化学习和博弈论之类的决策优化,等等。它可以解决一些关键问题,但还是需要很多其他算法,然后不断迭代才能一起做好。这是一个复杂的系统,而且必须符合木桶理论,质量由最弱的一个决定。
36Kr:自动驾驶模拟系统能否解决大规模数据采集问题?
刘璇:难以采集或成本较高的场景可以在模拟系统中进行测试,这可以帮助我们的算法改善迭代。
但是,如果真的要通过这些数据来论证我们算法的安全性,从而加速法律法规的实施,我觉得模拟系统很难有说服力。你自己搭建一个仿真系统,算法在里面运行良好,在外界看来没有说服力。除非有可信的第三方搭建的仿真系统,否则这个方案实际上很难实施。
36Kr:自动驾驶行业有刷路测里程的倾向。这些数据的价值是什么?
刘璇:不同自动驾驶公司积累的里程数据没有可比性。因为每个人的跑步场景完全不一样。就像人一样,能在市中心开就能在郊区和农村开,反之就不一定了。
另一方面,算法是否足够激进,测试效率是否足够高?举个例子,如果我的算法像一个新手司机,在路上特别谨慎,只要有人过来我就躲开。其实对于算法来说没有太大意义,所以我一定要能和别人打通游戏。
在中国的一线城市,不同城市的交通模式和行为差异很大。比如北京和上海、深圳开车的差别其实是很大的。所以,如何建立国家乃至全球的标准,目前来看绝对不是一件简单的事情。
36Kr:在重型卡车和轻型卡车之间,为什么荣源选择了轻型卡车?
刘璇:轻型卡车的长度、尺寸和场景更接近于乘用车。城市中开阔的道路,有红绿灯、行人、自行车、外卖骑手等非常复杂的场景。所以两者的技术相似度很高,我们可以复用这个技术。
轻卡和重卡的区别会大很多。这两个车牌是不同的。其次,它运行的场景多为干线公路:高速、重载,所以它的刹车距离会很长,这就要求它的感知距离足够远。而民用激光雷达的最佳灵敏度是200米,这是由物理特性决定的。
另一方面,重卡载重量大,相对来说比乘用车更难控制。另外他可能戴着,周围盲区大,会需要更多的传感器。一旦有了足够多的传感器,计算平台肯定需要更多的芯片,计算中会涉及到一些同步问题。所以从技术角度来说,它的差异其实是很大的。