华先胜被业界公认为“视觉识别和视觉搜索领域的国际级权威学者",是国际电气与电子工程师协会会士,美国计算机协会杰出科学家,他一直倡导“无行业不AI”的理念。
在大会开始之前,AI科技评论有幸采访到华先胜博士,以下内容根据采访整理而成,并进行了不修改原意的编辑。
创建AI能力平台,实现规模化、全民化
AI创新的基本流程是从项目到产品到平台,即通过项目磨练的算法,算法沉淀产品,然后再将其平台化。平台实际上是把AI的能力平台化以后,能够让更多的人在AI平台上做创新。
“如果简单来讲AI平台,那就是三件事情。第一个是,AI算法+AI平台,我把它叫做‘AI中台’;第二个是算法所依赖的平台;第三个是支撑平台的算法。”平台本身也需要算法来支撑,比如调度、引擎都需要算法。
平台化后可以让更多人在平台上创新,解各行各业的问题,这样也会避免AI的从业者需要一个一个地深入行业,“如果真要AI专家一个一个地深入行业,可能大半辈子都要过去了”。
华博士特别指出这里所讲的平台不是研发平台。AI的研发平台有一定相对的通用性,通过研发平台研发出AI的能力。而AI的能力平台是生产或者服务平台,是指有什么能力以及这种能力是以什么样的方式运行的,与研发平台不是一个概念。
AI的能力平台可以用平台化的方式赋能更多的算法研发者和应用研发者在平台上做更多的创新、应用和业务拓展。这样会提高研发效率,使部署运维更为快捷、安全、稳定,可以让更多的人基于平台做应用,如智慧城市领域里面的厂家可以在不具备AI能力的情况下,只要有工程能力就可以基于平台做应用。
- 平台化的目标实际上是规模化和全民化
目前,除了对AI的学术研究以外,从业者做的更多的是技术研究、基础研究到应用落地。在落地方面要深入行业,但是每个行业都有domain知识,如果都让AI专家深入行业来做是没有办法实现规模化的,所以华博士提出要把AI平台化。即使不是AI工程师,有些情况下也可以做到低代码甚至是零代码的开发。因此更多领域和行业的IT工程师、软件开发工程师,甚至是行业的专家,都可以通过平台做AI能力的开发,AI在各行各业就可以实现落地的规模化。
另外一个词叫做全民化。它意思是让AI不要掌握在少数懂AI的人手里,能让更多的人使用AI,“实际上我们以平台化的方式实现规模化也是让它全民化”。
- 基于平台可以做更多事情
华博士列举了几个例子来说明:
“比如在做大规模城市的市政管理时,需要有大量的能力生成,通过平台就会比较快速的生成能力。”
“在工业视觉平台方面,虽然很早以前我们就发布了一个基础版本,但是我们一直都没有特别去讲它。一方面是认为我们对做的东西还没那么满意,第二方面市场也没有很ready,所以我们一直闷头在做。最近我们推出3.0版本就开始真正的推广它,甚至开始有培训课程。前不久,我们组织了第一期的培训课程,邀请工业视觉领域里做软件开发的企业来参加培训,培训后就可以利用我们的平台去做AI能力的生成,而不是做AI能力的使用。只要能够收集一些数据做些简单的标注,然后在该平台调一些参数的设置就可以自动训练出一个模型并且把它部署成一个服务,就可以直接在应用当中使用了。”
“现在有不少人在用这个平台去生产AI的能力,有一个公司用我们的平台生产新的视觉检测的能力,还有一个公司利用这个能力去做了一个茅台酒防伪标志的自动识别,他还把它做成了一个盒子,把酒放进去,一扫描就能识别出来的这个酒到底是真的还是假的,只要收集一些样本,通过我们这套系统就能把AI的能力生产出来了。”
华博士为“第三起”人工智能的发展划分了三个阶段。
第一个阶段是2012年前后,深度学习在解决问题上确确实实前进了一大步。华博士认为这个阶段人工智能给未来行业带来的影响可能会比较大,有可能所有的行业都会受到AI的影响。所以将这个阶段叫做“无行业不AI”。
“这是一个对未来非常乐观的预判,认为没有一个行业不受AI的影响。那个时候只是一些星星点点的尝试,确实在技术上迈出了很大一步。”
后来人工智能专家就开始做行业的落地,却发现解决实际问题还是要深入行业才可以解。有一些看上去好像已经解得很好的问题,但实际仍然存在大量问题。
因此华博士发现还要通过深入行业的数据场景来解决这一问题,进一步打磨人工智能算法模型,这是第二个阶段,也是目前大部分人所处的阶段。对于这一阶段华博士也将其叫做“无行业不AI”,但是对它的解释是不深入行业就没有AI的落地,深入行业来解决一个行业的问题,尽量创造核心价值。
华博士还表示这种模式大部分都是人工智能从业者在驱动。“一部分人做技术的研发,一部分人做应用的落地,大部分都是做人工智能的一部分然后推到各行各业中应用。我认为这种模式是很难实现规模化的。”华博士还举例说明了有少数是本身就是做场景的人去做人工智能的技术,比如淘宝。淘宝APP里面很多人工智能技术是自己完成的,像搜索引擎背后的人工智能技术也是自己完成的。
“我认为第三个阶段行业也应该更多的参与进来甚至起非常重要的作用。就像淘宝一样,淘宝自己做这个东西自己就把人工智能解了。其他行业不见得一定要像淘宝这样做,但是要知道自己需要什么,要解什么样的问题,需要怎样变革。不见得要知道AI的技术,但是要知道怎样去做这件事情,需要什么样的技术去解决什么样的问题,然后推动它的落地和变革。”
因此对第三阶段,华博士也把它叫做“无行业不AI”,但它的解释又发生变化了,即没有行业的深度参与就没有AI的遍地开花结果。
“前面讲的是‘落地’,现在讲的是‘遍地开花’。这个阶段对AI的从业者而言并不是降低要求,实际上是对AI从业者提出了更高的要求。那就是要把AI的能力做得更好,把它做平台化、把它的工具做好,这也是为什么我们要做平台化。我们的实践都是把AI平台化、AI的能力平台化,AI能力平台化包括AI算法本身以及AI算法所依赖运行或服务的平台。”
从平台走向系统
据华博士讲,早期有些情况下也会把平台叫做系统化,但系统实际上是一个更大的概念。可以说平台是系统的一部分。
“平台更多地强调这个东西能够为别人很好地再次使用,就像一个台子大家可以在上面表演”。
系统中有一部分功能是平台,可以让别人在上面做事情,但是系统本身还是一个统一整体。华博士从其它几个特性上来解释系统“比如说它能够自我进化,不断地演进”。
他向我们分享了最近在做的城市大脑,“我们要把它做成一个协同进化系统,也就是说我们把大脑的这一套系统部署出去以后,不但可以让别人在上面做二次开发、做创新,这个系统也会自我演变、自我进化,能够变得越来越好,至少不会变得越来越差”。
在整个场景不断地发生变化中,AI系统若不维护,就有可能就会变得越来越差。因此华博士认为系统相较于平台应该是“再往上走一个台阶”。华博士也特别提到这是他本人在他所讲的这个体系里面定义的平台和系统,“关于其他定义可能不见得是我讲的这个体系里面的”。
从平台走向系统,华博士希望通过系统能够实现某个领域里面相对通用的人工智能。华博士指的还不是通用的人工智能,“虽然现在学术界也在研究,包括一些非常知名的专家也在做,肯定是更通用的,但我觉得这条路可能会比较长,挑战还是很大的”。
所以华博士提出的是在某个领域里面比较通用的人工智能。他提到智慧城市里面,相对通用的人工智能的应用。“不是说只能解决一点问题其他问题解决不了,而是能够解决一大片的问题,并且能做到高精准、高效率和高覆盖,这也算是AI发展的一个进展”。
为什么要做系统?
近年来行业已经开始担忧深度学习遭遇算力瓶颈,比如有一篇文章就指出“将深度学习算法错误率减半,需要500倍的算力”,对此华博士给出了他的看法:
“这就是我为什么要去做系统的一个特别好的支撑。我们要提升三高,极高的准确率、极高的效率、极高的覆盖率,我上面提到我们也可以从算法层面来做。那就可能会遇到这样一些问题:瓶颈也比较高。我要用原来的这套思路将模型做得越来越好甚至越来越复杂、训练时间越来越长、数据越来越多,这就是一根筋的做法。那可能就会带来算力的问题,甚至算力都不见得能解的问题。”
近年来智慧城市里讲得更多的是交通和市政管理领域。据华博士分享,交通从过去一般的城市的事件、事故现在已进行到车路系统阶段。"车路系统是我们现在的一个重点,就是‘智能的车+智慧的路’。我们做的是从路测这一端来讲怎样让路测能够给车更高的质量,路测的信息能否赋予交通管理更多的能力,而车有自动驾驶系统是从车的一端做的”。
华博士举例子来说明车路系统:在成渝高速上就实现车路系统的应用。从路测上的传感器和飞行器基础的结果传给车,车不仅获取到自己视野里看到的信息,它能够看到全局的信息,这样可以很好地提升交通的安全性和通行的效率。
“我们认为未来的交通应该是车路协同的。这会涉及到很多视觉以及视觉与其他模态的融合,比如我们也会做毫米波雷达、激光雷达。这样会对路上信息的识别更为精准。还有我们在做城市的三维重建和城市的模拟,一个大型的场馆,比如体育馆或者是一个演唱会,可能会引起的交通和人流的战略性变化。我们可以进行模拟会不会出现各种各样的异常的事件,通过三维重建和三维模拟可以把场景近似的预测出来。”
据华博士所讲,未来的变化趋势是避免产生各种各样的意外。同时交通也可以做模拟,对交通的优化也会起到很好的作用。工业方向华博士团队很早以前就做过光伏电池、化纤纺织领域等。在医疗领域,华博士之前做了新冠肺炎CT的检测、骨科的测量、还有心脏血管的重建等一些单点的技术。
“我觉得比较可圈可点的是废钢的定级。废钢是钢铁炼钢中很重要的原料之一,但是废钢在收购的时候到底应该怎么定级。这其实既是一个比较危险又有一定随意性的问题,每个人定的可能都不太一样,没有一定的标准,有标准地执行的时候也会有很大的差异。行业里面一直没有解决这个问题,我们是第一个去解这个问题的。我们做到高达95%的准确率。还有扣重,因为里面可能有杂质,会出现应该扣掉多少这个问题,对此可达90%的准确率,可超过一个非常有经验的评估员。”
- AI落地的关键点
AI落地最关键的问题是寻找或创造不可替代的价值,即有没有创造不可替代的价值。
“今天更多的人还是停留在AI的能力深入行业这一部分。我想还是需要更多的人能够对AI长远一些的未来做一些思考,能够提前做一些准备,比如说平台化、系统化。还有一点是要从核心价值的角度来考虑有没有带来革新或者不可替代的价值。有时候技术有局限性,但这并不是代表它不能提供价值。比如说有些东西我做不到很高的准确率,但是并不代表它不能创造价值。因为创造价值不是从准确率上来讲的。今天只能做到这个样子的时候也不见得是不能创造价值的,比如说降低人力成本、时间成本、提升操作的安全性等都是不可替代的价值。实现的方法是平台化和系统化,算法当然是基础,这里不是说算法不重要,只是说我们如果只停留在算法这一层就可能很难实现规模化。”
关于使成熟的技术与用户需求相匹配华博士总结了三重境界。
第一层境界是深入行业,深入行业才能知道解什么样的问题才是对用户有价值的。华博士之前也讲过价值的三重境界:锦上添花、雪中送炭、无中生有。
“我们当时瞄准的是雪中送炭,就是把无中生有放在心里,实现了当然更好。现在主要是解决雪中送炭就可以了,或者叫做不可替代——AI产生的这个价值是不可替代。所以我们一定要深入行业、深入数据、深入场景、深入这个领域里面的核心问题”。
第二重境界是深入创新,这个时候解决的不仅仅是现有的核心问题,而是有了新的技术可以不限于行业中原来的流程、方法去做以前或者更多的事情。
第三重境界是自我协同进化。能够不断地让系统解决的越来越多的问题,并且精准度越来越高、效率越来越高,这样AI起到的作用更大。“前面我们还没有强调说它一定要起特别大的更广泛的作用,它只要专门解决其中的一个问题就行了,其它的问题有别的方式来解。但是如果说我们有AI的自我协同进化系统,也许它解的面会越来越宽,但这些还是在研发阶段”。
人工智能的规模化应用没有带来新风险
人工智能规模化的应用,会不会增加人工智能带来的风险呢?华博士是这样回答的:
“任何新技术使用,在带来便利的同时一定会带来一定的束缚。不仅是产业,包括我们每个人使用新的技术,比如说我们今天有电,那很多东西都依赖电,如果没有电了那很多事情也做不了,这个是没有办法的事情。我今天如果用人工智能,如果没有电了或者人工智能出了故障一定是会受影响的。”
华博士认为人工智能的规模化应用并没有带来新的问题,它带来的问题和过去电带来的问题、软件数字化带来的问题是没有本质区别的。解决方法就是像云计算一样提高它的可靠性,需要通过基础设施的保障,提高可用性和稳定性。人工智能系统在系统层面的稳定性、安全性和容错性这些方面也肯定是要考虑。
“这个是所有的软件系统都会面临的几个问题,不是AI自己带来的问题。但是有另外一个问题是AI自己的安全性的问题,这个也是非常重要的,比如说它会不会被欺骗。我们今天也做了一些研究,目前这还不是一个严重的问题,但是未来会是,这个也有很多人在做研究。这也是'道高一尺魔高一丈,道高十丈'这样一种博弈的过程,跟过去的病毒、网络、木马等等这些也没有本质区别,但也需要有法律法规的帮助,安全性其实一方面是技术,另一方面是法律法规。”
对AI长久发展的深思
华博士在采访最后表示希望此次大会能够听到更多的人分享前沿技术的创新。
“不管是工业界还是学术界,我对技术的创新和技术创新之后应用的落地和规模化我都关心,所以我会非常愿意看到更多技术创新的进展。另外我也想要看到更多在产业创新应用上可供借鉴的经验和案例。我也希望有更多的人不仅仅关心眼前的AI算法,能够抬起头来,和我们一起为AI的长久的发展做更多、更深入的思考和布局”。
在上述内容中,华先胜博士向我们展示了人工智能规模化应用的最新发展进程,同时也表达了对未来科技创新的期待。未来人工智能规模化的发展需要更多的人做深入思考,共同创造人工智能发展的美好愿景。
阿里巴巴一直非常重视科学研究的发展,也是本次CNCC大会的顶级赞助,与中国计算机协会(CCF)的合作也非常密切。今年阿里巴巴与CCF也联合推出了新的合作项目。
本文来自于微信公众号“AI科技评论”——“聚焦人工智能前沿研究,关注人工智能青年成长。”AI科技评论是专注人工智能(AI)学术和科学前沿的平台,前身是雷锋网的学术频道。
欢迎搜索关注微信公众号“AI科技评论”(ID:aitechtalk)了解更多相关报道。