作者|维克多
编辑|穆青2021年12月9日,由粤港澳大湾区人工智能与机器人联合会和雷锋网联合举办的第六届全球人工智能与机器人大会。com,在深圳正式开业。140多位业界和高校领袖、30位Fellow齐聚一堂,以理性分析和感性洞察为轴心,共同攀登人工智能和数字化的高峰。
第二天,四儿实验室主任、深圳市人工智能与机器人研究所原执行所长、国际欧亚科学院院士乔春明·李世鹏在GAIR大会上做了“人工智能与机器人前沿研究的思考”的演讲。乔春明师鹏博士,国际欧亚科学院院士。历任深圳人工智能与机器人研究院首席科学家、执行院长,科大讯飞集团副总裁,讯飞研究院联席院长,微软亚洲研究院创始成员、副院长。李院士在多媒体、物联网、人工智能等领域颇具影响力。他拥有203项美国专利,发表了330多篇被引用的论文。被Guide2Research列为全球前1000名计算机科学家之一。培养四名麻省理工学院TR35创新奖获得者。是新一代人工智能产业技术创新战略联盟的发起人之一和联席秘书长。演讲中,李世鹏介绍并展望了人工智能和机器人学的前沿研究方向。他指出,未来机器学习突破深度学习的数据瓶颈,可能会借助认知科学的手段来突破,学习范式可以从依靠“大数据”转变为依靠“大规则”;人机合作也要演变成人机“和谐”。只有将耦合、交互、增强、互补的目标纳入研究方向,才能实现人机的无缝连接。以下是演讲全文。《AI科技评论》在不改变初衷的情况下进行了梳理:今天演讲的题目是“人工智能与机器人前沿研究的思考”,分为三个部分。先说一下人工智能和机器人研究的全景,然后重点介绍研究方向,包括机器学习、运动智能、人机和谐、群体合作;最后做个总结。AI相关研究有三个关键要素:人、机器人/物联网和AI。之所以把机器人和物联网归为一类,是因为它们是物理世界和虚拟世界的接口。如果这三个要素成对连接起来,就会形成一个新的学科。比如机器人和AI结合会产生智能体,AI和人类结合会产生人机耦合,增强智能,机器人和人类结合会形成增强体。随着人工智能和机器人技术的发展,研究对象不再局限于单个智能体,而是越来越多的研究多智能体的协作,比如如何更好地整合人类社会群体。如何设计一组可以巧妙协作的机器?
总的来说,我认为重要的基础研究方向是:机器学习、运动智能、人机协调和群体合作。一
专注于机器学习
学习的发展离不开深度学习的加持,深度学习为业界带来诸多研究成果,赋能语音识别、人脸识别、物体识别、自动驾驶等。,推动了人工智能产业的快速发展。虽然成果颇丰,但成功是萧何的失败也是萧何的失败。深度学习依赖于大数据,其瓶颈在于大数据。比如国内智能语音技术虽然处于行业领先地位,但还是要靠技术积累和数据积累。现在要想让深度学习发挥巨大的威力,还需要大量的数据加持。如果想让深度学习从一个领域扩展到另一个领域,还需要数据支持。如何突破?研究人员探索了许多路径,其中一个解决方案是扩展深度学习框架。比如优化深度学习算法,知识图谱+深度学习,专家系统+深度学习等等。另一条路径是因果推理,其目标是借助人类举一反三的能力,超越数据之间的相关性,进而探究数据之间的因果关系,从而获得数据之间的逻辑推理。
第三条路径是类脑计算(brain like computing),从生物学的角度探索人脑的认知要素和机制,通过模拟再现人脑。个人认知科学是突破深度学习框架的关键点。究其原因,人类认知的过程中有两点是我们需要借鉴的:生而为人,学而为人。出生知识是指某些认知能力是天生的,新生儿的脑神经有很多先天的联系。它给我们的启示是,目前的深度学习算法大多是从零开始训练的,但没有充分或高效地利用先验知识或已有的模型。如何利用“已有知识”是深度学习的下一个热门方向。学习是指大部分认知能力都是后天获得的,尤其是早期学习。通过学习脑神经,建立更多的联系。很多孩子的能力,包括感知、应对、语言、阅读、写作、理解,甚至分析问题、解决问题的思路和能力,在很小的时候就已经基本成型;未来基本上是知识的积累。这意味着大脑神经元在早期就被连接和塑造成一个元模型,剩下的只是利用这个元模型来解决特定领域的问题。和现在大规模的前期训练模式惊人的相似。另一个层面的学习知识是,人类的学习过程依赖于多源、多传感器、多模态、多角度的数据,比如视觉、听觉、嗅觉、触觉和上下文的联合信息,而今天的深度学习大多依赖于一段语音和一张照片。所以未来AI模型的输入数据可能不仅仅是单一的数据,而是多个信号源的融合。如何模仿人类学习的过程,是认知科学对深度学习的又一个启示。再者,人的学习过程是一个从样本实例到原理归纳的过程,而不是仅仅停留在样本实例的层面;目前深度学习都是在样本层面。那么,未来是否可以构造一个人形的机器学习框架,无论输入什么样的数据,只要逻辑相通,就会收敛到一致的模型?要突破深度学习的数据瓶颈,可以尝试构建一个规则的众包体系,让人类来教授机器学习的过程。它的目的不是输入数据,而是让机器学习规则。当我们试图从日常活动中学习规则时,普通人可以标记并教授这些规则,这打破了过去专家系统地需要“专家”的限制。这种从“大数据”到“大规则”的模型构建模式,显然更符合人类的认知。2聚焦方向的运动智能
众所周知,在机器人领域,波士顿动力的产品是最“像人”的。如上图所示,机器人跳舞时感觉不到吃力。但受限于计算资源、能量和运动控制,只能运行几十分钟。波士顿动力机器人的运行方式实际上是基于电机驱动的,存在很多缺点,如运动刚性大、重量相对较重、反应速度与灵活性矛盾、能耗高等。与人类和其他动物的操作方式相比,肌肉、骨骼、传感和神经的结合可以实现低能耗的灵活操作。给科研人员的启发是,机器人的操作系统要像人类一样令人满意:高效、灵活、准确、健壮、灵活、轻便、适应性等指标。现在的运动智能可能在某个维度上很优秀,但是综合考虑还是有很多不足。
因此,运动智能的一个重要研究方向就是仿生。模仿动物的运动智能,比如运动控制采用接近反馈式,可以根据变化随时灵活调整运动过程。如果说机器人是由“内力”驱动的,那么医用微纳机器人就是“外力”研究方向的代表。例如,依靠磁力,一个小型机器人可以准确地将药物从一个管道运输到另一个管道。3聚焦方向的人机和谐
在人机协调的层面,它不同于合作。“协调”就是人机合作中的耦合、互动、增强、互补、合作、和谐。人机交互的目标是机器无需告诉人类就能理解人类的意图,从而实现人机的无缝连接。在实现人机和谐的过程中,我们注重人机的自然交互、感知和增强。可能包括:生物特征检测与识别、人机接口、脑机接口、语音识别、动作识别、表情识别、语言理解、意图理解、姿态感知、无缝增强,以及增强现实和远程现实的延伸等。在增强人机智能方面,现在的机器学习框架大多是基于大数据的深度学习框架,肯定会出现机器智能处理不了的情况。这对于一些高风险领域是致命的,比如自动驾驶和金融。解决这个问题,目前的解决方案是“人为接管”。这将涉及三个核心问题:核心问题1:机器智能如何感知到自己无法处理一些情况,却要求人接手?核心问题二:人类什么时候可以完全放开机器独立完成任务?
核心问题三:什么样的人机交互设计才能充分发挥人和机器各自的长处,而不会无谓地互相打扰?
如果不能解决三个核心问题,就会导致一些困难。比如,以自动驾驶为例。目前安全员并不是一劳永逸的开启“自动”功能。他们还需要时不时的监控路况和路线,一刻也不能分心。这其实增加了安全员的负担,因为在没有自动驾驶的时候,人类会对自己的驾驶环境有一定的预测,而机器驾驶的情况是人类无法预测的。人机身体增强也是人机和谐的一个领域,可以帮助人类增强身体能力,完成一些人类身体上无法完成的事情。但是机器可能太复杂了,需要人训练才能操作。增强人机体的未来目标是实现人与机器的和谐共处,操控像人自身器官一样自然。其中,涉及的核心研究课题包括:机器感知人的意图、人的手势、理解人的自然语言命令、肢体语言等。,让机器能够以最适合人类接受的流畅方式帮助人们解决问题。四注重群体协作。
目前单个智能体可以完成很多任务,但是如何发挥每个智能体的集体力量?这就涉及到群体协作的研究方向。在仓储场景中,抓取分类的机器人很多。如果能够有效地调度它们,工作效率将会大大提高。目前主流的调度方式是集中控制,但面对成千上万的agent,就需要分散控制,让agent在相互协作的同时自主行动,“做好自己的事情”。即能够独立行动的个体智能体,通过合作可以实现更高效的群体/系统智能和行为。目前agent-group协作涉及的规则有群体行为模型和激励机制、群体智能协作决策等。一方面,蚂蚁是我们的学习对象。此外,在自动驾驶方面,越来越多的自动驾驶机器人出现,它们之间如何实现协同感知和控制也是当今的热门话题。以上四个方面属于基础研究,任何一个领域的突破,对其领域和下游应用都将是革命性的突破,也会带来工业数字智能原创技术的创新,让我们在竞争中占据优势地位![/HR/]Leifeng.com·Leifeng.com