产学用如何推动机器人新突破、强落地——机器人智能论坛圆满落幕

核心提示8月27日下午,“机器人智能论坛”以线上分享的形式圆满举行。该活动由中国人工智能学会主办,中国人工智能学会认知系统与信息处理专委会、南京清湛人工智能研究院承办,北京容天汇海科技有限公司、镁客网协办。在历时4个半钟头的分享环节,来自产业、学术

8月27日下午,“机器人智能论坛”以在线分享的形式成功举办。

本次活动由中国人工智能学会主办,中国人工智能学会认知系统与信息处理专业委员会、南京湛清人工智能研究所承办,北京田蓉汇海科技有限公司、Meike.com协办。

在四个半小时的分享环节中,来自产、学、应用三个方向的嘉宾组成了全方位的产学“三方对话”,围绕智能机器人的相关话题带来了他们的精彩分享。

陈学超,北京理工大学机电工程学院教授,博士生导师。

——仿人机器人高动态跳跃运动的关键

在陈学超看来,人形机器人是智能机器人的高级形态,具有手、腿、头、躯干等人类外形的颜色特征。整机有30到60个自由度,具有复杂的多体动力学系统。在公共安全、国防和社会服务领域有着广泛的应用前景。

回顾仿人机器人发展的大事记,从1973年日本早稻田大学研制出第一台步行仿人机器人开始,日本本田的ASIMO和波士顿动力的亚多拉斯就是里程碑式的产品。

从自己的研究项目出发,陈学超表示,跳跃能力对于人形机器人增加敏捷性和对环境的适应能力具有重要意义,这意味着机器人可以在室内和室外环境中跑得快、跳得高,同时可以执行多种灵巧的任务。其中涉及的核心部件和多模态运动技术也是其汇通仿人机器人项目目前的研究重点。

陈学超解释说,在划分跳跃运动阶段并分析其特点后,机器人:

起跳阶段——要求硬件体需要达到高扭矩高转速,规划控制要全身协调,精确跟随;

落地阶段——要求硬件体要强力回驱,规划控制要柔和。

在此前提下,陈学超还指出,传统的仿人机器人虽然实现了关节力矩,但由于转速低、齿隙弱,无法满足需求。一般四足机器人由于力矩小,很难应用。鉴于此,他也提出了一些解决方案,包括使用磁能密度高的硬磁材料构建高转矩密度电机、基于多物理场综合优化技术提高转矩、模拟人体肌肉布局进行仿生交叉关节耦合驱动、优化变速结构比等。

此外,针对特斯拉、小米等企业对人形机器人的布局,陈学超表示,这类企业的进入将推动人工智能技术在人形机器人产品上的落地,进而推动整体人形机器人产业的发展。同时,他还指出,小米可以在几个月内制造一个人形机器人,并完成一些基本操作。也从另一个角度告诉你,人形机器人研发的行业门槛降低了。

葛军东南大学计算机科学与工程学院副教授

——用算法弥补国产影像设备的硬件不足。

围绕人工智能和机器人产业,医学是一个绕不过去的细分市场,其中影像设备成像是一个重点研究方向。

葛荣军表示,目前国内医学影像设备被国外企业垄断,而国产设备存在成像质量不足的问题。以其他CT为例,常规CT存在辐射剂量大、软组织分辨率低等问题,不仅会给孕妇、新生儿等高敏感人群带来很大的安全隐患,还会对其临床应用范围造成诸多制约。同时,不同诊疗场景下的CT成像也存在采集数据信噪比低或数据稀疏不完整等问题。市场,85%以上的相关设备市场被国外公司GPS垄断。

针对国产设备成像的不足,葛荣军表示可以通过成像算法来弥补——基于不同临床诊疗需求场景和非理想采样条件的高质量CT成像算法。

围绕这项研究,葛荣军还指出,传统的成像方法“解析重建”需要高质量、完整的投影数据,无法应对低剂量、不完整的数据重建。而且特征提取能力弱,容易造成二次伪影。同时迭代速度慢,科学挖掘点少。

在此基础上,研究了基于特征学习的CT成像算法,包括基于单层特征学习的字典学习算法和基于深度特征学习的重建算法。其中深度特征学习可以快速充分利用单层特征和各级深度特征,在最终效果上优于单层特征学习。

李倩英伟达是一个独立的机器技术专家

——基于Isaac Sim平台加快机器人训练

无论是算法开发还是智能机器人研究,过程中总是需要大量的数据处理、模型测试和验证。然而,如果所有这些工作都由单个项目或企业来完成,将面临时间长、挑战大、成本高、相关场景缺乏结构化环境等问题。

针对这一问题,李的解决方案是NVIDIA Isaac Sim,这是一款基于digital twin Omniverse平台的机器人仿真应用和合成数据生成工具。它可以提供真实准确的自然世界的虚拟表示,并允许导入各种对象类型,包括CAD文件,以生成逻辑上与真实世界无法区分的模拟环境。

李表示,在Isaac平台上,只需要四个步骤就可以完成闭环应用的开发:

模型训练——用艾萨克复制器和陶工具包工具训练机器人;

仿真——在全宇宙环境下,基于Isaac Sim对整机进行仿真测试。模型训练好之后,在第三步搭建之前完成整机算法测试。

构建-在机器人本体的嵌入式计算平台Jetson上,使用Iassc ROS GEMs、RIVA、Nova Orin等构建一个完整的机器人。

部署和管理——使用Triton管理多种资源的调动,使用CuOpt规划大型场景中机器人的最佳路径...

“经过实际环境测试后,机器人本身的一些问题和模型的不足就会暴露出来,你可以回到第一步,完成一次训练。”

此外,李还总结道,平台有测试场景和样本,可以直观体验Isaac Sim的部分功能;可以和ROS生态互动;增加了AI的属性,包括强化学习。基于这些优势,它将帮助你快速构建自己的应用,开发出更具AI属性的智能机器人。

梁英伟达高级解决方案架构师

——硬件加速机器人模拟与训练

对于海量数据处理和模型测试验证,除了平台层面各种软件工具的辅助,背后的计算能力也是不可或缺的。鉴于此,王良主要从NVIDIA A40和A100产品进行解释。

其中,提到A40就不得不提到“英伟达OVX”,这是一个为在Omniverse中运行digital twin simulation而创建的数据中心级计算系统。它由8个NVIDIA aa 40 GPU、3个NVIDIA ConnectX-6DX20Gbps网卡、双英特尔Ice Lake 8362 CPU、1TB系统内存和16tb NVME存储组成。RDMA能够实现最低的延迟,支持精确的定时,并且可以扩展以满足工作的需要。

此外,当使用Spectrum-3交换机连接时,OVX计算系统可以从具有8台OVX服务器的单个单元扩展到具有32台OVX服务器的超级单元。多个超级吊舱可用于部署更大的模拟需求。

至于A100,王良表示“A100 80GB PCIE”是世界上最高性能的AI超级计算GPU,是主流EGX服务器的灵活部署选项。性能方面,与上一代产品相比,仿真、AI训练等应用有了数倍的提升。

同时,王良还提到了基于A100的DGX SuperPOD系统,串联后将形成一站式AI超级计算机,实现基于并行计算的大规模AI模型的构建、训练和部署。

中国兵器工业集团高级工程师孙玉杰

-未来机器人战斗方式

就分类而言,智能机器人可以分为很多类型。工业机器人最大,消费级商用机器人更贴近日常生活,特种机器人很少。他们旗下的军用机器人就更神秘了。

据孙玉杰介绍,军用机器人根据作战环境的不同分为地面军用机器人、空中层军用机器人和其他军用机器人。

提到,军用机器人部队需要做到三点,即能够聚焦全维感知、街区突防、关键点捕获与控制、建筑清剿等城市作战环境,实现信息主导、火力主战、智能主控、体系制胜,实现多域、精确跨域协同。

就目前来看,军用机器人部队的建设还存在一些不足,这也为当前行业提出了一些建议:

一是开发机器人的柔性计算能力和可扩展硬件平台,设计相关接口和标准协议,基于“软硬结合解决问题”的思路提升硬件能力;

其次,完成地面军用机器人、空军用机器人等机器人部队体系要素的需求论证;

三是统筹推进相关科技竞赛和高质量智能科技成果的转化应用。

届时,例如空中的机器人将能够集成探测、监视、软干扰和硬打击,以及空、空中的战场遮断和长时延空中的战斗,等等。地面上的机器人会呈现“无人军”模式,就像电影里的机械战士一样。

黄洪波魔影科技联合创始人、副总裁

——机器人行业的“非标+长尾”现象是如何打破的?

黄洪波比喻冰山。一座浮出水面的小冰山,是今天值得投资的一个简单易行的项目或大客户,但另一座沉入水下、约占其体积80%的冰山,代表着大量无法触及、满足机器人和自动化转型潜在需求的行业和项目。

这也导致了虽然机器人市场垂直场景的价值已经达到数千亿、数万亿,但大量的机器人公司和集成商只是在“冰山一角”竞争。

为什么会这样?黄洪波解释说,机器人公司开发产品,集成商部署项目,少则一两年,多则三五年。投入资源重,周期长,成本高,迫使他们提高报价,延长实施周期,进而导致机器人和自动化改造价格高,周期长。而对于客户来说,他们的需求是快速完成机器人和自动化改造,减少财险停机时间,达到降本增效的目的。因此,低价和短周期的压力自然给了企业和集成商,最终导致机器人企业和集成商之间普遍存在低价竞争和亏损的现象。“这是一个恶性循环。”

当然,现有的“非标+长尾”现象只是机器人行业发展中阶段的必然结果。“需求的种类和数量进一步增加,单个厂商的能力和发展速度逐渐无法满足所有需求。跨供应商系统集成极其复杂。同时,很多客户希望使用机器人和自动化,但诉求和场景不同,导致非标+长尾。”

至于如何打破局面,针对“更快地满足快速增长的客户需求,更快更简单地开发新产品和新功能”的趋势,黄洪波提出了“平台体系”。在其看来,基于平台的系统将能够提供行业基本的共性功能,简化开发流程,整合上下游,进而共同推动行业的爆发。

南京湛清人工智能研究院常务副院长杨磊

——“云+边+端”架构赋能机器人视频感知

在杨磊看来,行业内很多公司都为机器人的感知和计算基础提供了出色的支持,但目前来看,“感知”仍然是机器人技术发展的重要瓶颈。

其中,视频感知不同于以往更多讨论的机器视觉。处理的数据基本上是实时连续帧的序列,需要处理的数据量较大。大部分数据都没有经过处理器处理,落地后更实用。是计算机视觉和人工智能领域的一个活跃的研究方向。

“与视频监控相比,视频感知不仅需要获取和分析数据,还需要理解视频内容和目标的上下文。”

就落地而言,随着工业场景新需求的出现,传统的视频监控已经不足以完成安防等方面的新挑战,视频感知也逐渐在工业场景中获得了很大的应用。

同时,就机器人的整个发展而言,“原来的机器人平台计算能力很小,存在巨大的计算能力障碍。而现在提出的新架构——‘云-边缘-端感知架构’,根据不同的场景需求,通过云或边缘的计算能力来解决计算能力不足的问题,有助于进行视频计算和分析。这是未来发展的重要方向。”

鉴于此,杨磊还表示,湛清人工智能研究院采用“云+边缘+端”架构,构建了一套基于视频行为分析的智能制造监管系统,在前端网络中加入边缘分析设备,构建了基于计算机视觉深度学习技术的专有安全生产预警模型,该模型是面向大型企业用户的开放平台,提供简单易用、高质量的视觉算法。

 
友情链接
鄂ICP备19019357号-22