商汤科技研发投入

核心提示6月19日-23日,全球人工智能计算机视觉领域顶级国际会议CVPR 2022在美国新奥尔良举行,并同步进行线上会议。商汤科技及联合实验室共71篇论文入选本届CVPR,再创新高,其中有接近四分之一被录用为Oral,涵盖三维视觉、自动驾驶等多个

6月19-23日,全球人工智能计算机视觉领域的顶级国际会议CVPR 2022在美国新奥尔良举行,同时举行了线上会议。尚科技和联合实验室共有71篇论文入选本次CVPR,创下新高,其中近四分之一论文被聘为口语,涵盖了3D视觉、自动驾驶等多个前沿研究领域和方向,继续巩固了在全球计算机视觉研究领域的领先势头。

自成立以来,商汤和联合实验室在学术峰会上发表了700多篇论文,在各种比赛中获得了70多个世界冠军。同时,商汤也没有把论文数量作为衡量公司技术发展的标准。尚科技联合创始人、研究院院长博士表示:“我们希望通过为研究人员提供高效研究的良好环境,鼓励和引导年轻研究人员从解决行业实际问题的角度出发,做高水平、高质量的研究。”

在本次CVPR上,商汤科技也参加了多项学术比赛,也取得了令人瞩目的成绩。比如商汤科技、中科院自动化所、上海人工智能实验室联合参加Embodied AI 2022,在RxR-Habitat circuit获得冠军。作为国际上具身AI研究领域的权威比赛,大赛要求通过自然语言控制来解决室内机器人的导航问题。商汤的方法在效果上实现了90%以上的提升,导航准确率从24.08%提升到45.82%,导航保真度从37.39%提升到55.43%。同时,在为推广基于深度学习的视觉编码技术而举办的CLIC大赛中,商汤科技团队提供的方案成功获得了图像编码赛道的称号,不仅在三个测试码点上都取得了最好的主观评测成绩,而且在所有深度学习方案中解码速度最快。

推动科技赋能产业,以创新引领产业突破。

尚科技一直鼓励研究团队,关注行业需求和痛点,将研究工作与实际业务场景相结合。近年来,依托SenseCore尚汤艾设备等AI基础设施的建设,商汤在前沿研究领域有了更强的支撑,进一步推动了与行业协作的深化,以AI技术创新引领行业发展。

例如,在论文《Bailando:3D Dance Generation Via Actor-Critical GPT with Choreographic Memory》中,研究人员提出了一种新的音乐到舞蹈框架Bailando,它可以驱动3D角色随着音乐跳舞,不仅可以保证动作的标准和美感,还可以在时间上与不同的音乐节奏保持一致。目前,在AI、云计算等技术能力提升的背景下,数字人的应用范围日益丰富,在社交、游戏、直播、虚拟偶像等领域逐渐融入我们的生活。这项研究无疑为未来的数字人类产业创造更加智能和个性化的角色,满足多样化的需求提供了一个潜在的方向。

PTTR点跟踪框架示意图

近年来,随着自动驾驶和激光雷达技术的发展,基于点云的目标跟踪越来越受到重视。针对点云数据的独特挑战和现有算法的缺陷,商汤研究团队在论文《PTTR:利用transformer进行相对三维点云目标跟踪》中提出了一种新颖的点云跟踪框架PTTR,显著提高了多数据集上目标跟踪的精度,为自动驾驶的安全运行奠定了基础。

尚科技与北京航空航天大学空教授联合举办了面向复杂场景的Robust Models Towers开放世界分类大赛。大赛旨在推动安全可靠的人工智能模型研究,鼓励创造更安全可靠的人工智能,支持人工智能技术更可持续的发展。比赛吸引了286支队伍和416名参赛者。6月19日,竞赛在CVPR 2022鲁棒性艺术研讨会上正式宣布了获胜者。

加强基础设施和生态建设,帮助产生效果。

尚科技在学术研究和技术创新方面取得的突出成绩,离不开领先的软硬件基础设施集成的强大计算基础和领先的算法能力,以及商汤学术生态和开源生态建设的长期积累。通过建设并不断完善以SenseCore尚汤艾为核心的基础设施,商汤为技术研发和落地提供了重要的基础支撑。科研人员可以高效地进行科学研究,快速实验和验证新的想法,加快创新和迭代,促进高水平论文的产生,解决产业发展中的问题。

商汤非常重视学术生态的建设。2017年以来,商汤科技先后与上海交通大学、南洋理工大学、浙江大学建立联合研究院或实验室,与清华大学建立“感知计算”产学研专项,推动建立全球人工智能高校学术联盟,通过与学术界的紧密联系,促进了各类学术成果的产生和国际学术交流与合作。今年6月11日,商汤科技联合全球高校人工智能学术联盟成功举办了“无止境的研究:商汤论文分享会”,汇聚了来自商汤科技、香港中文大学、浙江大学、南洋理工大学、北京大学等高校的研究学者,在线解读CVPR 2022在3D视觉、姿态估计、底层视觉、表征学习、场景理解等领域的口头论文,分享宝贵的学术经验。

此外,商汤继续巩固开源的生态建设。OpenMMLab是一个基于视觉算法的开源项目,目前在GitHub中拥有超过50000颗星星,并成功向研究人员和业界开放了数千个模型。基于决策智能的OpenDILab于去年在WAIC会议上发布,对学术界和工业界开放源代码。在大模型方向,商汤、上海人工智能实验室、高校联合发布了通用视觉技术系统学者实习生,并开放OpenGVLab,助力通用人工智能基础研究和生态建设。OpenMMLab还在CVPR期间举办了主题为“OpenMMLab:计算机视觉研究与生产的基础平台”的研讨会,邀请学界大咖参与分享讨论,共建开源生态。

随着基础设施建设的完善,学术和开源生态的培育,人工智能技术研究的基础将更加稳固和广阔。以此为支撑,商汤将继续引领人工智能技术创新,加强AI产业深化,加快规模化应用,推动人工智能技术和产业发展不断突破。

雷锋网

 
友情链接
鄂ICP备19019357号-22