百度世界再曝语义理解领域新进展:文心全景图亮相

核心提示语言与知识技术的相关研究进展,影响着人工智能理解世界的方式。9月15日,一年一度的科技圈盛会世界2020大会于线上召开,总台央视主持人康辉,与创始人、董事长兼首席执行官李彦宏的“虚拟人”在千万观众面前亮相,不仅动作自然、栩栩如生,更与真人进

语言知识技术相关的研究进展影响着人工智能理解世界的方式。9月15日,一年一度的世界2020科技圈大会在线举行。央视主持人康辉和创始人、董事长兼CEO李彦宏的“虚拟人”出现在数百万观众面前。他们不仅表演自然生动,还顺利与真人进行了多轮互动,引发网友惊叹,满足了人们对未来时代“智能管家”的诸多想象。

在虚拟人对世界和语言的理解中起关键作用的是语言和知识技术。在当天下午举行的大脑分论坛上,文心杰出架构师、负责人孙宇上台发言,介绍了知识增强语义理解框架文心在语言理解、语言生成、跨模态语义理解方面的突破。此外,大脑提出了基于多流机制的预训练语言生成技术ERNIE-GEN和知识增强的跨通道语义理解技术ERNIE-ViL,其中场景图知识首次融入到跨通道预训练模型中。孙宇还介绍,文心语义理解技术平台可以为企业提供一整套NLP定制和应用能力。目前已扶持超过2万名开发者,覆盖金融、通信、教育、电商等多个行业。

杰出的建筑师和文学头脑的领袖孙瑜

了解语义核心技术升级,文心多项NLP技术全球领先。

据了解,去年发布了知识增强语义理解框架——文心,大大提高了机器理解语言的水平。还在通用语言理解和评测国际权威标杆GLUE上首次突破90分大关,超越人类三分,获得全球第一。小说的创新之处在于大数据预训练和多源丰富知识的结合,海量文本的词汇、结构、语义等方面的不断学习,模型效果的不断进化,就像人类的不断学习一样。

分论坛上,孙宇介绍,文心语义理解技术包括基于预训练的语义表示、文章理解、文本匹配、文本生成等技术,以及能够识别和理解法律、金融文本的领域语义理解技术,并已布局跨模态、多语言、地图理解等前沿技术,形成了涵盖基础、应用、领域、扩展四个层面的全景图。

在多源知识学习的支持下,如常识知识、多粒度语言知识、场景图知识等。,文心的语义理解能力、语言生成能力、多模态语义理解能力得到了进一步的提高和拓展。同时,基于海量数据,大脑构建了多粒度自编码任务和指代消解任务,促进了情感分析、文本分类、阅读理解等八项典型自然语言理解任务的有效性。

在自然语言生成方面,文新提出了一种基于多流机制的预训练语言生成技术:ERNIE-GEN,对摘要生成、问题生成、多轮问答等自然语言生成任务效果突出。同时,文心设计了多流注意机制,整合了学习目标的逐词生成和逐片段生成。在学习了语言的多粒度知识后,完全刷新了世界上语言生成任务的最佳效果,在学术界和工业界都有很大的研究价值和应用价值。

《文心》在多模态语义理解方面取得了重大突破。视觉推理技术ERNIE-ViL可以通过物体识别运动场地和运动图片中的人物,进一步区分人的衣服颜色,根据其知识判断裁判和运动员的身份。理解细粒度语义的能力在这个推理任务中起着关键作用。ERNIE-ViL在业内首次将场景图知识融入到跨模态预训练模型中,已广泛应用于工业场景。

平台化,脑心实现语义理解技术的产业化应用。

在人工智能技术落地过程中,实际需求往往呈现应用复杂、成本高、耗时长、迭代性差等痛点。于是,文心语义理解的技术平台应运而生。

孙宇介绍,文心平台基于领先的语义理解技术,可以为企业提供一整套的NLP定制和应用能力,让开发者更加简单高效地定制企业级NLP模型。在文心的平台服务中,提供了数据处理、模型训练、模型评估、模型部署等环节的“工具箱”,可以一站式满足开发者的各类应用需求。此外,文心还提供了两种平台支持方式:零门槛AI开发平台EasyDL和全功能AI开发平台BML。

一站式的NLP开发能力,既能满足开发者的需求,又能降低定制开发的成本。在落地实践中,传统产品训练模型需要5100个数据标签,而平均文本数只有220个,减少了90%的数据标签量。同时,文新通过对模型进行预训练,减少了90%以上的计算能力投入,减少了86%的模型开发时间,将周期从一周缩短到一天,对企业开发者更加友好。

头脑的另一大好处是,它经过了真实场景的锤炼。据介绍,文心已应用于包括搜索引擎、推荐系统、智能音箱、智能客服等在内的数十条产品线。,其工业应用能力得到了验证。目前,文新已经向金融、通信、教育、电子商务等行业交付了NLP技术,显著提升了这些企业智能应用的效果和效率。

作为“人工智能皇冠上的明珠”,NLP一直走在人工智能技术研发和实践的最前沿。在新基础设施的大潮下,也催生了对自然语言处理的大量需求。自2010年自然语言处理部成立以来,NLP全面布局技术和产业已经过去十年。不仅在技术上形成了先发优势,还完成了行业落地的绝对领先。它致力于将AI技术下沉到千万个行业,人与机器相互理解的图景已经全面到来,开创更智能的未来时代。

 
友情链接
鄂ICP备19019357号-22