谷歌的有意识,中国的“懂开车”

核心提示深燃原创作者 | 王敏编辑 | 向小园不久前,谷歌一研究员爆料AI有意识的事件刚上热搜,今天,2022世界大会上的一个小插曲,再度引发大家对AI的讨论。7月21日上午,2022世界大会官方视频号直播突然被中断,随后紧急恢复。有不少网友调侃,

申冉原创

作者|王敏

编辑|向小源

不久前,一位谷歌研究员爆料,AI的意识事件刚刚上了热搜。今天,2022世界大会上的一个小插曲,再次引发了大家对AI的讨论。

7月21日上午,2022世界大会官方视频号直播突然中断,随后紧急恢复。很多网友调侃,可能是因为直播里提到了无人驾驶,一直说“驾驶”,被AI判定为违法。

当然这只是一个笑话,但“AI已经有了人格,有必要觉醒”似乎是AI发展史上一个永恒的话题。长期关注AI的朋友都知道这还很遥远,但其实AI的创造能力已经到了开始抢人类“饭碗”的地步。

在这次“世界大会”上,创始人、董事长兼首席执行官李彦宏分享了他对AIGC的看法,这使得AIGC的概念备受关注。

什么是AIGC?李彦宏指出,AIGC是继UGC和PGC之后的一种新的内容生产方式,不仅可以提高内容生产的效率,还可以创造出具有独特价值和独立视角的内容。

随着元宇宙、Web3概念的流行和下一代互联网的演进,用户对内容的需求越来越旺盛,内容产业迫切需要升级迭代,因此也越来越需要AIGC。

在这次以“AI耕田,万物生长”为主题的世界大会上,展示了用AI修复残画《富春山居图》的能力,这也只是基于文心大模AIGC能力的尝试之一。AI虚拟人杜潇潇和希佳佳的对话、舞蹈、绘画、歌词和作曲的实现也离不开AIGC能力。

业内人士指出,看似遥远的AIGC时代已经悄然到来,赋予了AI强大的生产力。除此之外,在国内市场,大的互联网公司,人工智能独角兽和一批初创公司已经将触角伸向了这一前沿领域。基于AI能力,一场下一代互联网的较量已经悄然打响。

那么,AIGC看起来像什么?背后的AI技术发生了哪些变化?它在这场战斗中处于什么位置?本文试图回答这些问题。

人工智能是全能的

在世界大会上,一个人工智能还原的富春山居图慢慢出现在人们面前。

这幅由元代画家黄所作的《富春》在明末被火烧成两卷。后人再也无法知道缺失的部分。艾弥补了这个不足,不仅完成了这幅画,还画了一首诗。就连黄纪念馆馆长毛传勇也表示,这幅著名的艾复原画“与现存的原画风格一致”。

用人工智能技术补充富春山居图

AIGC拥有强大的修复能力和惊人的效率。会上,主持人撒贝宁在APP上勾画了几笔,通过AI技术完成了这幅名画,体验了一把AI还原。同样,每个人都可以用AI修复这幅名画,一千个人就会有一千个版本的修复版富春山居图。

当然,艾的绘画只是蓝图中的早期阶段。结合对AIGC领域的探索,李彦宏在大会上判断,AIGC将经历三个发展阶段:第一阶段是AIGC的“助手阶段”,辅助人类进行内容生产;第二阶段是AIGC的“协作阶段”,AIGC以虚拟和真实的数字人的形式出现;第三阶段是AIGC的“原创阶段”,可以独立创作内容。

第一阶段,人们的印象大多停留在单点技术的AIGC产品上,包括AI写诗、AI作曲、AI剪辑等等。例如,李彦宏说他的书《智能交通(ITS) AI超级模拟音频书版本》是利用AIGC技术创作的。其音频合成效果的还原程度接近他的原声,普通用户基本分辨不出来。在的第三阶段,艾独立完成了从0到1的创造,这在目前还难以实现真正意义上的创造。李彦宏表示,AI大模型的突破正在加速这一趋势。

在第二阶段,杜潇潇、希佳佳和其他人工智能数字人类行动在过去六个月中得到了详细解释。

早在2021年12月底,在一次沟通会上,李彦宏发现AIGC的概念开始流行。在谈到2022年的目标时,他说要创造一个虚拟的形象,AI会完成各种动作。

于是两个多月后,AI虚拟偶像hi佳佳正式出道。据了解,希佳佳的形象,包括其外貌、姓名、服装、发型等。,是由人工智能技术生成的,是AIGC的成果。而且,希佳佳有语言、面部表情和肢体动作的表达能力,能像人一样说话和行动。最重要的是,它可以进行自主学习和迭代,以AI能力快速创作内容。在过去的几个月里,希佳佳已经成为一名AI设计师,并联合发布了几套数字系列。

另一位人工智能数字人物“杜潇潇”,也被称为“劳模”,在过去的半年里一直引领着AIGC潮流。在文字创作方面,她在上海高考期间,40秒挑战40篇高考作文,效率惊人;在形象层面,她创造了数十秒内的AIGC画作数字收藏,24小时销量突破17万,受邀参加Xi安美术学院毕业展;在音乐上,她与明星西蒙数字人(Simon Digital Man)一起作词、编曲,并发行了第一首虚拟偶像AIGC单曲《每一分、每一秒、每一天》。

除了和希加佳,人工智能数字家庭的成员还包括中央电视台的虚拟主持人小C、财政专员小蒲和的虚拟宣传员等等。

这些AI人物让人听、说、懂、互动,变得越来越“聪明”,几乎无所不能。

对于AIGC的布局,远不止是打造AI数字人,更是加速数字人的大规模落地。今年1月,To B的智能云西岭平台发布,这是一个整体上更接近AIGC全链路实现的数字人平台。可以为各行各业提供数字生成和内容生产服务,降低数字人的使用门槛。

据数字人与机器人业务负责人李时言介绍,智能云西岭平台目前有四个子平台,分别是数字明星运营平台、数字人手语平台、数字人直播平台和与交互能力相关的对话配置平台。以最近发布的数字人直播平台为例。这个平台可以生成AI主播。商家购买服务后,无需直播主播、中控人员、复杂硬件的支持,即可获得24小时AI主播。

在AIGC的助手阶段和合作阶段,它已经成为一个深度玩家。

AIGC背后最大的功臣是谁?

当进入AIGC的第三阶段,需要AI大模型,即预训练大模型有新的突破,这已经成为近年来人工智能技术和应用的一个重要方向。

以往的AI深度学习训练模型要标注大量数据,还要面临通用数据激增和专用数据缺乏的矛盾。AI模型在大规模数据集上进行预训练后,不需要微调就可以直接支持各种应用,或者只需要对少量数据进行微调。

2020年起,OpenAI发布NLP预训练模型GPT-3,模型参数1750亿元。国内外厂商,包括谷歌、微软、meta、华为、阿里等。,在预训大模特领域展开了一场“军备竞赛”。各家开始争夺参数和计算能力,参数从千亿到万亿甚至飙升到10万亿。

2019年以来,AI预训练模型技术不断积累,先后发布了飞桨深度学习开源平台、知识增强文心等一系列模型。基于飞桨深度学习平台,2021年12月发布了全球首个规模达2600亿的知识增强模型——鹏程文心。

但是,拼参数的时代正在过去。“2022年是AI大模型产业落地的关键年”。研究院认为,2022年,超大规模预训练模型将逐步投入实际应用,打破盲目增加参数规模的“军备竞赛”,呈现知识增强、跨模式统一建模、多种学习方式协同进化的趋势。

据首席技术官王海峰介绍,基于飞橹深度学习平台,大模型前期训练领域不断完善。目前,文心全景已经发布了20多个大模型,既有基础通用模型,也有重点领域和任务的大模型。在本次世界大会上,文新还推出了世界上第一个航天领域的大模型——航天——文新大模型。

工业知识增强模型全景

AIGC的能力离不开文心的大模式。本次大会上艾修复的《富春》是文心大模型中多任务统一学习的可视化模型。文达模本先大量学习中国山水画,从“”到“大师”,再对黄的《富春》进行单样研究,掌握其精髓,使完成的画作与现存原作一致。

也是文心的大模式,通过AI技术,让数字人以自动排列合成的方式生产内容。据了解,AI数字人杜潇潇拥有与他人聊天的能力,利用对话生成文心柏拉图大型模型,目前已升级到拥有百亿参数的文心柏拉图版本,开放领域对话效果不断提升。

人的绘图能力是基于文心大模型的跨模态图形生成模型ERNIE-ViLG。这种双向图文生成模式不仅可以根据个人需求自动生成油画、水彩画、国画等多种风格的不同分辨率图像,还可以达到“看图说话”的效果。

随着大模型技术的不断突破,AIGC正在加速向原始阶段进化。一旦越过某个奇点,就能产生真正的AI原创内容。

元宇宙波与AIGC密不可分。

2022年,被很多业内人士称为AIGC元年。

从PGC、UGC到AIGC,随着AI技术的成熟,在这场内容生产革命的背后,下一代互联网对数字内容的数量、形式、交互性提出了更高的要求。市场需要以更低的成本和更高的内容生产效率,创造出具有独特价值和独立视角的内容。李彦宏表示,未来十年,AIGC将以“十分之一的成本”和百倍的生产速度产生AI原创内容。

但不可否认的是,AIGC这个概念还是比较早的,李彦宏也在一众互联网大佬中率先公开定义了这个概念。

观察目前的市场,我们可以发现,许多玩家可能还不知道AIGC的概念,但他们已经在行动中涉水。总的来说,他们专注于两个板块,一个是在AI底层技术上取得突破,生成内容;另一种是围绕数字人的形态进行技术整合,通过AI技术结合相关的图形识别、视觉技术、3D建模、CG渲染、动作捕捉等技术,不断提高数字人的个性化和交互能力。

无论哪个板块,加码布局的都是大厂和创业公司。其中,在人工智能技术方面,中国的科大讯飞、商汤、阿里、腾讯和萧冰已经深入参与了很长时间。AIGC科技的开发商数字力场、游戏AI公司超参数科技等初创企业聚焦AIGC科技,均以AIGC概念获得融资。

在过去的一年里,数字城域网备受瞩目。据了解,仅2022年第一个月,就已经融资近百起,金额超过4亿元。虚拟人相关公司中,一家专注于虚拟偶像、虚拟IP的内容运营,一家专注于虚拟人相关技术的整合,输出解决方案。参与者包括阿里、腾讯、网易、科大讯飞、商汤等大厂和独角兽公司。

在这些尝试过AIGC的市场主体中,他们的特点是覆盖广,布局深。

相比互联网大公司,做虚拟人已经打造了杜潇潇、Hijiajia等虚拟IP,搭建了一个包含AI能力各环节、全产业链各环节的平台,从建模到绑定到动态,可以实现一站式的数字人服务和交付。

即使在AI赛道上,AI积累也是一种实力。李时言对深冉说,它是中国唯一一家同时拥有视觉能力、语音和语义相关能力以及基于平台的AI能力(如计算机图形)的公司。底层全栈AI能力是西岭的优势。

对AIGC也有很大的期望。该研究所在发布2022年十大科技趋势预测时指出,2022年,AIGC将借助大模型的跨模态综合技术能力,提升内容多样性,降低制作成本,实现规模化应用。

有优点。这半年来,在AI虚拟人领域的频繁布局,显示了在下一代互联网到来之际,先占一席之地的野心。

*标题图片来自《银翼杀手2049》。

 
友情链接
鄂ICP备19019357号-22