深度学习框架简史:始于学术,盛于产业

核心提示编辑导语:作为AI基础技术的深度学习框架,在许多人的认知里还是一个陌生的词汇,不知其扮演的角色及重要性。在这篇文章里,作者梳理了深度学习框架的周期演变——学术时代、商业时代、应用时代和产业时代,分析在这个周期中,深度学习框架是怎么发展的,感

编辑导语:作为基础AI技术的深度学习框架,在很多人的认知里还是一个陌生的词,不知道它的作用和重要性。在这篇文章中,作者梳理了深度学习框架的周期演变——学术时代、商业时代、应用时代和工业时代,并分析了深度学习框架在这个周期中是如何发展的。有兴趣的朋友来看看吧。

“科技无国界”的幻想因为东欧的战争而彻底破灭。

苹果、谷歌、脸书、SAP、微软等科技巨头已经采取了实际行动。仅Apple Pay和Google Pay的停产就影响了几千万人的生活秩序。但GitHub、Node、React等开源平台对俄罗斯开发者的严格限制,给很多企业的产品开发和商业运营蒙上了不确定的阴影。

在此背景下,开源软件的自主可控性再次成为舆论焦点,尤其是作为基础AI技术的深度学习框架,更是集中了无数开发者的关注点。深度学习框架属于AI的底层技术创新。一旦这些技术被束缚,成千上万个行业的智能化改造将受到制约,甚至影响中国第四次工业革命的进程。

在很多人的认知里,深度学习框架还是一个陌生的词,它的作用和重要性还处于不为人知的状态。从盘点和回顾的角度,我们不妨梳理一下深度学习框架的周期性演进,找出中国企业在从学术界到产业界,再到产业化的过程中,机遇和挑战属于哪里。

01学术时报:学者的“刀耕火种”

要理清深度学习框架的起源,就不可避免地要花一定的篇幅来简要勾勒一下人工智能技术的演进。

早在1943年,美国心理学家麦卡洛克和数学家皮茨就提出了人工神经网络的概念,比世界上第一台通用计算机出现早了3年。

从那以后,出现了很多新的概念和模型,但是人工智能的进展总是不尽如人意。直到2006年Jeffrey Hinton发表了一篇名为《深度信念网络的快速学习算法》的文章,其核心思想是利用GPU加速训练,大大提高了神经网络的学习速度。

2012年,曾师从Jeffrey Hinton的多伦多大学研究生Alex KChai Fu在当年的ImageNet挑战赛中使用了一种新的深度神经网络架构进行训练,并在ImageNet数据集上取得了SOTA精度,远超一些顶级学术团队。这种深度神经网络架构,后来被称为AlexNet,在全世界掀起了深度学习的热潮。

在机器学习大行其道的时候,几乎没有一种算法在大量问题上具有压倒性优势,大部分商业问题都可以通过大数据和算法相结合的经典方式来解决。

但在深度学习时代,数据、算法和计算能力都在爆炸式增长。为了提高工作效率,一些研究人员开始编写深度学习模型的几个必要流程,不断沉淀之前的研究成果,后期人们可以直接调用一些成果,大大降低了深度学习模型的编写门槛。

“深度学习框架”的概念诞生,迅速涌现出了Theano、Caffe、Torch等一批深度学习框架,至今仍是人工智能圈的热门话题。

科技的每一次飞跃都离不开个体的辉煌,人工智能只是一种标准的创造性技术。所以早期深度学习框架的创始人往往被赋予了一种特殊的光环,他们的价值观随着时间的推移不断被放大。

回过头来看,这些著名的早期框架也有时代的局限性,它们往往能解决一类问题,具有鲜明的学术色彩。

比如Alex KChai Fu写了一套深度学习框架叫Cuda-Convnet,可以在GPU上快速运行神经网络,但是不太注重工程设计,也不具备模块化和抽象的能力。只是为了科研和造纸。

深度学习开源工具的鼻祖Theano,严格来说是一个擅长处理多维数组的Python库,用来高效解决多维数组的计算问题。与目前深度学习框架的功能相比,Theano更像是数学表达式的编译器。

值得一提的是,在深度学习框架“刀耕火种”的日子里,中国学者也没有缺席。2013年,深度学习研究院成立,Caffe等框架的领导都有中国人的身影。顺应暗科技创新的潜在趋势,中国在创新过程中不再是跟随者,这一次我们走在了前沿。

02商业时报:科技巨头“闯入江湖”

2015年是深度学习框架的转折点。今年前后,发生了两件深刻影响人工智能历史进程的重要事件:

一个发生在学术领域。微软亚洲研究院的学者提出了著名的ResNet架构,其影响力不亚于AlexNet。不仅在ImageNet的准确率上达到了新高,也让学术界之外的业界形成了深度学习将成为下一个主要技术趋势的共识。

另一个发生在围棋圈。谷歌DeepMind团队开发的AlphaGo与韩国著名棋手李世石进行了一场围棋人机对弈,最终以总比分4比1获胜。不仅AlphaGo和Google不在圈内,深度学习的概念也被越来越多的“圈外人”所知。

事后看来,这两起事件都有其悖论。2015年ResNet原创残网的结果一度被质疑无法重现,而AlphaGo的围棋挑战赛本身就有作秀的嫌疑。蛇灰色的线条,绵延千里的脉络,在科技巨头们精致的布局背后,显得不同寻常。

2013年3月,谷歌以4400万美元收购了杰弗里·辛顿(Jeffrey Hinton)创办的DNNResearch。这笔交易的焦点不是什么新业务,而是辛顿本人和他的两个学生。据说他也参与了这场“拍卖”,并坚持到辛顿做出选择的最后一刻。

谷歌疯狂“聚才”的原因在2015年11月揭晓:谷歌大脑团队开发的深度学习框架TensorFlow正式开源,Jeffrey Hinton为此做出了诸多贡献。Google的另一位研究员Francois Joliet几乎独自完成了Keras框架的开发,为Google又增加了一条护城河。

可惜,怀念杰弗里·辛顿的人也没闲着。2012年,他们开始大规模购买和构建GPU计算集群。他们是国内最早投资深度学习平台,培养和吸收大量顶尖AI人才的企业,内部经过多年打磨和重构的PaddlePaddle也于2016年正式开源,后来取了一个中文名字“飞桨”。

同样对深度学习框架雄心勃勃的meta,走的是一条循序渐进的路。先是控制了著名的深度学习库Torch,然后用Python替换了Lua语言,重构了Tensor上的所有模块,2017年初正式开源为PyTorch。同时推出了Caffe2项目,像Google一样推出了双平台策略。

这个阶段可以说是深度学习框架下的第一次“百家争鸣”。亚马逊牵头的MXNet和微软背书的CNTK相继出现在开源清单上。

深度学习框架不再是学者的专利,科技巨头们已经接管了主导市场的权力。

对应着新旧交替的景象。

Alpha本来是基于Torch开发的,但是TensorFlow开源后马上就移植了;Theano的开发团队于2017年9月宣布停止维护更新,从此退出历史舞台;经过一定时间的奋力追赶,微软的CNTK终于宣布2019年停止维护;Keras后来被TensorFlow合并,Caffe2被PyTorch接受...

还有很多不为人知的深度学习框架,在被外界知晓之前,就已经被埋在了人工智能快速成长所带来的尘埃中。相对于巨头们在技术、团队、人才上花大价钱,很多初创企业往往被各种因素捆绑,结局从一开始就注定了。

03应用时代:“剩者为王”的赛车比赛

随着人类历史的趋势被反复验证,经过短暂的激烈竞争,深度学习框架也呈现出“寡头”局面。

背靠谷歌这座开源大山,TensorFlow在开源之初就显示出主场优势,大批学者有意识地转移阵地。据谷歌天才科学家杰夫·迪恩(Jeff Dean)在一次演讲中称,2016年TensorFlow的论文被引用次数呈指数级增长。

但Google并不打算困在学术圈,早早就把目光投向了行业。在英特尔和英伟达等硬件平台的合作下,它向全球开发者提供了免费的AI库和工具。2015年推出了专门为TensorFlow框架打造的计算神经网络专用芯片TPU,引发了云造核的浪潮,并以每年一代的速度持续迭代。

应该说,谷歌的商业嗅觉非常灵敏。ResNet和AlphaGo一下子点燃了行业的激情,人工智能如火如荼的席卷了行业。TensorFlow天然向行业需求倾斜,逐步推出TensorFlow、Serving、TensorFlow Lite等产品,让客户在云、服务器、移动设备、物联网设备上部署。

但此举屡遭学界诟病。学者追求的不是部署的便利性,而是易用性。这也给PyTorch这个后来者提供了机会。得益于它的“易用性”,PyTorch很快在研究领域站稳了脚跟。大部分发表的论文和开源模型都在用PyTorch,目前占论文的80%,有资格和TensorFlow竞争。

在国外很多研究者的心目中,深度学习框架已经成为TensorFlow和PyTorch的世界性局面,代表了深度学习框架在RD和生产中90%以上的用例。但如果把中国市场纳入讨论,就有些不同的声音了。

知名市场调研机构IDC发布了2020年下半年中国深度学习框架平台市场份额报告。TensorFlow、Flying Paddle、PyTorch位列前三,合计占比超过70%。到了2021年上半年,IDC再次更新市场报告,随后飞桨超越TensorFlow跃居中国综合市场份额第一。

关于这份报告,我们问过很多开发者,对方给出的答案大多是“意料之外”。进一步沟通后,听到最多的声音是:“原来EasyDL也是飞桨的产物。”其中,被频繁强调的EasyDL是基于飞桨深度学习框架的零门槛AI开发平台。开发者上传数据并做好标记后,就可以训练相应的模型来部署应用了。

考虑到中国巨大的人才缺口,飞桨的市场渗透模式带有明显的实用主义色彩。让客户先用AI模型,即使不知道背后有深度学习框架。

因为国内大部分中小企业不具备专业的AI算法开发能力,开发定制AI模型绝非易事。从结果导向来看,Feipaddle可能找到了不同于谷歌和脸书的第三条路。

巨头“闯江湖”的连锁反应已经发生,市场份额越来越集中在少数几个平台上,无论是美国还是中国。同时,在便捷、易用、稳定的多重指标下,算法、算力、编译器等等缺一不可,深度学习框架的门槛越来越高。

04工业时代:中国市场“暗流”汹涌。

中国市场对深度学习框架的关注在时间上是滞后的空,直到中美科技大战爆发后才有了更多的相关讨论。

长期以来,中国开发者一直是TensorFlow和PyTorch的忠实粉丝,一些企业已经深度涉足MXNet。这其中的原因非常复杂。我们的工程师文化是努力工作,但不以宣传为导向。飞桨长期专注于技术和产品,在舆论场缺乏存在感。

国内其他互联网公司,要么犯了“为钱而拿”的错误,要么缺乏创新精神,不敢与海外科技巨头竞争;要么抢着摘果子,等别人发现了再跟着学...所以在2020年之前,国内的深度学习框架屈指可数,除了已经建成的flying oar,只有包括小米MACE和阿里XDL在内的少数推理框架。

转机发生在2018年前后,中兴、华为等公司相继被美国制裁。当Matlab这样的老工具可以禁用的时候,很多企业逐渐嗅到了“危险”:如果有一天Pytorch和Tensorflow重蹈Matlab的覆辙,对中国AI产业的冲击无异于釜底抽薪。

深度学习框架的应用在这个时间点上也进入了产业化阶段,并呈现出两个典型特征:

大规模的模型训练,GPT-3、BERT等大型模型的诞生,都需要在上百台甚至上千台设备上进行训练,瞄准产业化的需求。可用性、TensorFlow、飞桨、PyTorch都先后推出了计算图和动态图,为了让操作更简洁。开发人员可以采用命令式编程风格来方便模型的调试。留给企业和开发者的其实是三难选择:如果像过去一样全部在国外的深度学习框架中,会有各种不确定的风险;盲目退出国外的框架,似乎不是理性的选择。有竞争才有进步。

更何况深度学习框架属于高投入、长周期、抢生态的竞争。在产业链中起着承上启下的关键作用,在引领产业进步步伐、带动终端场景和云服务协同发展中发挥着重要作用。押错宝的代价不言而喻。

幸运的是,最后的结果没有那么糟糕。

官方资料显示,目前基于飞桨研发的机型有47.6万种,其中不乏文新等大机型。服务开发者人数达到406万,在270多所高校开设了AI学分课程。至少可以保证在中国市场建立起飞桨、TensorFlow、PyTorch三足鼎立的格局,然后再慢慢的图谋市场份额分配。

进入2020年后,清华大学计划、漠视科技天元、华为MindSpore、一级技术OneFlow已经开源,腾讯、阿里也推出了PocketFlow、X-Deep Learning。如果这些新空室有能力以资金、人才等资源换取时间,根据中国产业的需求因地制宜,不排除进一步从国外框架中抢夺份额的可能。

回到文章开头遗留的问题,在AI基础技术的竞争中,来自中国的力量确实有点落寞,只有一家在长期厮杀。还好结果还不错。在深度学习框架的“PPT”模式中,已经有来自中国的一封信,所以不需要面对被屏蔽的情况。

05结论

距离1956年的达特茅斯会议已经过去了66年,人工智能终于迎来了工业生产的浪潮。来自中国的企业和科学家可能缺席人工智能的过去,但他们正在一步步锚定人工智能的未来。

目前中国在AI应用层已经站稳脚跟。近年来,其专利申请量甚至超过美国,在数据、人才、市场等方面的综合优势正逐渐显现。

如果能利用深度学习框架进一步聚合开发者、资本和平台,营造有利于创新的土壤,摆脱“数字铁幕”的威胁,让中国AI在坚实的道路上跑得更快,也不是不可能。

#专栏作家#

Alter,微信微信官方账号:Alter说说吧。每个人都是产品经理、专栏作家、互联网观察家。专注于移动互联网、智能硬件、电子商务等科技领域。独立自媒体人在创业路上。

本文由人人作为产品经理原创发布,未经允许禁止转载。

来自Unsplash的图像,基于CC0协议。

 
友情链接
鄂ICP备19019357号-22