上次写了一篇关于GPUAI Studio计算资源的文章,收到了很多AI算法初学者的私信,问能不能补充一些AI Studio的学习资源。有求必应一直是我的风格,所以我加入了AI工作室和飞桨开发者QQ群,为大家收集了一些资源,涵盖了从初级到高级的各种常用算法和代码。为了阅读连贯性,本文先简单介绍AI Studio,然后说明免费GPU资源政策的变化以及如何获取。最后介绍一些可以帮助你从初级到高级尽快掌握各种算法的资源。
什么是AI工作室
Studio是一个面向人工智能学习者的在线集成开发和培训平台。该平台包括AI教程、深度学习样本项目、各领域经典数据集、云计算和存储资源,以及竞赛平台和社区。你可以把AI Studio看成是国内版的Kaggle。与Kaggle类似,AI Studio也提供GPU支持,但AI Studio在GPU上优势明显。
Kaggle最近把特斯拉K80的GPU升级到了P100,确实比以前快很多,但是AI Studio用的是特斯拉V100的GPU,更好。下表比较了两种GPU的性能:
AI Studio提供了基于ipython和Jupyter笔记本的在线解决方案,几乎是目前所有机器学习/深度学习的主流解决方案。Studio支持的深度学习框架是Flying Paddle。相比TensorFlow偏向于研究,飞桨偏向于应用。通常几行TensorFlow代码,一行飞桨就解决了。感觉个人桨飞对新手还是很友好的。
如何获得免费的智能卡?
我写过一篇关于如何做AI工作室的GPU毛线的文章。详情请参考。然而,自上次薅羊毛以来已经过去了三个月,我们的免费GPU计算政策已经改变,而且是朝着更好的方向。以前每天跑项目是12个小时,现在是24小时!天啊,这意味着你可以24/7不间断的跑,用之不竭!我负责这个项目,智能卡很快就要上市了。
目前在开发者QQ群里听到的消息都是至少持续一个月的赠品。不知道下个月还有没有,所以大家要抓紧时间,利用好这个免费的高性能GPU资源“炼丹”。
获得算力资格很简单。点击file/tupian/20220831/questionnaire活动ID = 525,根据内容提示填写信息,管理员审核后发给你一批智能卡。有了这批可计算卡,你就可以在GPU上启动你的项目,你可以发可计算卡来运行项目,就像鸡生蛋,鸡生蛋,你的可计算力用之不竭。
工作室中人工智能选定项目的集合
点击“阅读原文”或打开以下链接查看所有项目:
file/tupian/20220831/aistudio/messagedetail/42
初学者如何用好AI studio
熟悉Python的读者可以跳过这一节。
纯新手可能还不知道如何使用AI Studio。其实很简单。下面提供了很多教程,都是jupyter笔记本的形式。当你点击链接,你会看到一个叉按钮。然后,在弹出的框中,输入项目名称和项目名称。
完成后,会弹出一个对话框,询问您是否想现在运行它。
点击“运行项目”,将为您打开一个运行环境。
进入后点击“运行”按钮,弹出选择环境。
然后选择运行环境。没有电源卡?没关系。单击上面的“Apply ”(应用),按照提示逐步点击。提交成功后,将获得一段时间的免费计算能力。
下面所有链接都是Jupyter笔记本。如果要修改代码并运行,只需按照上面的步骤进行分叉并运行即可。
深度学习初级项目集合:
file/tupian/20220831/aistudio/projectdetail/128773
即使你是Python新手,也没关系。AI Studio社区提供初学者入门教程,不需要在本地搭建环境,直接在AI Studio提供的环境中运行例程,添加、删除、修改代码,测试你的想法。Python新手项目:Python零基础速成班。
学完上面的新手Python课程,要不要先练好Python的技能再开始深度学习?这里有一个Python爬虫项目,教你从豆瓣抓取电影数据,非常适合巩固Python技能。而且项目还教会你将抓取的数据以数据帧格式显示,为后续的机器学习项目打下良好的基础。请参考:Python入门-豆瓣电影抓取。
上面的分类器有没有找到一点入门的感觉?做点实事。买房是每个人的人生大事?机器学习能让你预测未来的房价走势吗?下面的示例项目将使用线性回归模型来与您探讨这个问题。可以查看:波士顿房价预测。
通过以上问题,你是否对机器学习有了更多的感悟?你是不是觉得上面的模式太简单了,跟不上你的快速进步?好了,现在开始学习深度学习模型。从计算机视觉开始。
计算机视觉入门最基本的数据集是MNIST。MNIST包含70,000张手写数字图像,范围从0到9。我们现在要开发一个模型,让模型可以区分手写的0-9。详情请见CV-手写数字识别,深度学习入门。
达到90%以上的准确率是不是太容易了?没事,这里有不同的MNIST数据叫做fashion-mnist,但这次不是手写的数字,而是十种时尚。还能保持同样的高精度吗?详情请参考《时尚-MNIST》数据集。
除了计算机视觉,NLP也是深度学习的热门领域。要开始使用NLP,为什么不先尝试文本分类?详见NLP-文本分类,深度学习介绍。
如果你是新手,经过以上项目的训练,应该算小初学者。接下来就是晋级了。
1.高级学习者如何利用好AI studio学习深度学习算法?
深入学习总是痛苦的。主要是例子不够多,有些例子不够详细。有详细的例子但是不知道看哪个。为了让读者快速入门,我按照由易到繁的顺序总结了一些例子。根据例子所属的领域,以及难易程度,我把它们分成了两个主要部分:
计算机视觉自然语言处理
项目地址:
file/tupian/20220831/aistudio/projectdetail/128832
首先可以学习和练习图像分类的算法。
图像分类是根据图像的信息来区分不同类型的图像,是计算机视觉中一个重要的基础问题。图像分类按照粒度可以分为两种,精细度就是识别类型,比如是猫还是狗。细粒化就是给你一张照片,让你用模型识别这是缅因猫还是挪威林猫)。
现在我们来做一个粗粒度的猫狗识别分类器。我们的任务是训练一个分类器来区分猫和狗。详见卷积神经网络练习-猫狗分类。
如果你已经掌握了上面的猫狗分类器,那么恭喜你,你对深度学习图像分类模型有了进一步的了解。接下来,我们要做一些细粒度的东西。这是什么?现在最火的是人脸识别。这里有一个简单的人脸识别模型。这个模型还能识别章子怡的照片!你知道怎么做吗?单击链接进行探索。详见《卷积神经网络——人脸识别的初步研究》。
也许学完上面两个例子,你会提出疑问。猫狗识别就是判断一张照片里面是猫还是狗。但如果一张照片里有10只猫和5只狗,模特该怎么办?模型真的知道对象是目标吗?有什么办法让模特知道目标?要先用目标探测,把猫狗的位置圈出来,然后一个一个处理。对了,听起来是高大上的无人驾驶技术,目标检测也是其核心技术之一。接下来,介绍了几种目标检测模型。
主流的目标检测算法主要分为两类:
1)两阶段法,其主要思想是通过启发式方法或CNN网络生成一系列稀疏候选盒,然后对这些候选盒进行分类回归。两阶段法的优点是精度高;代表算法是R-CNN系列算法。想更深入的学习是怎么回事?ai社区提供了Mask RCNN的详细教程:
file/tupian/20220831/aistudio/projectdetail/122273。
除了Mask RCNN,另一个名字叫Faster-RCNN。
file/tupian/20220831/aistudio/projectdetail/122275
2)一步法,如YOLO和SSD,其主要思想是对不同位置的图片进行均匀密集的采样。采样时可以采用不同的尺度和长宽比,然后用CNN提取特征然后直接分类回归。整个过程只需要一步,所以它的优点是速度快,但是均匀密集采样的图片的一个重要缺点是训练困难。这主要是因为正样本和负样本极不平衡,导致模型精度略低。
在AI工作室社区找到了Yolo和SSD的教程。
YOLO教程中使用的数据集是一个自定义的螺母数据集。下面的教程涵盖了YOLO v3和YOLO v3-tiny,不仅可以让你很好地学习YOLO,还提供了可以部署在低能耗设备上的模型。
下一步是引入SSD。下面的教程使用的是基于预训练mobile-net的SSD,使用的数据集是pascal-voc。
这里先介绍计算机视觉的高级内容,再介绍NLP的高级内容。如果想学习更高级的CV模型算法,请进入下一章。
自然语言处理
项目地址:
file/tupian/20220831/aistudio/projectdetail/128857
我们又回到了NLP技术领域。假设我们学了前面爬豆瓣的课,有了一部著名电影的影评。我们怎么知道它的名声如何?通过这篇文章,我们可以通过语言直接看到人类的情感。但是,为了方便起见,下面的示例没有直接使用之前收集的数据集,而是使用处理后的IMDB电影数据集。详见循环神经网络NLP-情绪分类。
实际上,情感分类是一项非常重要的技术。我之前做过股市上的情绪分析算法,可以找出市场情绪对股市走势的影响。但是,如果你觉得情感分类还是太简单,那么恭喜你,你的进步很快。那你接下来可以试试更难的,就是机器翻译。oar frame收集了一个名为WMT-14的数据集,提供了193319个训练数据和6003个测试数据,应该足够你去探索了。详情请参考深度学习中的高级NLP-机器翻译。
2.高级学习者如何用好AI studio
像以前一样,该项目将在两个主要方向上引入:计算机视觉和NLP:
计算机视觉
分类不够?让我们来一个人体姿态估计和跟踪项目来轰炸你的大脑。下面的项目是试图重现论文“人体姿态估计和跟踪的简单基线”中的结构。项目名称:人体姿态估计和跟踪的关键点检测。
接下来,介绍一项激动人心的技术:GAN。生成网络是一种无监督的学习方式,就是通过让两个神经网络对战来学习。GAN由生成网络和鉴别网络组成。生成网络从势空室中随机抽样作为其输入,其输出结果需要尽可能模仿训练集中的真实样本。判断网络的输入是真实样本还是生成网络的输出,目的是尽可能地区分生成网络的输出和真实样本。生成的网络尽可能欺骗判别网络,两个网络对抗,不断调整参数。生成网络常用来生成假图。此外,这种方法还用于生成电影、三维物体模型等。我们将利用GAN做一个图像风格转换的项目:风格转换的图像翻译Pix2Pix。
自然语言处理
现在,对话和聊天机器人非常流行。但是,为了让聊天机器人理解用户,需要识别对话情绪。重点识别智能对话场景中用户的情绪。厄尼在这方面发表了自己的模型。通过对海量数据中的词语、实体、实体关系进行建模,学习真实世界的语义知识。与BERT学习原始语言信号相比,ERNIE直接对先验语义知识单元进行建模,增强了模型的语义表示能力。下面这个项目带你学习厄尼:“厄尼对话情感识别”。
我们之前讲过语言情感分类和语言翻译。你不觉得很简单吗?对机器来说很幼稚。但是如果让机器做阅读理解,或者让机器答题呢?有没有想过?有一个模型让所有这些问题都有了希望,这个模型就是BERT。知道BERT是什么以及它是如何工作的吗?以下项目可以帮助你:语义表示模型BERT
机器阅读理解是自然语言处理中的关键任务之一,它要求机器对语言有深刻的理解,才能找到正确的答案。机器阅读理解领域有一个著名的模型,叫做BiDAF模型。以下项目将帮助您了解更多:BiDAF机器阅读理解模型。
3.AI Studio上的其他学习项目
由于CV和NLP都是热门的研究领域,所以上述项目中只提到了CV和NLP。而深度学习的研究范围和应用范围都很广,但由于篇幅有限,无法一一详述。为了照顾更多领域的读者,这里有一些推荐算法的AI Studio项目,在此列出,不一一介绍。有兴趣的读者可以研究一下。
基于PaddlePaddle的SR-GNN推荐算法file/tupian/20220831/aistudio/projectdetail/124382个性化推荐多视图Simnet模型file/tupian/20220831/aistudio/ project detail/122294 PaddlePaddle分布式推荐算法的实践file/tupian/20220831/404 paddle实现file/tupian/20220831/ tagspace的个性化推荐https://aistudio . Baidu . com/aistudio/project detail/122298 tagspace https://aistudio . Baidu . com/推荐算法gru4rec的PaddlePaddle paddle实现file/tupian/20220831/aistudio/projectdetail/122296
还想找更多的AI Studio深度学习项目?还是不知道怎么解决问题?可以去以下两个地方寻求帮助。
项目收集页面,这里有很多官方和其他机器学习爱好者发布的项目:https://aistudio . Baidu . com/aistudio/project overview/public/1
论坛,如果你有难题,上来看看有没有人遇到过同样的情况:https://ai.baidu.com/forum/topic/list/192.
总结
本文介绍了AI Studio,一个赋予免费GPU计算能力的深度学习平台。首先介绍了什么是AI Studio,它在性能上有什么优势,如何获得免费的GPU计算能力。最后用大量篇幅介绍如何利用好AI Studio上的学习资源,实现从初学者到高级水平的深度学习。
现在每天赠送24小时计算能力就像天上掉下来的羊毛,不会浪费。羊毛不是天天有,什么时候卖就什么时候卖!
点击“阅读原文”或打开以下链接查看所有项目:
file/tupian/20220831/aistudio/messagedetail/42