深度学习算法作为人工智能领域最重要的核心技术,引领了第三次人工智能浪潮。目前,大多数优秀的智能应用都涉及深度学习算法,各种智能应用系统和平台将在地面、in 空、水上和互联网空以及其他人类认知空中获得越来越多的应用,深刻改变现代人类行动和人工智能的技术比例。
计算机技术是人工智能领域最具挑战性的问题之一,其相关研究工作从未停止。从传统的目标检测算法到现在的基于深度学习的目标检测算法,一直是专家学者的研究热点。作为人工智能领域中一个极其重要的分支,基于深度学习算法的目标检测技术近年来取得了长足的进步和发展。经典的深度学习目标检测模型不断涌现。代表性的算法模型有基于多任务两阶段模式的R-CNN、FastR—CNN、FasterR—CNN。以及开创了深度学习目标检测算法的One Stage时代的YOLO系列和SSD检测算法,以及2021年引起学术界广泛关注并采用注意机制的NLP领域跨界算法模型Transformer。
以上所有算法模型的核心都是基于深度学习的卷积神经网络技术。计算机神经网络是一种模拟人类神经网络以实现人工智能的机器学习技术。人脑中的神经网络是一个非常复杂的组织,成人大脑中估计有1000亿个神经元,负责视觉、听觉、味觉、情感、运动、认知等多项任务。因为现有的计算机还处于算法和计算能力的发展阶段,很难全方位模拟人类的很多能力。而现有的视觉、语言分析等单一任务的人工智能发展已经完全超越了人类的水平。
只是出于工作实践,笔者对计算机神经网络的认知还比较浅,只觉得人工智能领域的深度学习技术的轮廓是由人类的数学知识和计算机算法构建的整体框架,然后结合尽可能多的训练数据和计算机的大规模计算能力来调整内部参数,这是一种半理论半经验的建模方式,尽可能地逼近问题的目标。人类的很多活动或工作也有很强的半理论半经验的特点,真的是不谋而合。
2016年,得益于生物学对人脑神经网络研究的启发,人工智能深度学习技术在计算机软硬件技术的加持下开始快速发展,以数据+计算能力+算法模拟人类神经网络的运行模式。为什么感觉是一种“半理论”,主要是因为人工智能解决的各种问题的最终体现是基本的数学算法。无论图像分类、识别、语义分割、目标检测,最终都是由一系列涉及分类、回归的算法来完成的。为什么是“半经验”?主要是因为人类还不能真正掌握大脑神经网络的运行机制。只有研究的经验或结果告诉我们,大脑神经元是通过生物电传导信息的,所以我们用计算机中的数据运算来模拟人体神经网络中的生物电传递。至于为什么大脑神经网络靠生物电,而计算机靠数据流,这应该是一个经验问题。就像tensorFlow,这个深度学习框架的名字,TensorFlow。
当然,很多人认为计算机神经网络是人类提供输入和正确输出的“黑匣子”。虽然参数调整的过程是基于链式法则,如反向传播-梯度下降,连续迭代等。,求最优解,真的很难理解这个“黑箱”是怎么通过上亿次迭代得到我们想要的模型的。尤其是对于很多开发者来说,调优训练模型不像是一个数学问题,更像是一个“形而上”的问题。调音成功与否需要祈祷!!!这是多么滑稽,甚至是有趣!!!但真正的过程是痛苦、烦躁、疲惫、无助等等的混合体!!!!!——随着技术瓶颈的不断收紧,当前人工智能技术的发展很可能在这里进入“死亡谷”。但是,我真的很期待深度学习技术在沉淀之后的进一步飞跃!!!