• 深度学习(Deep Learning,DL)
  • 日期 : 2025-06-11     点击量 : 95

      深度学习是机器学习的一个子领域,它通过模拟人脑神经元连接方式构建的多层神经网络来学习和表示数据。与传统的机器学习方法相比,深度学习的"深度"体现在其多层次的非线性处理架构,能够自动从原始数据中提取多层次的特征表示,而无需依赖人工设计的特征。其核心思想是构建一个由多个处理层组成的计算模型,通过组合低层特征形成更加抽象的高层特征表示。这种分层特征学习方式使深度学习特别适合处理高维、复杂的非结构化数据,如图像、视频、语音和文本。


      深度学习的基础单元是人工神经元,它模拟生物神经元的工作方式:接收输入信号,进行加权求和,然后通过非线性激活函数产生输出。多个神经元相互连接形成神经网络,而"深度"神经网络通常指具有多个隐藏层的网络结构。


      神经网络中的关键数学运算包括:
    前向传播:数据从输入层经过各隐藏层到输出层的计算过程
    反向传播:误差从输出层反向传递以调整网络参数的算法

    梯度下降:通过计算损失函数梯度来优化网络参数的迭代方法


      深度学习的优势在于能够自动学习数据的最佳表示,避免了繁琐且专业性强的人工特征工程。但其局限性也很明显:需要大量标注数据、计算成本高、模型解释性差,且对超参数选择敏感。

      

      主要架构:卷积神经网络(CNN);循环神经网络(RNN);Transformer;生成对抗网络(GAN);图神经网络(GNN)。

     
     
      应用领域:图像识别(ResNet);机器翻译(Transformer);语音识别(WaveNet);游戏AI(AlphaGo);蛋白质结构预测(AlphaFold)等。