文章 2024-06-13 来自:开发者社区

【从零开始学习深度学习】40. 算法优化之AdaGrad算法介绍及其Pytorch实现

1. AdaGrad算法介绍 1.1 AdaGrad算法特点 需要强调的是,小批量随机梯度按元素平方的累加变量st出现在学习率的分母项中。因此,如果目标函数有关自变量中某个元素的偏导数一直都较大,那么该元素...

【从零开始学习深度学习】40. 算法优化之AdaGrad算法介绍及其Pytorch实现
文章 2024-06-13 来自:开发者社区

【从零开始学习深度学习】39. 梯度下降优化之动量法介绍及其Pytorch实现

1. 梯度下降中的问题 %matplotlib inline import sys import d2lzh...

【从零开始学习深度学习】39. 梯度下降优化之动量法介绍及其Pytorch实现
文章 2024-06-13 来自:开发者社区

【从零开始学习深度学习】38. Pytorch实战案例:梯度下降、随机梯度下降、小批量随机梯度下降3种优化算法对比【含数据集与源码】

1. 梯度下降、随机梯度下降、小批量随机梯度下降区别 梯度下降:在每一次迭代中,梯度下降使用整个训练数据集来计算梯度,一个epoch周期内参数只更新一次。 随机梯度下降:在每次迭代中,只随机采样一个样本来计算梯度,一个epoch周期内会进行样本数目次参数更新。 小批量随机梯度下降:在每次迭代中随机均匀采样多个样本来组成一个小批量来计算梯度,一个epoch周期内会进行(样本...

【从零开始学习深度学习】38. Pytorch实战案例:梯度下降、随机梯度下降、小批量随机梯度下降3种优化算法对比【含数据集与源码】
文章 2024-06-13 来自:开发者社区

【从零开始学习深度学习】36. 门控循环神经网络之长短期记忆网络(LSTM)介绍、Pytorch实现LSTM并进行训练预测

1 长短期记忆介绍 LSTM 中引入了3个门,即输入门(input gate)、遗忘门(forget gate)和输出门(output gate),以及与隐藏状态形状相同的记忆细胞(某些文献把记忆细胞当成一种特殊的隐藏状态),从而记录额外的信息。 1.1 输入门、遗忘门和输出门 与门控循环单元中的重置门和更新门一样,如下图所示,长短期记忆的门的输入均为当前时间步输入Xt与...

【从零开始学习深度学习】36. 门控循环神经网络之长短期记忆网络(LSTM)介绍、Pytorch实现LSTM并进行训练预测
文章 2024-06-13 来自:开发者社区

【从零开始学习深度学习】35. 门控循环神经网络之门控循环单元(gated recurrent unit,GRU)介绍、Pytorch实现GRU并进行训练预测

1. 门控循环单元设计 门控循环单元的设计在原始RNN的基础上引入了重置门(reset gate)和更新门(update gate)的概念,从而修改了循环神经网络中隐藏状态的计算方式。 1.1 重置门和更新门 如下图所示,门控循环单元中的重置门和更新门的输入均为当前时间步输入Xt与上一时间步隐藏状态Ht−1,输出由激活函数为sigmoid函数的全连接层计算得到。 ...

【从零开始学习深度学习】35. 门控循环神经网络之门控循环单元(gated recurrent unit,GRU)介绍、Pytorch实现GRU并进行训练预测
文章 2024-06-13 来自:开发者社区

【从零开始学习深度学习】34. Pytorch-RNN项目实战:RNN创作歌词案例--使用周杰伦专辑歌词训练模型并创作歌曲【含数据集与源码】

RNN项目实战使用周杰伦专辑歌词训练模型并创作歌曲 本文将介绍如何预处理一个语言模型数据集,并将其转换成字符级循环神经网络所需要的输入格式。然后通过循环神经网络RNN进行模型训练,然后使用训练好的模型创作歌曲。 语言模型数据集采用的是我最喜欢的歌手周杰伦第一张专辑《Jay》到第十张专辑《跨时代》中的所有歌词,下面来开始我们的项目吧。 1.语言模型数据集预处理 1....

【从零开始学习深度学习】34. Pytorch-RNN项目实战:RNN创作歌词案例--使用周杰伦专辑歌词训练模型并创作歌曲【含数据集与源码】
文章 2024-06-13 来自:开发者社区

【从零开始学习深度学习】32. 卷积神经网络之稠密连接网络(DenseNet)介绍及其Pytorch实现

稠密连接网络(DenseNet)是在ResNet网络的基础上进行改进的。对比如下: 上图中将部分前后相邻的运算抽象为模块A AA和模块B BB。与ResNet的主要区别在于,DenseNet里模块B BB的输出不是像ResN...

【从零开始学习深度学习】32. 卷积神经网络之稠密连接网络(DenseNet)介绍及其Pytorch实现
文章 2024-06-13 来自:开发者社区

【从零开始学习深度学习】31. 卷积神经网络之残差网络(ResNet)介绍及其Pytorch实现

和之前介绍的批量归一化层作用类似,残差网络(ResNet)提出的主要目的也是为了优化深度神经网络中数值稳定性问题。 1. 残差块介绍 假设输入为x,希望学出的理想映射为f(x)。下图左右为普通网络结构与加入残差连接的网络对比。右侧是ResNet残差网络的基础块,即残差块(residual block)。在残差块中,输入可通过跨层的数据线路更快地向前传播。 ...

【从零开始学习深度学习】31. 卷积神经网络之残差网络(ResNet)介绍及其Pytorch实现
文章 2024-06-13 来自:开发者社区

【从零开始学习深度学习】30. 神经网络中批量归一化层(batch normalization)的作用及其Pytorch实现

通常,对于较浅层的神经网路,对输入数据进行标准化预处理就已经很有效果了,但是当神经网络的层数过多时,即使输入数据已做标准化,训练中模型参数的更新依然很容易造成靠近输出层输出的剧烈变化。这种计算数值的不稳定性通常令我们难以训练出有效的深度模型。 批量归一化(batch normalization)层的主要目的是在模型训练时,批量归一化利用小批量上的均值和标准差,不断调整神经网络中间输出,从...

【从零开始学习深度学习】30. 神经网络中批量归一化层(batch normalization)的作用及其Pytorch实现
文章 2024-06-13 来自:开发者社区

【从零开始学习深度学习】29.卷积神经网络之GoogLeNet模型介绍及用Pytorch实现GoogLeNet模型【含完整代码】

GoogLeNet网络架构于2014年由Google团队提出,并且在2014年的ImageNet图像识别挑战赛中大放异彩 。GoogLeNet吸收了NiN中网络串联网络的思想,并在此基础上做了很大改进。在随后几年GoogLeNet经历了从v1、v2、v3、v4几个版本的改进过程。本文主要介绍最基础的GoogLeNet v1网络架构。 1. Inception 块的基础结构 **G...

【从零开始学习深度学习】29.卷积神经网络之GoogLeNet模型介绍及用Pytorch实现GoogLeNet模型【含完整代码】

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

智能引擎技术

AI Online Serving,阿里巴巴集团搜推广算法与工程技术的大本营,大数据深度学习时代的创新主场。

+关注