深度学习 云计算背景
深度学习进阶篇-预训练模型[3]:XLNet、BERT、GPT,ELMO的区别优缺点,模型框架、一些Trick、Transformer Encoder等原理详解

深度学习进阶篇-预训练模型[3]:XLNet、BERT、GPT,ELMO的区别优缺点,模型框架、一些Trick、Transformer Encoder等原理详解

深度学习进阶篇-预训练模型[3]:XLNet、BERT、GPT,ELMO的区别优缺点,模型框架、一些Trick、Transformer Encoder等原理详解 1.XLNet:Generalized Autoregressive Pretraining for Language Understan...

深度学习进阶篇-预训练模型[2]:Transformer-XL、Longformer、GPT原理、模型结构、应用场景、改进技巧等详细讲解

深度学习进阶篇-预训练模型[2]:Transformer-XL、Longformer、GPT原理、模型结构、应用场景、改进技巧等详细讲解

深度学习进阶篇-预训练模型[2]:Transformer-XL、Longformer、GPT原理、模型结构、应用场景、改进技巧等详细讲解 1.Transformer-XL: Attentive Language Models Beyonds a Fixed-Length Context 1.1. T...

高校精品课-复旦大学-机器学习与深度学习

1 课时 |
105 人已学 |
免费

深度学习框架TensorFlow入门

24 课时 |
17302 人已学 |
免费

深度学习与自动驾驶

12 课时 |
3062 人已学 |
免费
开发者课程背景图
深度学习进阶篇-预训练模型1:预训练分词Subword、ELMo、Transformer模型原理;结构;技巧以及应用详解

深度学习进阶篇-预训练模型1:预训练分词Subword、ELMo、Transformer模型原理;结构;技巧以及应用详解

深度学习进阶篇-预训练模型[1]:预训练分词Subword、ELMo、Transformer模型原理;结构;技巧以及应用详解 从字面上看,预训练模型(pre-training model)是先通过一批语料进行训练模型,然后在这个初步训练好的模型基础上,再继续训练或者另作他用。这样的理解基本上是对的,...

深度学习基础入门篇-序列模型[11]:循环神经网络 RNN、长短时记忆网络LSTM、门控循环单元GRU原理和应用详解

深度学习基础入门篇-序列模型[11]:循环神经网络 RNN、长短时记忆网络LSTM、门控循环单元GRU原理和应用详解

深度学习基础入门篇-序列模型[11]:循环神经网络 RNN、长短时记忆网络LSTM、门控循环单元GRU原理和应用详解 1.循环神经网络 RNN 生活中,我们经常会遇到或者使用一些时序信号,比如自然语言语音,自然语言文本。以自然语言文本为例,完整的一句话中各个字符之间是有时序关系的,各个字符顺序的调换...

【深度学习】1、优化方法原理与实践对比——非常详细与全面(二)

【深度学习】1、优化方法原理与实践对比——非常详细与全面(二)

6、Adadelta    Adadelta考虑了一些更新量“单位”的问题。为了让“单位”匹配,Adadelta选择在分子上再增加一个项目,于是方法的概念公式变成:其中RMS表示Root Mean Square,也就是“均方根”的意思。分母中的RMS[g]t展开与RMS...

【深度学习】1、优化方法原理与实践对比——非常详细与全面(一)

【深度学习】1、优化方法原理与实践对比——非常详细与全面(一)

简介    在传统的机器学习算法的实践中,优化总是重头戏,也是最考验功底的部分。深度学习得益于传统的有效方式,往往普通的随机下降优化算法就能取得不错的训练效果,优化的重要性相比于传统机器学习要弱一些,大部分从业者主要聚焦于应用或模型创新,而优化部分更多的工作只...

【深度学习】Dropout原理以及代码实现

【深度学习】Dropout原理以及代码实现

Drouout起源随着深度学习的发展,各种网络结构层出不穷,导致网络越来越深,数据的容纳量越来越大,模型的参数也越来越多,这样就会导致神经网络很容易过拟合,过拟合的模型几乎是不能用于实践中的,因为拟合的数据与测试数据不一致,导致模型的泛化性能较低。由于这个问题,现在有很多...

【从零开始学习深度学习】5.用于分类问题的softmax回归模型原理简介

【从零开始学习深度学习】5.用于分类问题的softmax回归模型原理简介

前言前两篇文章介绍的线性回归模型适用于输出为连续值的情景。在另一类情景中,模型输出可以是一个像图像类别这样的离散值。对于这样的离散值预测问题,我们可以使用诸如softmax回归在内的分类模型。和线性回归不同,softmax回归的输出单元从一个变成了多个,且引入了softmax运算使输出更适合离散值的...

机器学习/深度学习中的常用损失函数公式、原理与代码实践(持续更新ing...)

机器学习/深度学习中的常用损失函数公式、原理与代码实践(持续更新ing...)

1. 分类 - 交叉熵讲解博文:损失函数|交叉熵损失函数 - 知乎1.1 二分类-BCELoss系二分类可以使用BCELoss,比如链路预测任务预测某条边是否存在,或者多标签分类中将每个类作为一个二分类任务(但是一般来说这样效果会很差),就用BCELoss。torch.nn.BCEWithLogit...

Nat.Mach.Intell.| DEcode:深度学习解读差异基因表达原理

Nat.Mach.Intell.| DEcode:深度学习解读差异基因表达原理

今天给大家介绍拉什大学的Shinya Tasaki 等人在Nature Machine Intelligence上发表的文章“Deep learning decodes the principles of differential gene expression”。作者在文章中提出了一个系统生物学模...

更新时间 2023-05-26 18:56:01

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

智能引擎技术
智能引擎技术
AI Online Serving,阿里巴巴集团搜推广算法与工程技术的大本营,大数据深度学习时代的创新主场。
4025+人已加入
加入
相关电子书
更多
深度学习框架实战-Tensorflow
TensorRT Introduction
端上智能-深度学习模型压缩与加速
立即下载 立即下载 立即下载

深度学习您可能感兴趣