Hello and welcome
   All Categories
D2L 14 自然语言处理:预训练 D2L 14 自然语言处理:预训练
D2L 14 自然语言处理:预训练Word2vec词向量是用于表示单词意义的向量, 并且还可以被认为是单词的特征向量或表示。 将单词映射到实向量的技术称为词嵌入。 近年来,词嵌入逐渐成为自然语言处理的基础知识。虽然独热向量很容易构建,但它们
D2L 13 计算机视觉 D2L 13 计算机视觉
D2L 13 计算机视觉因为对于计算机视觉已经比较熟悉了(主要是通过看论文了解的),所以这一章节也是简单整理 图像增广随机改变训练样本可以减少模型对某些属性的依赖,从而提高模型的泛化能力 为了在预测过程中得到确切的结果,我们通常对训练样本只
D2L 11 优化算法 D2L 11 优化算法
D2L 11 优化算法优化和深度学习经验风险是训练数据集的平均损失,而风险则是整个数据群的预期损失 深度学习优化存在许多挑战。其中一些最令人烦恼的是局部最小值、鞍点和梯度消失 鞍点(saddle point)是指函数的所有梯度都消失但既不是
D2L 10 注意力机制 D2L 10 注意力机制
D2L 10 注意力机制555终于可以开始看注意力机制了😆Transformer 我来啦! 注意力提示生物学中的注意力提示主要有两个概念: 非自主性提示/非随意线索(non-volitional cue),基于环境中物体的突出性和易见性
D2L 09 现代循环神经网络 D2L 09 现代循环神经网络
D2L 09 现代循环神经网络循环神经网络在实践中一个常见问题是数值不稳定性。 尽管我们已经应用了梯度裁剪等技巧来缓解这个问题, 但是仍需要通过设计更复杂的序列模型可以进一步处理它。 具体来说,我们将引入两个广泛使用的网络, 即门控循环单元
D2L 08 循环神经网络 D2L 08 循环神经网络
D2L 08 循环神经网络序列模型处理序列数据需要统计工具和新的深度神经网络架构 统计工具教材以股票的例子作为例子,假设一个交易员想在第 $t$ 日的股市中表现良好,于是通过以下途径预测当天的价格 $x_t$ x_{t} \sim P\l
D2L 07 现代卷积神经网络 D2L 07 现代卷积神经网络
D2L 07 现代卷积神经网络虽然深度神经网络的概念非常简单——将神经网络堆叠在一起。但由于不同的网络结构和超参数选择,这些神经网络的性能会发生很大变化。 本章介绍的神经网络是将人类直觉和相关数学见解结合后,经过大量研究试错后的结晶。 我们
D2L 06 卷积神经网络 D2L 06 卷积神经网络
D2L 06 卷积神经网络本章介绍的卷积神经网络(convolutional neural network,CNN)是一类强大的、为处理图像数据而设计的神经网络。 基于卷积神经网络结构的模型在计算机视觉领域中已经占主导地位,当今几乎所有的图
D2L 05 深度学习计算 D2L 05 深度学习计算
D2L 05 深度学习计算在本章中,我们开始深入探索深度学习计算的关键组件,即模型构建、参数访问与初始化、设计自定义层和块、将模型读写到磁盘,以及利用GPU实现显著的加速。这些知识将使你从基础用户变为高级用户。虽然本章不介绍任何新的模型或数
D2L 04 多层感知机 D2L 04 多层感知机
D2L 04 多层感知机多层感知机线性模型的表示能力是有限的,如果加入隐藏层和非线性运算,模型的表示能力将大大增加。事实上如果隐藏层的节点足够多,模型将能够拟合任意的连续函数 $f(·)$,这就是万能/通用近似 universal appr
1 / 2