内容介绍
本书是一本介绍深度学习?心算法的书籍。书中以轻松、直白的语言,生动、详细地介绍了与深度学习模型相关的基础知识,深入剖析了深度学习?心算法的原理与本质。同时,书中配有大量案例与源码,帮助读者切实体会深度学习的核心思想和精妙之处。此外,书中还介绍了深度学习在计算机视觉、自然语言处理和推荐系统领域的应用,从原理层面揭示其思想,帮助读者在这些领域中夯实技术基础。
作者介绍
冯超毕业于中国科学院大学,现任阿里巴巴高级算法专家,曾在滴滴出行、猿辅导等公司担任核心算法业务负责人。自 2016 年起,在知乎开设技术专栏,并著有技术书《深度学习轻松学:核心算法与视觉实践》《强化学习精要:核心算法与 TensorFlow 实现》。
关联推荐
本书适合对深度学习感兴趣的读者阅读,也适合有志于从事计算机视觉研究等领域的广大学生阅读,可作为深度学习的入门教材。
目录
第 1 章 从生活走进深度学习 .1
1.1 钞票面值问题.1
1.2 机器学习的特征表示 .5
1.3 机器学习 .10
1.4 深度学习的逆袭 .14
1.5 总结与提问 .19
第 2 章 构建小型神经网络 .20
2.1 线性代数基础.21
2.2 全连接层与非线性函数 .27
2.3 神经网络可视化 .30
2.4 反向传播法 .35
2.5 反向传播法的计算方法 .37
2.6 反向传播法在计算上的抽象 .40
2.7 反向传播法在批量数据上的推广 .42
2.8 模型训练与结果可视化 .46
2.9 总结与提问 .48
第 3 章 多层网络与分类.50
3.1 MNIST 数据集.50
3.2 概率论基础 .51
3.3 Softmax 函数.57
3.4 交叉熵损失 .60
3.5 使用 PyTorch 实现模型构建与训练 .67
3.6 模型结果分析.72
3.7 总结与提问 .74
第 4 章 卷积神经网络 .76
4.1 卷积操作 .76
4.2 卷积层汇总了什么.83
4.3 卷积层的反向传播.87
4.4 ReLU .93
4.5 Pooling 层 .97
4.6 卷积神经网络实验.101
4.7 卷积神经网络的感受野 .103
4.8 总结与提问 .112
第 5 章 网络初始化 .113
5.1 错误的初始化.113
5.2 关于数值的初始化实验 .116
5.3 Xavier 初始化.122
5.4 MSRA 初始化 .128
5.5 ZCA 初始化.132
5.6 总结与提问 .138
第 6 章 网络优化 .140
6.1 梯度下降法 .140
6.2 动量法 .145
6.3 随机梯度下降的变种算法 .151
6.4 总结与提问 .164
第 7 章 进一步强化网络.165
7.1 Dropout.165
7.2 Batch Normalization.168
7.3 总结与提问 .176
第 8 章 高级网络结构 .178
8.1 CIFAR10 数据集 .178
8.2 VGG 模型 .179
8.3 ResNet.183
8.4 Inception .195
8.5 通道分解的网络 .196
8.6 总结与提问 .202
第 9 章 网络可视化 .203
9.1 模型优化路径的简单可视化 .203
9.2 卷积神经网络的可视化 .206
9.3 图像风格转换.211
9.4 总结与提问 .217
第 10 章 物体检测 .218
10.1 物体检测的评价指标 .218
10.2 YOLOv3:一阶段检测算法.223
10.3 Faster RCNN:两阶段检测算法 .230
10.4 总结与提问 .235
第 11 章 词嵌入.237
11.1 One-Hot 编码的缺点.237
11.2 分布式表征 .238
11.3 负采样 .242
11.4 SGNS 实现243
11.5 tSNE.247
11.6 总结与提问 .255
第 12 章 循环神经网络 .256
12.1 语言模型与循环神经网络.256
12.2 RNN 实现.259
12.3 LSTM 网络 .262
12.4 语言模型实践.266
12.5 LSTM 网络的可视化与分析 .272
12.6 RNN 的应用类型 .274
12.7 CTC .276
12.8 总结与提问 .282
第 13 章 Transformer .284
13.1 Transformer 模型的基本结构 .286
13.2 模型训练与预测 .293
13.3 BERT 模型.296
13.4 总结与提问 .303
第 14 章 深度分解模型 .304
14.1 分解机 .306
14.2 评价指标 AUC.310
14.3 DeepFM .314
14.4 DeepFM 的改进方法 .317
14.5 总结与提问 .322