编辑推荐
如果你是深度学习爱好者,本书带你从理论到实践一览深度学习的基本概念及其在目标检测领域的应用。 如果你是人工智能从业者,你能获得深度学习与目标检测知识的梳理及工程实践的启发。 内容简介
本书的写作初衷是,从学者的角度,用一种通俗易懂的方式,把与基于深度学习的目标检测的相关论文中的理论和方法呈现给读者,同时针对作者在深度学习教学过程中遇到的难点,进行深入的分析和讲解。本书侧重对卷积神经网络的介绍,而深度学习的内容不止于此。所以,作者将深度学习分为有监督学习、无监督学习和强化学习三类,将图像分类、目标检测、语音识别、人脸识别、对抗生成网络和AlphaGo围棋等应用场景归入不同的类别,并分别对其原理进行了概括性的讲解。本书适合有一定深度学习或目标检测学习基础的学生、研究者、从业者阅读。 作者简介
杜鹏,博士,现任职于华为。2014年起在韩国科学技术学院和新加坡南洋理工大学从事博士后研究。回国后,曾任杭州电子科技大学副教授、浙江核新同花顺网络信息股份有限公司算法研究员。2018年被NVIDIA深度学习学院评为优秀校园大使,在SIGGRAPH、PG等国际著名学术会议发表论文10余篇。谌明,博士。2004年加入美国道富集团,2011年加入浙江核新同花顺网络信息股份有限公司并任首席技术官,推动了包括计算机视觉、语音技术、自然语言处理、机器学习等技术在金融、医疗等领域的商业化落地。苏统华,博士,哈尔滨工业大学副教授,自然手写中文文本识别的开拓者。曾出版手写汉字识别领域的首本英文专著,以及7本GPU计算和大数据分析方面的译作,所领导的NVIDIA GPU教育中心连续4年被NVIDIA评为中国区优秀GPU教育中心。 目录
基础篇 第1章 深度学习概述 2 1.1 深度学习发展简史 2 1.2 有监督学习 4 1.2.1 图像分类 4 1.2.2 目标检测 6 1.2.3 人脸识别 10 1.2.4 语音识别 13 1.3 无监督学习 18 1.3.1 无监督学习概述 18 1.3.2 生成对抗网络 18 1.4 强化学习 21 1.4.1 AlphaGo 21 1.4.2 AlphaGo Zero 23 1.5 小结 25 参考资料 25 第2章 深度神经网络 27 2.1 神经元 27 2.2 感知机 30 2.3 前向传递 31 2.3.1 前向传递的流程 32 2.3.2 激活函数 33 2.3.3 损失函数 37 2.4 后向传递 40 2.4.1 后向传递的流程 40 2.4.2 梯度下降 40 2.4.3 参数修正 42 2.5 防止过拟合 44 2.5.1 dropout 44 2.5.2 正则化 45 2.6 小结 46 第3章 卷积神经网络 47 3.1 卷积层 48 3.1.1 valid卷积 48 3.1.2 full卷积 50 3.1.3 same卷积 51 3.2 池化层 52 3.3 反卷积 53 3.4 感受野 54 3.5 卷积神经网络实例 56 3.5.1 LeNet-5 56 3.5.2 AlexNet 58 3.5.3 VGGNet 62 3.5.4 GoogLeNet 64 3.5.5 ResNet 75 3.5.6 MobileNet 76 3.6 小结 78
进阶篇 第4章 两阶段目标检测方法 80 4.1 R-CNN 80 4.1.1 算法流程 80 4.1.2 训练过程 81 4.2 SPP-Net 85 4.2.1 网络结构 85 4.2.2 空间金字塔池化 86 4.3 Fast R-CNN 87 4.3.1 感兴趣区域池化层 87 4.3.2 网络结构 89 4.3.3 全连接层计算加速 90 4.3.4 目标分类 91 4.3.5 边界框回归 92 4.3.6 训练过程 93 4.4 Faster R-CNN 97 4.4.1 网络结构 98 4.4.2 RPN 99 4.4.3 训练过程 105 4.5 R-FCN 107 4.5.1 R-FCN网络结构 108 4.5.2 位置敏感的分数图 109 4.5.3 位置敏感的RoI池化 110 4.5.4 R-FCN损失函数 111 4.5.5 Caffe网络模型解析 111 4.5.6 U-Net 115 4.5.7 SegNet 116 4.6 Mask R-CNN 117 4.6.1 实例分割简介 118 4.6.2 COCO数据集的像素级标注 119 4.6.3 网络结构 120 4.7 小结 123 参考资料 123 第5章 单阶段目标检测方法 125 5.1 SSD 125 5.1.1 default box 125 5.1.2 网络结构 126 5.1.3 Caffe网络模型解析 127 5.1.4 训练过程 135 5.2 RetinaNet 137 5.2.1 FPN 137 5.2.2 聚焦损失函数 139 5.3 RefineDet 140 5.3.1 网络模型 141 5.3.2 Caffe网络模型解析 143 5.3.3 训练过程 152 5.4 YOLO 153 5.4.1 YOLO v1 153 5.4.2 YOLO v2 155 5.4.3 YOLO v3 157 5.5 目标检测算法应用场景 159 5.5.1 高速公路坑洞检测 160 5.5.2 息肉检测 161 5.6 小结 162 参考资料 162
应用篇 第6章 肋骨骨折检测 166 6.1 国内外研究现状 166 6.2 解决方案 168 6.3 预处理 168 6.4 肋骨骨折检测 169 6.5 实验结果分析 170 6.6 小结 172 参考资料 173 第7章 肺结节检测 174 7.1 国内外研究现状 174 7.2 总体框架 176 7.2.1 肺结节数据集 176 7.2.2 肺结节检测难点 177 7.2.3 算法框架 177 7.3 肺结节可疑位置推荐算法 178 7.3.1 CT图像的预处理 179 7.3.2 肺结节分割算法 180 7.3.3 优化方法 182 7.3.4 推断方法 184 7.4 可疑肺结节定位算法 185 7.5 实验结果与分析(1) 186 7.5.1 实验结果 186 7.5.2 改进点效果分析 186 7.6 假阳性肺结节抑制算法 188 7.6.1 假阳性肺结节抑制网络 188 7.6.2 优化策略 192 7.6.3 推断策略 194 7.7 实验结果与分析(2) 194 7.7.1 实验结果 195 7.7.2 改进点效果分析 195 7.7.3 可疑位置推荐与假阳性抑制算法的整合 197 7.8 小结 197 参考资料 197 第8章 车道线检测 200 8.1 国内外研究现状 200 8.2 主要研究内容 202 8.2.1 总体解决方案 202 8.2.2 各阶段概述 203 8.3 车道线检测系统的设计与实现 206 8.3.1 车道线图像数据标注与筛选 206 8.3.2 车道线图片预处理 208 8.3.3 车道线分割模型训练 212 8.3.4 车道线检测 221 8.3.5 车道线检测结果 225 8.4 车道线检测系统性能测试 225 8.4.1 车道线检测质量测试 225 8.4.2 车道线检测时间测试 227 8.5 小结 227 参考资料 228 第9章 交通视频分析 229 9.1 国内外研究现状 230 9.2 主要研究内容 231 9.2.1 总体设计 232 9.2.2 精度和性能要求 232 9.3 交通视频分析 233 9.3.1 车辆检测和车牌检测 233 9.3.2 车牌识别功能设计详解 235 9.3.3 车辆品牌及颜色的识别 243 9.3.4 目标跟踪设计详解 244 9.4 系统测试 247 9.4.1 车辆检测 248 9.4.2 车牌检测 251 9.4.3 车牌识别 253 9.4.4 车辆品牌识别 256 9.4.5 目标跟踪 258 9.5 小结 259 参考资料 260
|