scikit-learn机器学习(第2版) PDF格式高清电子书免费下载

scikit-learn机器学习(第2版)

作者 [美]加文·海克(Gavin Hackeling)
译者 张浩然
编辑 胡俊英
出版社 人民邮电出版社
出版日期 2018
页数 786
格式 Paper book / ebook (PDF)
ISBN 978-7-115-50340-4
评分
价格 59
  • 内容简介
  • 免费下载
  • 图书目录
  • 作者简介
  • 出版信息
本书内容共计14章,分别从机器学习基础、简单线性回归、基于K临近法的分类和回归分析、特征提取和预处理、简单回归和多重回归、线性回归和逻辑回归、朴素贝叶斯、决策树的非线性分类和回归、决策树、随机森林和其他方法、感知机、向量机、人工神经网络、K-means聚类等内容。

近年来,Python语言成为了广受欢迎的编程语言,而它在机器学习领域也有很好的表现。scikit-learn是一个用Python语言编写的机器学习算法库,它可以实现一系列常用的机器学习算法,是一个好工具。

本书通过14章内容,详细地介绍了一系列机器学习模型和scikit-learn的使用技巧。本书从机器学习的基础理论讲起,涵盖了简单线性回归、K-近邻算法、特征提取、多元线性回归、逻辑回归、朴素贝叶斯、非线性分类、决策树回归、随机森林、感知机、支持向量机、人工神经网络、K-均值算法、主成分分析等重要话题。

本书适合机器学习领域的工程师学习,也适合想要了解scikit-learn的数据科学家阅读。通过阅读本书,读者将有效提升自己在机器学习模型的构建和评估方面的能力,并能够高效地解决机器学习难题。

scikit-learn机器学习(第2版) PDF格式高清电子书免费下载

第 1章 机器学习基础 1

1.1 定义机器学习 1

1.2 从经验中学习 2

1.3 机器学习任务 3

1.4 训练数据、测试数据和验证数据 4

1.5 偏差和方差 6

1.6 scikit-learn简介 8

1.7 安装scikit-learn 8

1.7.1 使用pip安装 9

1.7.2 在Windows系统下安装 9

1.7.3 在Ubuntu 16.04系统下安装 10

1.7.4 在Mac OS系统下安装 10

1.7.5 安装Anaconda 10

1.7.6 验证安装 10

1.8 安装pandas、Pillow、NLTK和matplotlib 11

1.9 小结 11

第 2章 简单线性回归 12

2.1 简单线性回归 12

2.1.1 用代价函数评价模型的拟合性 15

2.1.2 求解简单线性回归的OLS 17

2.2 评价模型 19

2.3 小结 21

第3章 用K-近邻算法分类和回归 22

3.1 K-近邻模型 22

3.2 惰性学习和非参数模型 23

3.3 KNN模型分类 23

3.4 KNN模型回归 31

3.5 小结 36

第4章 特征提取 37

4.1 从类别变量中提取特征 37

4.2 特征标准化 38

4.3 从文本中提取特征 39

4.3.1 词袋模型 39

4.3.2 停用词过滤 42

4.3.3 词干提取和词形还原 43

4.3.4 tf-idf权重扩展词包 45

4.3.5 空间有效特征向量化与哈希技巧 48

4.3.6 词向量 49

4.4 从图像中提取特征 52

4.4.1 从像素强度中提取特征 53

4.4.2 使用卷积神经网络激活项作为特征 54

4.5 小结 56

第5章 从简单线性回归到多元线性回归 58

5.1 多元线性回归 58

5.2 多项式回归 62

5.3 正则化 66

5.4 应用线性回归 67

5.4.1 探索数据 67

5.4.2 拟合和评估模型 69

5.5 梯度下降法 72

5.6 小结 76

第6章 从线性回归到逻辑回归 77

6.1 使用逻辑回归进行二元分类 77

6.2 垃圾邮件过滤 79

6.2.1 二元分类性能指标 81

6.2.2 准确率 82

6.2.3 精准率和召回率 83

6.2.4 计算F1值 84

6.2.5 ROC AUC 84

6.3 使用网格搜索微调模型 86

6.4 多类别分类 88

6.5 多标签分类和问题转换 93

6.6 小结 97

第7章 朴素贝叶斯 98

7.1 贝叶斯定理 98

7.2 生成模型和判别模型 100

7.3 朴素贝叶斯 100

7.4 在scikit-learn中使用朴素贝叶斯 102

7.5 小结 106

第8章 非线性分类和决策树回归 107

8.1 决策树 107

8.2 训练决策树 108

8.2.1 选择问题 109

8.2.2 基尼不纯度 116

8.3 使用scikit-learn类库创建决策树 117

8.4 小结 120

第9章 集成方法:从决策树到随机森林 121

9.1 套袋法 121

9.2 推进法 124

9.3 堆叠法 126

9.4 小结 128

第 10章 感知机 129

10.1 感知机 129

10.1.1 激活函数 130

10.1.2 感知机学习算法 131

10.1.3 使用感知机进行二元分类 132

10.1.4 使用感知机进行文档分类 138

10.2 感知机的局限性 139

10.3 小结 140

第 11章 从感知机到支持向量机 141

11.1 核与核技巧 141

11.2 最大间隔分类和支持向量 145

11.3 用scikit-learn分类字符 147

11.3.1 手写数字分类 147

11.3.2 自然图片字符分类 150

11.4 小结 152

第 12章 从感知机到人工神经网络 153

12.1 非线性决策边界 154

12.2 前馈人工神经网络和反馈人工神经网络 155

12.3 多层感知机 155

12.4 训练多层感知机 157

12.4.1 反向传播 158

12.4.2 训练一个多层感知机逼近XOR函数 162

12.4.3 训练一个多层感知机分类手写数字 164

12.5 小结 165

第 13章 K-均值算法 166

13.1 聚类 166

13.2 K-均值算法 168

13.2.1 局部最优值 172

13.2.2 用肘部法选择K值 173

13.3 评估聚类 176

13.4 图像量化 178

13.5 通过聚类学习特征 180

13.6 小结 184

第 14章 使用主成分分析降维 185

14.1 主成分分析 185

14.1.1 方差、协方差和协方差矩阵 188

14.1.2 特征向量和特征值 190

14.1.3 进行主成分分析 192

14.2 使用PCA对高维数据可视化 194

14.3 使用PCA进行面部识别 196

14.4 小结 199

点击展开

点击收起

ISBN:978-7-115-50340-4
语言:
包装/印刷类型:1
开本:16开
出版时间:2019-02-01 00:00:00
页数: