精通数据科学算法 PDF格式高清电子书免费下载

精通数据科学算法

作者 [英]戴维·纳蒂加(David Natingga)
译者 封强 赵运枫 范东来
出版社 人民邮电出版社
出版日期 2018
页数
格式 Paper book / ebook (PDF)
ISBN 9787115498168
评分
价格 59
  • 内容简介
  • 图书目录
  • 免费下载

出版信息

ISBN:9787115498168
语言:简体中文
包装/印刷类型:2
开本:16开
出版时间:2019-05-01 00:00:00
页数:

内容简介

全书共有7章,讲解了7种重要的数据分析方法,它们分别是k最近邻算法、朴素贝叶斯算法、决策树、随机森林、k-means聚类、回归分析以及时间序列分析。每一章都以一个简单的例子开始,先讲解该算法的基本概念与知识,然后通过对案例进行扩展以讲解一些特殊的分析算法。这种方式有益于读者深刻理解算法。

数据科学(Data Science)是从数据中提取知识的技术,是一门有关机器学习、统计学与数据挖掘的交叉学科。数据科学包含了多种领域的不同元素,包括信号处理、数学、概率模型技术和理论、计算机编程、统计学等。

本书讲解了7种重要的数据分析方法,它们分别是k最近邻算法、朴素贝叶斯算法、决策树、随机森林、k-means聚类、回归分析以及时间序列分析。全书共7章,每一章都以一个简单的例子开始,先讲解算法的基本概念与知识,然后通过对案例进行扩展以讲解一些特殊的分析算法。这种方式有益于读者深刻理解算法。

本书适合数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。

图书目录

第 1 章 用k最近邻算法解决分类问题

1.1 Mary对温度的感觉

1.2 实现k最近邻算法

1.3 意大利地区的示例——选择k值

1.4 房屋所有权——数据转换

1.5 文本分类——使用非欧几里德距离

1.6 文本分类——更高维度的k-NN

1.7 小结

1.8 习题

第 2 章 朴素贝叶斯

2.1 医疗检查——贝叶斯定理的基本应用

2.2 贝叶斯定理的证明及其扩展

2.3 西洋棋游戏——独立事件

2.4 朴素贝叶斯分类器的实现

2.5 西洋棋游戏——相关事件

2.6 性别分类——基于连续随机变量的贝叶斯定理

2.7 小结

2.8 习题

第 3 章 决策树

3.1 游泳偏好——用决策树表示数据

3.2 信息论 044

3.3 ID3算法——构造决策树 047

3.4 用决策树进行分类 054

3.5 小结 060

3.6 习题 060

第 4 章 随机森林 064

4.1 随机森林算法概述 064

4.2 游泳偏好——随机森林分析法 065

4.3 随机森林算法的实现 071

4.4 下棋实例 075

4.5 购物分析——克服随机数据的不一致性以及

 度量置信水平 082

4.6 小结 084

4.7 习题 084

第 5 章 k-means聚类 089

5.1 家庭收入——聚类为k个簇 089

5.2 性别分类——聚类分类 092

5.3 k-means聚类算法的实现 095

5.4 房产所有权示例——选择簇的数量 099

5.5 小结 105

5.6 习题 105

第 6 章 回归分析 114

6.1 华氏温度和摄氏温度的转换——基于完整数据的线性回归 114

6.2 根据身高预测体重——基于实际数据的线性回归 117

6.3 梯度下降算法及实现 118

6.4 根据距离预测飞行时长 122

6.5 弹道飞行分析——非线性模型 123

6.6 小 结 125

6.7 习 题 125

第 7 章 时间序列分析 130

7.1 商业利润——趋势分析 130

7.2 电子商店的销售额——季节性分析 132

7.3 小 结 140

7.4 习 题 140

附录 A 统计 145

A.1 基本概念 145

A.2 贝叶斯推理 146

A.3 分 布 146

A.4 交叉验证 147

A.5 A/B 测 试 148

附录 B R参考 149

B.1 介 绍 149

B.2 数据类型 150

B.3 线性回归 152

附录 C Python参考 154

C.1 介 绍 154

C.2 数据类型 155

C.3 控 制 流 159

附录 D 数据科学中的算法和方法术语 163

点击展开

点击收起

精通数据科学算法 PDF格式高清电子书免费下载

抱歉,暂无数据!催一下?我有资源 ?

看了 精通数据科学算法 的用户也看了: