数据科学:R语言实战 PDF格式高清电子书免费下载

数据科学:R语言实战

作者 【美】Dan Toomey(丹·图米)
译者 刘丽君 李成华 卢青峰
出版社 人民邮电出版社
出版日期 2016-11-01
页数 360
格式 Paper book / ebook (PDF)
ISBN 9787115435903
价格 69
  • 内容简介
  • 图书目录
  • 免费下载

出版信息

ISBN:9787115435903
语言:简体中文
包装/印刷类型:1
开本:16开
出版时间:2016-11-01
页数:360

内容简介

这本书旨在探索数据科学家感兴趣的核心话题。它收集了各种数据源,并使用公开可用的R函数和R包评估这些数据。同时,在本书中,读者还将了解业界经常使用的分析技术。最后,读者将学会如何用R语言来实现一系列数据科学技术。

本书讲述的是R语言在数据科学中的应用,目标读者是从事不同行业的数据分析师、数据挖掘工程师、机器学习工程师、自然语言处理工程师、数据科学家,以及从事大数据和人工智能领域的工作者、学生、老师等。

本书的优点在于其通俗易懂、容易上手,每一个实例都有现成的数据和源代码,读者不仅能理解整个案例的来龙去脉,还可以直接编译本书提供的所有源代码,从而了解怎么从实际问题转变成可实现的代码,感受R语言的魅力,让数据产生价值。这种学习和实践相结合的方式非常适合初学者和有一定经验的数据分析师。

本书的内容涵盖了基于数据挖掘的常用模型,包括分类、聚类、关联分析、预测、异常检测等,还包括机器学习的常用算法和自然语言处理、数据可视化等内容。本书内容全面,做到了易读、易用、易理解、易实现、易上手,是****的R语言书籍。

图书目录

目录

第 1章 模式的数据挖掘 1

 1.1 聚类分析 2

 1.1.1 K-means聚类 3

 1.1.2 K-medoids聚类 7

 1.1.3 分层聚类 12

 1.1.4 期望**大化 15

 1.1.5 密度估计 21

 1.2 异常检测 24

 1.2.1 显示异常值 25

 1.2.2 计算异常 28

 1.3 关联规则 30

 1.4 问题 33

 1.5 总结 34

第 2章 序列的数据挖掘 35

 2.1 模式 35

 2.1.1 Eclat 36

 2.1.2 arulesNBMiner 40

 2.1.3 Apriori 43

 2.1.4 用TraMineR确定序列 47

 2.1.5 序列相似点 54

 2.2 问题 57

 2.3 总结 57

第3章 文本挖掘 59

 3.1 功能包 60

 3.1.1 文本处理 60

 3.1.2 文本集群 69

 3.2 问题 80

 3.3 总结 80

第4章 数据分析——回归分析 81

 4.1 功能包 81

 4.1.1 简单回归 81

 4.1.2 多次回归 88

 4.1.3 多变量回归分析 94

 4.1.4 稳健回归 100

 4.2 问题 106

 4.3 总结 106

第5章 数据分析——相关性 107

 5.1 功能包 107

 5.1.1 基本相关性 108

 5.1.2 可视化相关性 112

 5.1.3 协方差 114

 5.1.4 皮尔森相关性 117

 5.1.5 多分格相关性 118

 5.1.6 四分相关性 122

 5.1.7 异构相关矩阵 126

 5.1.8 部分相关性 128

 5.2 问题 129

 5.3 总结 129

第6章 数据分析——聚类 131

 6.1 功能包 131

 6.2 K-means聚类 132

 6.2.1 示例 132

 6.2.2 Medoids集群 140

 6.2.3 cascadeKM函数 142

 6.2.4 基于贝叶斯定理信息选取集群 144

 6.2.5 仿射传播聚类 146

 6.2.6 用于估测集群数量的间隙统计量 149

 6.2.7 分级聚类 151

 6.3 问题 153

 6.4 总结 154

第7章 数据可视化——R图形 155

 7.1 功能包 155

 7.1.1 交互式图形 156

 7.1.2 latticist功能包 160

 7.1.3 ggplot2功能包 169

 7.2 问题 180

 7.3 总结 181

第8章 数据可视化——绘图 183

 8.1 功能包 183

 8.2 散点图 183

 8.2.1 回归线 187

 8.2.2 lowess线条 188

 8.2.3 scatterplot函数 189

 8.2.4 Scatterplot矩阵 192

 8.2.5 密度散点图 197

 8.3 直方图和条形图 200

 8.3.1 条形图 200

 8.3.2 直方图 203

 8.3.3 ggplot2 203

 8.3.4 词云 204

 8.4 问题 206

 8.5 总结 206

第9章 数据可视化——三维 207

 9.1 功能包 207

 9.2 生成三维图形 208

 9.2.1 Lattice Cloud——三维散点图 212

 9.2.2 scatterplot3d 215

 9.2.3 scatter3d 216

 9.2.4 cloud3d 218

 9.2.5 RgoogleMaps 220

 9.2.6 vrmlgenbar3D 221

 9.2.7 大数据 223

 9.2.8 研究方向 228

 9.3 问题 234

 9.4 总结 234

第 10章 机器学习实战 235

 10.1 功能包 235

 10.2 数据集 236

 10.2.1 数据划分 240

 10.2.2 模型 241

 10.2.3 train方法 254

 10.3 问题 264

 10.4 总结 264

第 11章 用机器学习预测事件 265

 11.1 自动预测功能包 265

 11.1.1 时间序列 266

 11.1.2 SMA函数 272

 11.1.3 分解函数 273

 11.1.4 指数平滑法 274

 11.1.5 预测 277

 11.1.6 霍尔特指数平滑法 281

 11.2 问题 293

 11.3 总结 293

第 12章 监督学习和无监督学习 295

 12.1 功能包 296

 12.1.1 监督学习 296

 12.1.2 无监督学习 316

 12.2 问题 327

 12.3 总结 327

点击展开

点击收起

数据科学:R语言实战 PDF格式高清电子书免费下载

抱歉,暂无数据!催一下?我有资源 ?

看了 数据科学:R语言实战 的用户也看了: