数学之美 第二版 PDF格式高清电子书免费下载

数学之美 第二版

作者 吴军
出版社 人民邮电出版社
出版日期 2014-11-01
页数 312
格式 Paper book / ebook (PDF)
ISBN 9787115373557
价格 49
  • 内容简介
  • 图书目录
  • 免费下载

出版信息

ISBN:9787115373557
语言:简体中文
包装/印刷类型:1
开本:小16开
出版时间:2014-11-01
页数:312

内容简介

几年前,“数学之美”系列文章原刊载于谷歌黑板报,获得上百万次点击,并被热情的读者广为传播,得到高度评价。读者说,读了“数学之美”,才发现大学时学的数学知识,比如马尔科夫链、矩阵计算,甚至余弦函数原来都如此亲切,并且栩栩如生,才发现自然语言和信息处理这么有趣,才真正明白“数学是科学的皇后”这句名言。 第二版增加了针对大数据和机器学习的内容,并更新了部分内容,以便满足人们对当下技术的学习需求。

  几年前,“数学之美”系列文章原刊载于谷歌黑板报,获得上百万次点击,得到读者高度评价。 正式出版前,吴军博士几乎把所有文章都重写了一遍,为的是把高深的数学原理讲得更加通俗易懂,让非专业读者也能领略数学的魅力。

  《数学之美》上市后深受广大读者欢迎,并荣获国家图书馆第八届文津图书奖。读者说,读了《数学之美》,才发现大学时学的数学知识,比如马尔科夫链、矩阵计算,甚到余弦函数原来都如此亲切,并且栩栩如生,才发现自然语言和信息处理这么有趣。

  而今,数学在信息产业中的应用越来越广泛,因此,作者在第 二版中增加了一些内容,尤其是针对大数据和机器学习的内容,以便满足人们对当下技术的学习需求。

图书目录

i 第二版出版说明

v 序言1

ix 序言2

xi 前言

1 第1 章 文字和语言 vs 数字和信息

文字和语言与数学,从产生起原本就有相通性,虽然它

们的发展一度分道扬镳,但是最终还是能走到一起。

1 信息

2 文字和数字

3 文字和语言背后的数学

4 小结

15 第2 章 自然语言处理 — 从规则到统计

人类对机器理解自然语言的认识走了一条大弯路。早期

的研究集中采用基于规则的方法,虽然解决了一些简单

的问题,但是无法从根本上将自然语言理解实用化。直

到20多年后,人们开始尝试用基于统计的方法进行自

然语言处理,才有了突破性进展和实用的产品。

1 机器智能

2 从规则到统计

3 小结

27 第3 章 统计语言模型

统计语言模型是自然语言处理的基础,并且被广泛应用

于机器翻译、语音识别、印刷体或手写体识别、拼写纠错、

汉字输入和文献查询。

1 用数学的方法描述语言规律

2 延伸阅读:统计语言模型的工程诀窍

3 小结

41 第4 章 谈谈分词

中文分词是中文信息处理的基础,它同样走过了一段弯

路,目前依靠统计语言模型已经基本解决了这个问题。

1 中文分词方法的演变

2 延伸阅读:如何衡量分词的结果

3 小结

50 第5 章 隐含马尔可夫模型

隐含马尔可夫模型最初应用于通信领域,继而推广到语

音和语言处理中,成为连接自然语言处理和通信的桥梁。

同时,隐含马尔可夫模型也是机器学习的主要工具之一。

1 通信模型

2 隐含马尔可夫模型

3 延伸阅读:隐含马尔可夫模型的训练

4 小结

60 第6 章 信息的度量和作用

信息是可以量化度量的。信息熵不仅是对信息的量化度

量,也是整个信息论的基础。它对于通信、数据压缩、

自然语言处理都有很强的指导意义。

1 信息熵

2 信息的作用

3 互信息

4 延伸阅读:相对熵

5 小结

72 第7 章 贾里尼克和现代语言处理

作为现代自然语言处理的奠基者,贾里尼克教授成功地

将数学原理应用于自然语言处理领域中,他的一生富于

传奇色彩。

1 早年生活

2 从水门事件到莫妮卡·莱温斯基

3 一位老人的奇迹

82 第8 章 简单之美 — 布尔代数和搜索引擎

布尔代数虽然非常简单,却是计算机科学的基础,它不

仅把逻辑和数学合二为一,而且给了我们一个全新的视

角看待世界,开创了数字化时代。

1 布尔代数

2 索引

IV 数学之美 第二版

3 小结

89 第9 章 图论和网络爬虫

互联网搜索引擎在建立索引前需要用一个程序自动地将

所有的网页下载到服务器上,这个程序称为网络爬虫,

它的编写是基于离散数学中图论的原理。

1 图论

2 网络爬虫

3 延伸阅读:图论的两点补充说明

4 小结

98 第10章 PageRank — Google的民主表决式网

页排名技术

网页排名技术PageRank是早期Google的杀手锏,它

的出现使得网页搜索的质量上了一个大的台阶。它背后

的原理是图论和线性代数的矩阵运算。

1 PageRank 算法的原理

2 延伸阅读:PageRank 的计算方法

3 小结

104 第11 章 如何确定网页和查询的相关性

确定网页和查询的相关性是网页搜索的根本问题,其中确

定查询中每个关键词的重要性有多高是关键。TF-IDF是目

前通用的关键词重要性的度量,其背后的原理是信息论。

1 搜索关键词权重的科学度量TF-IDF

2 延伸阅读:TF-IDF 的信息论依据

3 小结

111 第12章 有限状态机和动态规划 — 地图与本地

搜索的核心技术

地图和本地服务中要用到有限状态机和动态规划技术。

这两项技术是机器智能和机器学习的工具,它们的应用

非常广泛,还包括语音识别、拼写和语法纠错、拼音输

入法、工业控制和生物的序列分析等。

1 地址分析和有限状态机

2 全球导航和动态规划

3 延伸阅读:有限状态传感器

4 小结

121 第13 章 Google AK-47 的设计者 — 阿米特·

 辛格博士

在所有轻武器中最有名的是AK-47冲锋枪,因为它从不

卡壳,不易损坏,可在任何环境下使用,可靠性好,杀

伤力大并且操作简单。Google的产品就是按照上述原

则设计的。

127 第14 章 余弦定理和新闻的分类

计算机虽然读不懂新闻,却可以准确地对新闻进行分类。

其数学工具是看似毫不相干的余弦定理。

1 新闻的特征向量

2 向量距离的度量

3 延伸阅读:计算向量余弦的技巧

4 小结

136 第15章 矩阵运算和文本处理中的两个分类问题

无论是词汇的聚类还是文本的分类,都可以通过线性代

数中矩阵的奇异值分解来进行。这样一来,自然语言处

理的问题就变成了一个数学问题。

1 文本和词汇的矩阵

2 延伸阅读:奇异值分解的方法和应用场景

3 小结

142 第16 章 信息指纹及其应用

世间万物都有一个唯一标识的特征,信息也是如此。每

一条信息都有它特定的指纹,通过这个指纹可以区别不

同的信息。

1 信息指纹

2 信息指纹的用途

3 延伸阅读:信息指纹的重复性和相似哈希

4 小结

153 第17 章 由电视剧《暗算》所想到的 — 谈谈

原理

密码学的根本是信息论和数学。没有信息论指导的密码

是非常容易被破解的。只有在信息论被广泛应用于密码

学后,密码才真正变得安全。

1 密码学的自发时代

2 信息论时代的密码学

3 小结

162 第18章 闪光的不一定是金子 — 谈谈搜索引擎

反作弊问题和搜索结果的权威性问题

闪光的不一定是金子,搜索引擎中排名靠前的网页也

未必是有用的网页。消除这些作弊网页的原理和通信

中过滤噪音的原理相同。这说明信息处理和通信的很

多原理是相通的。

1 搜索引擎的反作弊

2 搜索结果的权威性

3 小结

171 第19 章 谈谈数学模型的重要性

正确的数学模型在科学和工程中至关重要,而发现正确

模型的途径常常是曲折的。正确的模型在形式上通常是

简单的。

密码学的数学原理

177 第20章 不要把鸡蛋放到一个篮子里 — 谈谈最

大熵模型

最大熵模型是一个完美的数学模型。它可以将各种信息

整合到一个统一的模型中,在信息处理和机器学习中有

着广泛的应用。它在形式上非常简单、优美,而在实现

时需要有精深的数学基础和高超的技巧。

1 最大熵原理和最大熵模型

2 延伸阅读:最大熵模型的训练

3 小结

186 第21 章 拼音输入法的数学原理

汉字的输入过程本身就是人和计算机之间的通信。好的

输入法会自觉或不自觉地遵循通信的数学模型。当然要

做出最有效的输入法,应当自觉使用信息论做指导。

1 输入法与编码

2 输入一个汉字需要敲多少个键 — 谈谈香

农第一定理

3 拼音转汉字的算法

4 延伸阅读:个性化的语言模型

5 小结

197 第22章 自然语言处理的教父马库斯和他的优秀

弟子们

将自然语言处理从基于规则的研究方法转到基于统计的

目 录IX

研究方法上,宾夕法尼亚大学的教授米奇·马库斯功不

可没。他创立了今天在学术界广泛使用的LCD语料库,

同时培养了一大批精英人物。

1 教父马库斯

2 从宾夕法尼亚大学走出的精英们

204 第23 章 布隆过滤器

日常生活中,经常要判断一个元素是否在一个集合中。

布隆过滤器是计算机工程中解决这个问题最好的数学工

具。

1 布隆过滤器的原理

2 延伸阅读:布隆过滤器的误识别问题

3 小结

209 第24 章 马尔可夫链的扩展 — 贝叶斯网络

贝叶斯网络是一个加权的有向图,是马尔可夫链的扩展。

而从认识论的层面看:贝叶斯网络克服了马尔可夫链那

种机械的线性约束,它可以把任何有关联的事件统一到

它的框架下面。它在生物统计、图像处理、决策支持系

统和博弈论中都有广泛的使用。

1 贝叶斯网络

2 贝叶斯网络在词分类中的应用

3 延伸阅读:贝叶斯网络的训练

4 小结

217 第25 章 条件随机场、文法分析及其他

条件随机场是计算联合概率分布的有效模型,而句法

分析似乎是英文课上英语老师教的东西,这两者有什

么联系呢?

1 文法分析—计算机算法的演变

2 条件随机场

3 条件随机场在其他领域的应用

4 小结

227 第26 章 维特比和他的维特比算法

维特比算法是现代数字通信中使用最频繁的算法,同时

也是很多自然语言处理的解码算法。可以毫不夸张地讲,

维特比是对我们今天生活的影响力最大的科学家之一,

因为如今基于CDMA的3G移动通信标准主要就是他创

办的高通公司制定的。

1 维特比算法

2 CDMA 技术— 3G 移动通信的基础

3 小结

238 第27 章 上帝的算法 — 期望最大化算法

只要有一些训练数据,再定义一个最大化函数,采用

EM算法,利用计算机经过若干次迭代,就可以得到所

需要的模型。这实在是太美妙了,这也许是我们的造物

主刻意安排的。所以我把它称作上帝的算法。

1 文本的自收敛分类

2 延伸阅读:期望最大化和收敛的必然性

3 小结

244 第28 章 逻辑回归和搜索广告

逻辑回归模型是一种将影响概率的不同因素结合在一起

的指数模型,它不仅在搜索广告中起着重要的作用,而

且被广泛应用于信息处理和生物统计中。

1 搜索广告的发展

2 逻辑回归模型

3 小结

249 第29 章 各个击破算法和Google 云计算的基础

Google颇为神秘的云计算中最重要的MapReduce工具,

其原理就是计算机算法中常用的“各个击破”算法,它

的原理原来这么简单——将复杂的大问题分解成很多小

问题分别求解,然后再把小问题的解合并成原始问题的

解。由此可见,在生活中大量用到的、真正有用的方法

常常都是简单朴实的。

1 分治算法的原理

2 从分治算法到MapReduce

3 小结

254 第30 章 Google 大脑和人工神经网络

1 人工神经网络

2 训练人工神经网络

3 人工神经网络与贝叶斯网络的关系

4 延伸阅读:Google 大脑

5 小结

273 第31 章 大数据的威力——谈谈数据的重要性

1 数据的重要性

2 数据的统计和信息技术

3 为什么需要大数据

4 小结

295 附录

299 后记

302 索引

点击展开

点击收起

数学之美 第二版 PDF格式高清电子书免费下载

提醒:本站所有图书资源均索引自互联网,版权争议与本站无关。如有侵权或其他争议的可能性,请发起版权投诉,因本站未参与任何制作、转制、存储等任一环节,故无法对涉及到的资源进行删除,本站会依据DMCA原则, 对涉及的资源链接进行删除。因为所有图书资源均不属于本站,本站只提供索引服务,故本站不保证任何资源的准确性,权威性,请使用者自行判断。

  • 查看原页面 报告错误 复制提取码下载 提取码:ywps

看了 数学之美 第二版 的用户也看了: