机器学习导论原书第三版.pdf
http://www.100md.com
2020年11月18日
![]() |
| 第1页 |
![]() |
| 第6页 |
![]() |
| 第14页 |
![]() |
| 第25页 |
![]() |
| 第33页 |
![]() |
| 第89页 |
参见附件(31561KB,290页)。
机器学习导论(原书第3版)是关于机器学习的内容全面的教科书,其中有些内容在一般的在机器学习导论书中很少介绍。主要内容包括监督学习,贝叶斯决策理论,参数、半参数和非参数方法,多元分析,隐马尔可夫模型,增强学习,核机器,图模型,贝叶斯估计和统计检验。

前言
机器学习肯定是计算机科学成长最快的领域之一。不仅数据在持续变“大”,而且处理数据并将它转换成知识的理论也在不断发展。在科学的各个领域,从天文学到生物学,以及在日常生活中,随着数字技术日益渗透到我们的日常生活中,随着数字足迹的深入,更多的数据被源源不断地产生和收集。无论是科学的还是个人的,被动蛰伏的数据没有任何用处,而聪明的人们一直在寻找新的方法来利用数据,把它转换成有用的产品或服务。在这种转换中,机器学习正发挥着越来越大的作用。
自从本书第2版2010年面世以来,数据进化一直在持续,甚至更快。每年,数据集都在变大。不仅观测的数量在增长,而且观测属性的数量也在显著增加。数据有了更多的结构:不再仅仅是数和字符串,而且还有图像、视频、音频、文档、网页、点击日志、图等。数据与我们以前常做的参数假设(例如正态性)渐行渐远。数据常常是动态的,因而存在一个时间维度。有时,我们的观测是多视图的——对于相同的对象或事件,我们有来自不同传感器和不同模式的多个信息源。
我们相信,在这看似复杂和庞大的数据背后存在简单的解释。虽然数据很大,但是它可以使用具有少量隐藏因子及其相互作用的相对简单的模型来解释。想想数百万客户,他们每天在线或从当地超市购买数千种产品。这意味着一个非常大的交易数据库,但是该数据存在模式。没有人随机购物。举办酒会的人购买产品的某个子集,家有婴儿的人购买产品的不同子集;存在解释客户行为的隐藏因子。
从观测数据推断这种隐藏模型是近年来已经做了大量研究的领域之一。新版中的修改大部分都与这些进展有关。第6章新增了关于特征嵌入、奇异值分解和矩阵分解、典范相关分析、拉普拉斯特征映射的内容。
第8章和关于核机器的第13章新增了关于距离估计的内容。维度归约、特征提取和距离估计是同一个东西的三个名称——理想的距离度量定义在理想的隐藏特征的空间中,而从数量上看,它们少于我们观测的值。
重写并显著扩充了第16章,以便涵盖生成模型。我们对所有主要的机器学习模型,即对分类、回归、混合模型和维度归约,讨论贝叶斯方法。非参数贝叶斯建模在过去的几年中日益流行,尤其令人感兴趣,因为它允许调整模型的复杂度,以适应数据的复杂度。
新版各处新增了一些章节,主要是突出相同或非常类似方法的新的不同应用。第8章新增了一节离群点检测。第10和13章新增两节,分别讨论用于排名的线性模型和核机器。拉普拉斯特征映射添加到第6章,还在第7章新增一节讨论谱聚类。鉴于深度神经网络的最近复苏,有必要在第11章新增一节讨论深度学习。第19章新增一节讨论方法比较的多元检验。
自第1版面世以来,许多使用本书自学的读者提出索取习题答案的请求。在这个新的版本中,已经包括了部分习题的答案。它们有时是完整的答案,有时只是一个提示,或只提供多种可能答案中的一种。
我要感谢使用前两版的所有老师和学生,以及它们的德文、中文和土耳其文翻译和在印度的重印。我永远感激那些发给我评价、批评、勘误,或以任何其他方式提供反馈的人。请继续这样做。
内容简介
机器学习的目标是对计算机编程,以便使用样本数据或以往的经验来解决给定的问题。已经有许多机器学习的成功应用,包括分析以往销售数据来预测客户行为,优化机器人的行为以便使用较少的资源来完成任务,以及从生物信息数据中提取知识的各种系统。本书是关于机器学习的内容全面的教科书,其中有些内容在一般的在机器学习导论书中很少介绍。主要内容包括监督学习,贝叶斯决策理论,参数、半参数和非参数方法,多元分析,隐马尔可夫模型,增强学习,核机器,图模型,贝叶斯估计和统计检验。
机器学习正在迅速成为计算机科学专业的学生必须掌握的一门技能。本书第3版反映了这种变化,增加了对初学者的支持,包括给出了部分习题的参考答案和补充了实例数据集(提供在线代码)。其他显著的变化包括离群点检测的讨论、感知器和支持向量机的排名算法、矩阵分解和谱方法、距离估计、新的核算法、多层感知器的深度学习和非参数贝叶斯方法。书中对所有学习算法都进行了解释,以便读者可以很容易地将书中的公式转变为计算机程序。本书可以用作高年级本科生和硕士研究生的教材,也可供研究机器学习方法的技术人员参考。
作者简介
埃塞姆·阿培丁(Ethem Alpaydin),土耳其伊斯坦布尔博阿齐奇大学计算机工程系的教授。于1990年在洛桑联邦理工学院获博士学位,先后在美国麻省理工学院和伯克利大学工作和进行博士后研究。Ethem博士主要从事机器学习方面的研究,是剑桥大学《The Computer Journal》杂志编委和Elsevier《Pattern Recognition》杂志的副主编。2001年和2002年,Ethem博士先后获得土耳其科学院青年科学家奖和土耳其科学与技术研究委员会科学奖。
精彩书评
本书把机器学习的热门话题(如Tom Mitchell)与概率论基础(如Christopher Bishop)很好地融合在一起。第3版向这个重要和迅速发展领域中的学生和研究者介绍了机器学习的一些新和重要的课题(例如,谱方法、深度学习和学习排名)。
—— John W. Sheppard 蒙大拿州立大学计算机科学教授
我已经在机器学习的研究生课程中使用本书多年。这本书很好地平衡了理论和实践,并且在第3版中扩充了许多新的先进算法。我期待在我的下一次机器学习课程中使用它。
—— Larry Holder 华盛顿州立大学电子工程和计算机科学教授
对于机器学习而言,这是一本完整、易读的机器学习导论,是这个快速演变学科的“瑞士军刀”。尽管本书旨在作为导论,但是它不仅对于学生,而且对于寻求这一领域综合教程的专家也是有用的。新人会从中找到清晰解释的概念,专家会从中发现新的参考和灵感。
—— Hilario Gómez-Moreno IEEE高级会员
机器学习导论原书第三版截图


您现在查看是摘要介绍页, 详见PDF附件(31561KB,290页)。





