
前言
机器学习是计算机科学领域未来发展的重点之一。从制造业到电子商务、再到运输业、机器学习无处不在,并提供基于数据的解决方案。机器学习背后的理念是在决策过程中建立一个与人类一样聪明的知识模型。现在,随着计算和存储能力的增强,机器学习相比人类可以提供更好的解决方案。
本书由12章组成,每一章涉及机器学习的一个主要领域。
第1章从机器学习的基本介绍开始,读者可以结合实际应用案例来了解通用机器学习算法的思想。第2章介绍了Python语言的基础知识, Python是一种开源语言,也是一种很好的机器学习应用工具,这是选择它来编写机器学习算法的原因。第3章提供了特征工程的相关操作技术,对机器学习而言,寻找正确的特征并加以修改与算法同样重要。第4章重点介绍数据可视化技术,使用预先构建的Python库,用户可以将数据可视化并向他人展示。
第5章~第7章涵盖了监督学习算法的内容。第5章通过实例解释基本回归技术。第6章通过过拟合问题的解决方案来重点介绍高级回归技术。第7章描述了分类算法的细节,从参数化技术和非参数化技术两方面来探讨解决分类问题。第8章引入无监督学习的思想,重点介绍了聚类。
第9章~第12章提供了机器学习中一些高级概念。第9章介绍了文本分析,包含一个示例——将新闻分类到预定义类别中。第10章讨论了神经网络和深度学习,其在非结构化、图像和语音数据中得到了高度的应用。第11章介绍了构建推荐系统的方法,对每种方法给出了相应的案例。第12章讨论时间序列数据、处理和预测时间序列的方法。
本书对各学习阶段的读者都有帮助。无论读者是刚开始接触机器学习,还是想学习更深层的概念,又或者是想通过代码进行实践,本书均可满足需求。建议读者通过使用示例代码来学习概念并实践它,以掌握这本书的全部内容。
虽然其他数据科学家已经对书中的内容和代码进行了检查,但本书仍然可能存在一些缺陷。期待读者的建议和批评,我将尽力改正以求在未来的版本中不再出现这些错误。