前言
“人工智能、深度学习和机器学习,不论你现在是否能够理解这些概念,你都应该学习。否则三年内,你就会像灭绝的恐龙一样被社会淘汰”——马克·库班(NBA小牛队老板,亿万富翁)。
马克·库班的这番话可能听起来挺吓人的,但道理是没毛病的!我们正经历一场大革命,这场革命就是由大数据和强大电脑计算能力发起的。随着科技的快速发展,作为人工智能的核心技术,机器学习也变得越来越火。然而,普通的程序员想要转行机器学习却困难重重。回想起来,笔者在刚开始学习机器学习时,一上来就被一大堆数学公式和推导过程所折磨,这样的情景还历历在目。那时候笔者也觉得机器学习是个门槛非常高的学科。但实际上,在人工智能的大部分从业人员里,究竟有多少人需要从头去实现一个算法?又有多少人有机会去发明一个新算法?从一开始就被细节和难点缠住,学机器学习前先学三年的线性代数、微积分,这严重打击了新人想进入机器学习领域的热情和信心!
对一个正常的普通IT程序员而言,可能需要花3年左右的时间才能学习完人工智能所需要的全部的数学基础,你能够在国内心无旁骛(辞掉工作?抛家离子?)掌握完这些数学基础?机器学习以其背后复杂的数学原理及异常复杂的算法推导和证明过程而吓退了一大批初学者,本书就是要解决这个问题,遵循“极简入门”的理念。霍金说过每多一个数学公式,就会少一半的读者,因此这里也会尽量少用公式,要用也只用简单易懂的公式。笔者在书中通过通俗易懂的语言去描述算法的工作原理,帮助读者直观地理解每个算法的核心思想,有效地降低了学习的门槛。个人觉得机器学习中的很多公式是可以感性地去认识的,能完全明白推导过程自然最好,但在不求甚解的状态下能达到感性的认知也未必不是一个快速入门机器学习的好方法。另外,本书通过使用scikit-learn机器学习工具包来演示算法的使用,以及算法所能解决的实际案例问题,这种站在巨人肩膀上、循序渐进的讲授方式,完全遵循小白对机器学习算法的认知规律。算法的唯一学习正道是在案例中体会数据处理的每一个步骤并基于该过程进行算法总结,这也是本书通过大量案例的实操,让广大机器学习爱好者从具体案例中体悟算法运行背后的原理和真相。
上面的说法并不是要否认数学和算法实现的重要性,毕竟它们是人工智能领域的基础学科方向。万事开头难,只有打开了一扇门,才能发现一个全新的世界,这本书目的就是帮助新人打开机器学习的这扇门。
阅读本书的读者,只需学过Python语言基础知识,只要你想改变自己的现状,那么这本书就非常适合你。本书就是给那些非科班出身而想半路“杀进”人工智能(AI)领域的程序员们,提供极简入门的参考指南。书中用到的所有数学内容都会从问题的视角出发,所有内容都会遵循人类最直觉的学习方式循序渐进地进行讲授,以完全可视化的学习方式,给读者提供全部真实案例的源代码和数据,以便于读者动手实践。本书中的所有截图都是实验操作的真实结果。