scikit-learn库是什么?Python的开源社区非常活跃,也有很多和Java等开源语言一样的框架或库体系,其中Scikit-learn(简写成sklearn)是最著名的Python机器学习库之一。官方网址为http://scikit-learn.org/stable/。
sklearn基于BSD开源许可证,最早由David Cournapeau在2007年发起,目前也是由社区自愿者进行维护,经年累月,整个项目的内容已经相当丰富了,目前最新的稳定版是0.17版本。
用户手册内容也很友好,覆盖面很全,包括有监督的学习(分类)、无监督的学习(聚类)、模型选择与评价、数据集转换、数据集提取应用(数据示例下载)、大规模计算策略、计算效率七大部分。
机器学习算法大多使用sklearn库完成,主要涉及Supervised learning和Unsupervised learning两个部分,相信它也能帮助读者在生产生活中很大程度地提高生产效率。
在安装sklearn之前请确认Python已经安装。安装Python的方法见附录C。
如果发现Python软件未被正确安装,可以使用CentOS系统自带的包管理工具“yum”进行安装。安装方法如下:
然后安装sklearn。sklearn的安装很简单,只要能够连接上互联网,直接使用pip安装即可: