1.机器学习和计算机视觉
Crab:灵活、快速的推荐引擎
gensim:人性化的话题建模库
hebel:GPU加速的深度学习库
NuPIC:智能计算Numenta平台
pattern:Python网络挖掘模块
PyBrain:另一个Python机器学习库
Pylearn2:一个基于Theano的机器学习库
python-recsys:一个用来实现推荐系统的Python库
scikit-learn:基于SciPy构建的机器学习Python模块
pydeep:Python深度学习库
vowpalporpoise:轻量级VowpalWabbit的Python封装
skflow:一个TensorFlow的简化接口(模仿scikit-learn)
Caffe:一个Caffe的python接口
OpenCV:开源计算机视觉库
pyocr:Tesseract和Cuneiform的包装库
pytesseract:GoogleTesseractOCR的另一包装库
SimpleCV:一个用来创建计算机视觉应用的开源框架
2.数据分析
blaze:NumPy和Pandas的大数据接口
cclib:一个用来解析和解释计算化学软件包输出结果的库
NetworkX:一个为复杂网络设计的高性能软件
Neupy:执行和测试各种不同的人工神经网络算法
Numba:PythonJIT(justintime)编译器,针对科学用的Python,由Cython和NumPy的开发者开发
NumPy:使用Python进行科学计算的基础包
OpenBabel:一个化学工具箱,用来描述多种化学数据
OpenMining:使用Python挖掘商业情报(BI)(Pandasweb接口)
orange:通过可视化编程或Python脚本进行数据挖掘,数据可视化,分析和机器学习
Pandas:提供高性能,易用的数据结构和数据分析工具
PyDy:PyDy是PythonDynamics的缩写,用来为动力学运动建模工作流程提供帮助,基于NumPy,SciPy,IPython和matplotlib
PyMC:马尔科夫链蒙特卡洛采样工具
RDKit:化学信息学和机器学习软件
SciPy:由一些基于Python,用于数学,科学和工程的开源软件构成的生态系统
statsmodels:统计建模和计量经济学
SymPy:一个用于符号数学的Python库
cclib:一个用来解析和解释计算化学软件包输出结果的库
NetworkX:一个为复杂网络设计的高性能软件
Neupy:执行和测试各种不同的人工神经网络算法
Numba:PythonJIT(justintime)编译器,针对科学用的Python,由Cython和NumPy的开发者开发
NumPy:使用Python进行科学计算的基础包
OpenBabel:一个化学工具箱,用来描述多种化学数据
OpenMining:使用Python挖掘商业情报(BI)(Pandasweb接口)
orange:通过可视化编程或Python脚本进行数据挖掘,数据可视化,分析和机器学习
Pandas:提供高性能,易用的数据结构和数据分析工具
PyDy:PyDy是PythonDynamics的缩写,用来为动力学运动建模工作流程提供帮助,基于NumPy,SciPy,IPython和matplotlib
PyMC:马尔科夫链蒙特卡洛采样工具
RDKit:化学信息学和机器学习软件
SciPy:由一些基于Python,用于数学,科学和工程的开源软件构成的生态系统
statsmodels:统计建模和计量经济学
SymPy:一个用于符号数学的Python库
3.数据可视化
matplotlib:一个Python2D绘图库
bokeh:用Python进行交互式web绘图
ggplot:ggplot2给R提供的API的Python版本
plotly:协同Python和matplotlib工作的web绘图库
pyecharts:基于百度Echarts的数据可视化库
pygal:一个PythonSVG图表创建工具
pygraphviz:Graphviz的Python接口
PyQtGraph:交互式实时2D/3D/图像绘制及科学/工程学组件
SnakeViz:一个基于浏览器的Python'scProfile模块输出结果查看工具
vincent:把Python转换为Vega语法的转换工具
VisPy:基于OpenGL的高性能科学可视化工具
4.数据API构建及服务
·Django
django-rest-framework:一个强大灵活的工具,用来构建webAPI
django-tastypie:为Django应用开发API
django-formapi:为Django的表单验证,创建JSONAPIs
·Flask
flask-api:为flask开发的,可浏览WebAPIs
flask-restful:为flask快速创建RESTAPIs
flask-restless:为SQLAlchemy定义的数据库模型创建RESTfulAPIs
flask-api-utils:为Flask处理API表示和验证
eve:RESTAPI框架,由Flask,MongoDB等驱动
·Pyramid
cornice:一个Pyramid的REST框架
·与框架无关的
falcon:一个用来建立云API和webapp后端的高性能框架
sandman:为现存的数据库驱动系统自动创建RESTAPIs
restless:框架无关的REST框架,基于从Tastypie学到的知识
ripozo:快速创建REST/HATEOAS/HypermediaAPIs
5.爬虫及网页处理
Scrapy:一个快速高级的屏幕爬取及网页采集框架
cola:一个分布式爬虫框架
Demiurge:基于PyQuery的爬虫微型框架
feedparser:通用feed解析器
Grab:站点爬取框架
MechanicalSoup:用于自动和网络站点交互的Python库
portia:Scrapy可视化爬取
pyspider:一个强大的爬虫系统
RoboBrowser:一个简单的,Python风格的库,用来浏览网站,而不需要一个独立安装的浏览器
BeautifulSoup:以Python风格的方式来对HTML或XML进行迭代,搜索和修改
bleach:一个基于白名单的HTML清理和文本链接库
cssutils:一个Python的CSS库
html5lib:一个兼容标准的HTML文档和片段解析及序列化库
lxml:一个非常快速,简单易用,功能齐全的库,用来处理HTML和XML
MarkupSafe:为Python实现XML/HTML/XHTML标记安全字符串
pyquery:一个解析HTML的库,类似jQuery
untangle:将XML文档转换为Python对象,使其可以方便的访问
xhtml2pdf:HTML/CSS转PDF工具
xmltodict:像处理JSON一样处理XML
6.算法和设计模式
·Python实现的算法和设计模式。
algorithms:一个Python算法模块
python-patterns:Python设计模式的集合
sortedcontainers:快速,纯Python实现的SortedList,SortedDict和SortedSet类型
以上内容为大家介绍了Python数据分析相关的技术,希望对大家有所帮助,如果想要了解更多Python相关知识,请关注IT培训机构:千锋教育。http://www.mobiletrain.org/