这篇文章我推荐 10个实用的 Python 库,每一个都是同类库下的佼佼者,试用过后保准你会爱上,要学就学这样的库。
这里面有FastAPI的升级版Typer、将CLI变成彩色的Rich、基于GUI框架的Dear PyGui、还有精简报错信息的PrettyErrors……
下面就让我们一起来看看吧~
1、Typer
Typer跟FastAPI的原理相同,都是Python上用来构建API服务的一个高性能框架。
它是FastAPI的升级版,不仅能够准确地记录代码,还能够轻松地进行CLI验证。
Typer易于学习和使用,不需要用户阅读复杂的教程文档即可上手。支持编辑器(如VSCode)代码自动补全,提高开发人员的开发效率,减少bug的数量。
其次,Typer还能配合命令行神器Click使用,就可以利用Click的优点和插件,实现更复杂的功能。
开源地址:https://github.com/tiangolo/typer
2、Rich
谁规定CLI界面一定得是黑白的?它也可以是彩色的。
Rich API不仅能够在终端输出提供丰富的彩色文本和精美的格式,还提供了精美的表格、进度条、编辑器、追踪器、语法高亮等。如下图所示。
它还可以安装在Python REPL上,所有的数据结构都可以漂亮地输出或标注。
总而言之,它是彩色的、漂亮的、强大的。
Rich兼容性也不错,适用于Linux,Mac和Windows等多种系统。真彩色/表情符号可与新的Windows终端一起使用。
但是请注意,Rich必须要Python 3.6.1或以上版本。
开源地址:https://github.com/willmcgugan/rich
3、Dear PyGui
如上所示,虽然终端应用程序可以做成很漂亮的样子。但是,你可能还需要一个真正的GUI。
Dear PyGui是一个便于使用、功能强大的Python GUI框架。但是它与其他的Python GUI却有着根本上的不同。
它使用了即时模式范式和计算机的GPU来实现动态界面。即时模式范式在视频游戏中非常流行,这意味着它的动态GUI不需要保留任何数据,而是逐帧独立绘制的。同时,它还使用GPU来建构动态界面。
Dear PyGui还可以绘图、创建主题、创建2D游戏,还拥有一些小工具,比如说内置文档、日志记录、源代码查看器之类的,这些小工具可以协助App的开发。
支持它的系统有:Windows 10(DirectX 11),Linux(OpenGL 3)和macOS(Metal)等。开源地址:https://github.com/hoffstadt/DearPyGui
4、PrettyErrors
PrettyErrors是一个精简Python错误信息的工具,特点是界面十分简洁友好。
它最显著的功能是支持在终端进行彩色输出,标注出文件栈踪迹,发现错误信息,过滤掉冗余信息,提取出关键部分,并且进行彩色标注,从而提高开发者的效率。
而且它可以不用安装,直接被导入项目中使用,但是需要先配置一些参数,其导入和配置的参数如下:
开源地址:https://github.com/onelivesleft/PrettyErrors
5、Diagrams
程序员在编程的时候,有时候需要跟同事解释他设计的程序代码之间复杂的结构关系,然而这不是一两句话能说清楚的,需要画表或者做脉络图。
一般情况下,程序员使用GUI工具处理图表,并将文稿进行可视化处理。但是还有更好的方法,比如说使用Diagrams库。
Diagrams让不需要任何设计类工具,直接在Python代码中绘制云系统结构。它们的图标来自多家云服务商,包括AWS, Azure, GCP等。
仅需几行代码,就可以简单地创造出箭头符号和结构图。
由于它使用Graphviz来渲染图,所以还需要先安装好Graphviz。
开源地址:https://github.com/mingrammer/diagrams
6、Hydra and OmegaConf
在做机器学习项目的时候,需要做一大堆的环境配置工作。因此,在一些复杂的应用程序中,配置管理工作也相应变得复杂。
Hydra可以使配置工作变得简单。它能够从命令行或者配置文件中覆盖部分出来,无需维护相似的配置文件,用组合的方式进行配置,从而加快了实验运行速度。
Hydra兼容性强,拥有含插件的结构,能够很好地与开发者的操作文件融合。它的插件还可以实现直接通过命令行,就把代码发布到AWS或者其他云端系统。
Hydra也离不开OmegaConf,两者关系密不可分,OmegaConf为Hydra的分层配置系统提供了协同的API,二者协同运作可支持YAML、配置文件、对象、CLI参数等。
开源地址:https://github.com/facebookresearch/hydra,https://github.com/omry/omegaconf
7、PyTorch Lightning
PyTorch Lightning也是Facebook的一个研究成果。它是一个轻巧的PyTorch包装器,用于高性能AI研究,其最重要的特征是能够解析PyTorch代码,让代码研究成分和工程成分的分离。
它的扩展模型可以在任何硬件(CPU、GPU、TPU)上运行,且容易被复制,删除了大量的文件样本,保持了自身的灵活性,运行速度快。
Lightning能够使DL / ML研究的40多个部分实现自动化,例如GPU训练、分布式GPU(集群)训练、TPU训练等等……
因为Lightning将可以将文件自动导出到ONNX或TorchScript,所以它适用于进行快速推理的AI研究员、BERT或者自监督学习的研究团队等。
开源地址:https://github.com/PyTorchLightning/PyTorch-lightning
8、Hummingbird
Hummingbird是微软的一项研究成果,它能够将已经训练好的ML模型汇编成张量计算,从而不需要设计新的模型。
还允许用户使用神经网络框架(例如PyTorch)来加速传统的ML模型。
它的推理API跟sklearn范例十分相似,都可以重复使用现有的代码,但是它是用Hummingbird生成的代码去实现的。
Hummingbird还在Sklearn API之后提供了一个方便的统一推理API。这样就可以将Sklearn模型与Hummingbird生成的模型互换,而无需更改推理代码。
它之所以被重点关注,还因为它能够支持多种多样的模型和格式。
到目前为止,Hummingbird支持PyTorch、TorchScript、ONNX和TVM等各种ML模型。
开源地址:https://github.com/microsoft/hummingbird
9、HiPlot
由于ML模型变得越来越复杂,还有很多超参数,于是就需要用到HiPlot。HiPlot是今年3月Facebook发行的一个库,主要用于处理高维数 据。
Facebook AI通过几十个超参数和10万多个实验,利用HiPlot,来分析深度神经网络。
它是用平行图和其他的图像方式,帮助AI研究者发现高维数据的相关性和模型,是一款轻巧的交互式可视化工具。
HiPlot与其他可视化工具相比,有其特有的优点:
首先,它的互动性强,因为平行图是交互式的,所以能够满足多种情况下的图像可视化。
其次,它简单易用,可以通过IPython Notebook或者通过带有“ hiplot”命令的服务直接使用。
它还有具有可扩展性。默认情况下,HiPlot的Web服务可以解析CSV或JSON文件,还可以为其提供自定义Python解析器,将实验转换为HiPlot实验。
开源地址:https://github.com/facebookresearch/hiplot
参考链接:https://ai.facebook.com/blog/hiplot-high-dimensional-interactive-plots-made-easy
10、Scalene
Scalene是一个用于Python脚本的CPU和内存分析器,能够正确处理多线程代码,还能区分Python代码和本机代码的运行时间。
你不需要修改代码,只需运行Scalene脚本,它就会生成一个文本形式的报告,显示出每一行代码的CPU和内存的使用情况。通过这个文本报告,开发人员可以提高代码的效率。
Scalene的速度快、准确率高,还能够对高耗能的代码行进行标注。
开源地址 https://github.com/emeryberger/scalene
除了以上10个,还有多个高性能的Python库被点名了,例如Norfair、Quart、Alibi-detect、Einops……等等,详情查看底部链接。
那么,你今年有发现好用的Python库吗?