Python Matplotlib数据可视化基础


制作提供信息的可视化(有时称为绘图)是数据分析中最重要任务之一。可视化可能是探索过程的一部分,例如,帮助识别异常值或所需的数据转换,或者为建模提供一些想法。Python有很多附加库可以用来制作静态或动态的可视化文件。

matplotlib是一个用于生成出版级质量图表(通常是二维的)的桌面绘图包。matplotlib和IPython社区合作简化了IPython shell(目前是Jupyter notebook)的交互式绘图。matplotlib支持所有操作系统上的各种GUI后端,还可以将可视化导出为所有常见的矢量和光栅图形格式(PDF、SVG、JPG、PNG、BMP、GIF等)。

随着时间的推移,matplotlib已经产生了一些数据可视化的附加工具包,使用matplotlib进行底层绘图。

matplotlib.pyplot(以下简称pyplot)是一个命令风格函数的集合,使Matplotlib的机制更像MATLAB。每个绘图函数都可对图形进行一些更改,如创建图形,在图形中创建绘图区域,在绘图区域绘制一些线条,使用标签装饰绘图等。在pyplot中,各种状态跨函数调用保存,以便跟踪诸如当前图形和绘图区域之类的东西,并且绘图函数始终指向当前轴域。