本文主要讲述了数据可视化的基础知识,包括什么是数据可视化,数据可视化应用以及Python可视化工具库。
什么是数据可视化
可视化是一种通过视觉的方式有效传达信息的技术。数据可视化旨在借助于图形化手段,将数据以视觉形式来呈现,清晰有效地传达与沟通信息,帮助人们理解数据中蕴藏的规律和现象。在进行数据可视化之前,需要思考:
。传达什么信息;
。采用什么图:
。如何有效传达信息。
数据可视化的作用和意义(1)
数据可视化将大量的高纬度繁琐数据以一种直观的图表的形式展现出来,使得数据在阅读方面变得极为便捷,使数据更加客观、更具说服力。
全国第六次人口普查:
文本数据
这次人口普查,31个省、自治区、直辖市共有家庭户40152万户,家庭户人口124461万人,平均每个家庭户的人口为3.10人,比2000年人口普查的3.44人减少0.34人。
数据可视化的作用和意义(2)
图形表现数据,实际上比传统的统计分析法更加精确和有启发性。可以借助可视化的图表寻找数据规律、分析推理、预测未来趋势。利用可视化技术可以实时监控业务运行状况,更加阳光透明,及时发现问题第一时间做出应对。
数据可视化可以使人清晰的理解数据,从而调整我们的分析方法。
数据可视化目的
数据可视化目的是将不可见的数据现象转化为可见的图形,从而去发现错综复杂的数据之间的关联、特征和规律,获得更有价值的信息。
利用合适的图表直截了当且清晰而直观地表达出来,实现数据自我解释、让数据说话的目的。
通过可视化信息,我们的大脑能够更好地抓取和保存有效信息,增加信息的印象。
数据可视化的应用(1)
借助于可视化的数据图表,可以很清晰有效的传达与沟通信息。
数据可视化可以适用于产生大量数据的诸多领域,通过数据可视化平台可以获取更多的隐藏信息。
。政府一实现科学决策和高效治理
。金融一加强风控与实时监管;
。电商一数据挖掘与运营;
。医疗一人体综合指数可视化分析;
。金融,股票一趋势变化分析;
。公司财务一收支统计监管
Python中可视化工具介绍
Matplotlib
Matplotlib 是一个基于Python的开源2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形,且效率极高
通过Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,包括直方图,条形图,散点图等,操作简单,图样灵活个性化。
文档完善,语法简洁,案例丰富,个性化程度高
Seaborn
Seaborn是一种基于Matplotlib的图形可视化工具。它提供了一种高度交互式界面便于用户能够做出各种有吸引力的统计图表。同时它能高度兼容NumPy与Pandas数据结构。Seaborn比Matplotlib更加容易使用,而且图例的风格更加现代化,更为美观。但是,相对于Matplotlib更为灵活,在制作复杂度较高的图形时更有优势。
Pyecharts
Pyecharts是一个Python中用于生成Echarts图表的类库,可以使得Echart和Python进行很好的对接。
介绍Matplotlib的使用
Matplotlib是Python提供的数据可视化库之一。
专门用于开发2D图表(包括3D图表)。
以渐进、交互式方式实现数据可视化。
Matplotlib支持的2D图形种类非常多,包括:雷达图、线图、小提琴图等。除此之外,Matplotlib还支持3D图形、地图。
图像结构(1)
Canvas位于最底层,在绘图过程中充当画板的角色,即放置画布(Figure)的工具Figure在绘图的过程中充当画布的角色(可以通过plt.figure()设置画布的大小和分辨率等)。
Axes(坐标系):数据的绘图区域
Axis(坐标轴):坐标系中的一条轴。包含大小限制、刻度和刻度标签
图像结构(2)
边框线(spines)、坐标轴(axis)、坐标轴名称(axis label)、坐标轴刻度(tick)、坐标轴刻度标签(tick label)、网格线(grid)、图例(legend)、标题(title)的设置可使图像更加直观更加容易被用户理解。
折线图(plot)、散点图(scatter)为函数根据数据绘制的图像。
Matplotlib绘图步骤
- 导入工具包
- 创建画布绘图对象
- 保存/展示
- 选择图形填充数据
- 设置细节
Matplotlib绘图流程-导入工具包
Matplotlib绘图包:
。 import matplotlib.pyplot as plt
其他工具包:
。 from mpl_toolkits.mplot3d import Axes3D
。frommpl_toolkits.basemap import Basemap
Matplotlib绘图流程-创建画布
使用绘图包中的fiqure方法创建画布:Plt.figure。
- 设置画布大小。
- 设置背景颜色。
- 设置边框。
- 设置分辨率。
根据需要,可以在画布上设置子图(多个图形显示在同一个画布上)
Matplotlib绘图流程-选择图形
绘图 plt.plot()
。plot为折线图,可以绘制多个图,可以使用不同的图形。
oBar:直方图。
。 Pie:饼图。
Matplotlib支持的图形种类非常多,包括3D图形和地图等。
Matplotlib绘图流程-设置细节
为图形添加细节,
。设置刻度、轴标签
。标题
。图例
。说明文本
。使用主题
。数据标记
Matplotlib绘图流程-保存与展示
保存图形:
。将图形保存至本地文件(save)展示图片:
。Show方法展示图形。
后续将为大家带来实例代码.