天天看点

学Python做数据分析,一般需要用到哪些图表?

  数据分析中重要的不是使用什么样的图表,而是分析目的是什么?

 例如,如果想比较的话,可以使用条形图或雷达图等; 想看占有率的话,用漏斗或饼图; 想看趋势的有线性图; 要查看关系,有树视图。 ……每个分类各图表的应用场景和优缺点也不同。 正好最近在做可视化的分析。 系统全面详细介绍可视化图表。

学Python做数据分析,一般需要用到哪些图表?

 一.比较类图

 主要目的:比较值的差异

 1、多系列条形图

 应用场景:用于比较多个维度的数值差异,按不同系列指标进行不同的比较划分

 评估:这是最常用的比较图表,但不适合比较大型数据集

 2、叠置条形图

 应用场景:显示各个项目与整体之间的关系,用于比较各类别中每个数值所占的总值大小

 评价:只能比较某个维度内的项目情况,只能纵向比较,不能横向比较

 3、比较条形图

 应用场景:对于一个维、两个指标,可以使用比较条形图

 评价:对比度差异更直观,条形图大小可调,差异更明显

 4、分区直方图

 应用场景:并排显示不同维度中各分类指标的条形图,如不同地区不同类别的销售额和毛利比较

 评估:用于展示大型数据集,但比较杂乱,建议添加颜色编码

 5、雷达图

 应用场景:雷达图必须具有相同的指标,才能显示独立的数据系列之间以及一个特定系列与其他系列的整体关系

 评价:一般适用于不同维度的比较,比较表现明显

 6、漏斗图

 应用场景:给出各阶段占有率,提供转化率分析

 评价:适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较可以直观地发现、说明、做出决策

 7、微克

 应用场景:用于多个维、多个指标的比较分析,用大小和颜色表示指标的数据状况

 评价:没有具体数值比较

 8、语言云图

 应用场景:云是一种直观显示数据频率的图表类型,通过视觉强调出现频率高的“关键词”,形成“关键词云”,过滤掉大量的文本信息,仅浏览者瞥了一眼文本就很重要

 评价:不适合表示数据过少的数据集、区分度低的数据或没有重要关键字

 二.占比类图

 目的:了解部分占整体的比例

 1、散饼图

 应用方案:玫瑰图表用于显示每个值相对于总值的大小。

 评价:不适合大数据集(分类)的表达,数据项不得有负值; 而且比率接近的话,人眼很难正确判别2、仪表板图

 应用方案:用于直观显示KPI数字的组件。 您可以直接查看选定字段的数字,例如显示指标值,如销售额、毛利和毛利率

 评价:表现维度只有一个。 表现指标不能太多。 另外,是数字面板,没有图形的各种优点

 3、矩阵树

 应用场景:矩形树形图用于描述层次结构数据的占用关系,可以逐步细化显示底层数据

 评价:不直观、明确,不如树图清晰,且分类占有率太小不容易配置

 4、雷达图

 我之前说过,我不会在这里展示

 三.相关图表

 主要目的:显示各值之间的关系

 1、散点图

 应用场景:显示几个数据序列中各数值之间的关系。 类似于XY轴,判断两个变量之间是否有某种关联,或者发现数据的步骤和聚合状况

 评价:散点图看起来很混乱,但基本上只能看到关联、分布、聚合,其他信息不能很好地表达

 2、甘特图

 应用场景:直观展示任务计划何时进行、实际进展情况与计划要求的比较

 评价:主要用于项目进展,在其他情况下很少使用

 3、树状图

 应用场景:表示每个节点之间的上下关系,用于显示每个节点的值

 评价:多用于框架图,逻辑关系比较明确,但无数据数值比较

 4、矩形树状图、仪表板图

 我之前说过,我不会在这里展示

 四.趋势图

 主要目的:展示数值随维度的变化

 1、线条图

 应用场景:数据是有序变量上的变化,其特征是对事物随种类变化的趋势做出反应,可以清晰地表现出数据的增减趋势、增减速度、增减规律、峰值等特征

 评价:不适合多指标趋势比较

 2、面积图

 应用场景:面积范围图用于显示持续数据,能很好地描述趋势、累积、减少和变化

 评价:多用于显示差值的变化

 3、瀑布图

 应用场景:如果用户想呈现两个据点之间数量的推移过程,可以使用瀑布图。 例如支付额和实际支付额之间的消长变化等

 评价:同样基本上显示差分值的变化趋势

 4、条形图

 介绍了,但不在这里展示

 五.地图类图表

 主要目的:按地区或地区展示数值时

 1、热图

 应用场景:用于表示地理范围内每个点的权重

 评价:对比度不准确,只能粗略对比度

 2、流向地图

 应用场景:径流地图广泛应用于区域贸易、交通径流、人口迁移、购物消费行为、通信信息流、航线等场景

 评价:难以显示数值的大小、对比度、倾向等

 3、积分地图