首页常见问题正文

新手做数据可视化有哪些常见误区?

更新时间:2022-11-22 来源:黑马程序员 浏览量:

IT培训班

  1.缺乏明确数据可视化的目标

  数据可视化的目标是展示信息,使信息更容易理解。如果用户没有目的,仅仅是“看一看”,那么数据可视化是没有价值的。

  任何没有目标的图形可视化,与直接陈列数据表格是一样的,这种做法都没有体现数据分析师的“价值主张”和分析结果。除了取数的需求之外,数据分析师输出的应该是经过思考、推理、验证并给出的数据结论,分析,甚至建议。

  2.通过特殊图形设置误导受众

  数据可视化可使数据的形态、分布、对比甚至规律发生根本变化。在之前某个章节中,柱形图和条形图在展示的时候,因为只设置了logx=True,所以传递信息的差异巨大。做数据处理之前,商品销售排名第1的省份比排名第2的省份销售量高出4倍,而处理之后,两者的图形显示差异却不到一倍。

  不仅仅是柱形图,其他所有涉及对比的场景,比方说趋势图、雷达图等经过数据量纲的处理,都会导致数据的差异变小。这种处理在特定场景之下是合理的,但不能滥用。

  3.不要把图形做的过于“花哨”

  其实在很多场景下,简单的数据信息可视化方法基本能满足数据呈现需求,并且简单易用,只是在展示效果和交互上有些简陋。更加美观的图形确实可以增加美观度,但可视化的本质并不是“让图形好看”,而是以合理的方式传达信息。除非你是视觉设计师,否则“好看”不是开发人员做图形可视化的第一目标。

  图形可视化是展示信息的一种方式。此外,数据表格、分析报告、数据邮件等都有类似的作用。不同介质展示的格式有差异,但本质都是信息传达,切勿在内容和信息本身匮乏的前提之下,过度追求“图形好看”。

  4.缺乏根据信息表达目标选择“最佳”图形的意识

  不同的图形具有不同的数据表达信息的倾向和属性,但很多初学者往往不重视这个问题。例如,在展示不同时间下的数据指标时,选择饼图;用雷达图展示5个分类在1个指标上的差异。这些都是对目标图形最佳适用场景的忽视,而可能导致的问题是信息没有被正确传达和理解。

  即使使用了正确的图形,也需要在不同场景下区别运用。例如,折线图适合展示不同日期下的指标的变化。但如果时间的粒度很粗,如基于月,则柱形图更加合理。但即使粒度很粗,如果有几十个粒度值(如120个月、10年的数据),则仍然选择折线图。

  5.信息过载

  每种图形能承受的信息量是有限的,因此需要根据不同的图形适当地选择要展示的内容,而不是全部展示出来,否则会导致要展示的重点信息被埋没在杂乱无章的内容中,重点不突出。好的可视化需要做到重点突出、信息详实且容易理解(当然前提是容易发现)。

  很多初学者在设置可视化图形时,可能会尽量多地使用图形设置,如不同的颜色,不同的样式,甚至不同标记等,目的是提醒受众更好地区分信息。这种做法同样走向另一个极端,它表面上是将所有的信息都标记出来,但其效果与什么都不标记是一样的。受众仍然无法分辨到底哪些信息是关键信息。

分享到:
在线咨询 我要报名
和我们在线交谈!