如何明确数据可视化分析的需求

sdq
Explore, Think, Create
5 min readApr 11, 2020

欢迎关注可视化笔记专栏

本文翻译整理自Tableau官方博客

当数据分析师从客户那里拿到分析需求的时候,需要系统性地对需求进行分解和重构,从而为后续可执行的分析流程做好前期准备工作。这个明确需求的过程总共可以分为四个步骤:(1) 理解需求 (2) 组织有效信息并定位数据 (3) 针对问题选择合适的分析类型 (4) 决定最终的输出形式(图表/仪表盘/数据故事)。

1. 理解需求

当谈到需求的时候,相比于去深入理解问题,我们总是更倾向于认为我们已经明白了用户需要什么。通常我们会在交谈或者邮箱中收到客户的需求信息,在这个过程中我们的大脑会跳跃式地给出一些我们主观的解决方案,甚至都还没有让客户把问题给彻底讲清楚。

在这一阶段中,建议把用户的需求写下来或打印出来,在你写的过程中你会了解到这些需求中哪些部分需要进一步被确认。比如下面这个例子,其中第一句问句是:“能不能给我一份上个星期里表现最佳的报告?”

在写的过程中,我们就会发现这个问句中有三点需要被确认:(a) “给我一份报告”:是只发给你?用Email还是网页的link?(b) “表现最好”:表现好是指什么?是人吗?还是产品或市场?如何定义最好?我们怎么衡量呢?© “上周”:上周是只周一到周五?还是周日到周六?

如果可能的话,通过和客户的反复沟通,可以重写之前的需求,把细节阐述得更清晰。还是以前面的例子,(a) “给我一份报告”:确认为发送网站link (b) “表现最好”:表现好是指整体销量最好 (c) “上周”:指的是周日到周六。

此时还需要确认客户期望的产出是什么,这对后续的工作有指导性的意义。

  • 是需要一个具体的数字?比如“某一季度用户的满意度是多少?”
  • 还是需要一个总结?比如“导致销量上升的原因是什么?”
  • 还是需要一个可以探索数据的工具?比如“能不能整合在一起,让我们查看….?”

还是拿前面的例子为例,红字部分给出了用户对产出的要求:“我们希望了解竞品的促销活动对我们销量最高的产品是否有足够的影响,从而会不会导致我们需要在明年调整销售策略。”

问题和需求总是包含了很多不必要的信息,分析师需要多花一点时间用于确认哪些信息是必须的,而哪些信息是多余的可以忽略的。我们可以继续对上面的例子做进一步清理,划掉那些不需要的信息,只保留必须的。

2. 组织有效信息并定位数据

针对上一步中整理出来的信息,你需要去识别对应的字段:是度量信息、类别信息还是对数据的过滤条件。这些都需要分门别类进行一个整理。比如下图,我们可以提炼出:(1) 类别信息是产品 (2) 度量信息是销量 (3) 过滤条件是上个星期。

当有了明确的字段之后,就可以通过对数据的探索去构建解决方案了。下图是使用Tableau将数据载入后可以定位到对应的三个字段上。

3. 选择合适的分析类型

在这一步中需要基于用户希望的产出来决定分析类型。如果没有明确的指导就开始对数据可视化,那就是完全碰运气了。下面有六个指导性的策略:

  • 问题类型:A是否影响了B? — — 分析类型:相关性分析。
  • 问题类型:A是否比B更好? — — 分析类型:比较分析。
  • 问题类型:A在时间上表现如何? — — 分析类型:时间序列分析。
  • 问题类型:数据中有什么模式吗? — — 分析类型:趋势分析/季度分析。
  • 问题类型:多少用户在某个区间内有共同的特征? — — 分析类型:分布分析。
  • 问题类型:物理位置会对情况有何影想? — — 分析类型:地理位置分析。

针对于上面的例子:我们根据指导策略发现,其实我们需要做的是一个比较分析,需要对产品进行比较,对产品在两个时间点的销量做一个比较。

4. 选择图表类型和展示形式

对于不一样的问题,需要选择对应的可视化类型,下面是之前6种分析类型所推荐的图表:

  • 相关性分析:散点图、折线图
  • 比较分析:柱状图
  • 时间序列分析:折线图
  • 趋势分析/季度分析:热力图
  • 分布分析:直方图、箱形图
  • 地理位置分析:地图…

针对于本文案例中的比较分析,我们可以选择柱状图用于清晰地进行数据比较。

最终我们还要确定展示形式,到底最后是一个图表、一个仪表盘还是一个数据故事。可以采用以下的标准来帮助你做判断:

  • 如果问题可以通过一些简单的数据调查就可以回答,那么这个时候只需要图表形式即可(不需要仪表盘)
  • 如果用户需要探索数据,比如想要自己探索分析原因,那这个时候需要提供仪表盘的形式。
  • 如果用户的问题不仅需要给出答案还需要一些指导性的后续解决方案或建议,那这个时候数据故事也许是一个比较合适的形式。

--

--