什么是数据分析?
其实很多做数据分析的人,包括正在做数据分析平台的企业和公司,都很难对数据分析有清晰的认知,经过了十几年的发展,数据分析这个领域已经掺杂糅合了太多的知识学科,因此造成了很大的谬误。
其实数据分析相当简单,我尝试着自己进行了一次定义:数据分析,是针对某个问题,将获取后的数据用分析手段加以处理,并发现业务价值的过程。
这句定义中包含了“问题”“获取”“数据”“分析手段”“业务价值”五个关键词,分别代表了数据分析流程当中的五个层次——“业务需求层”“数据采集层”“数据层”“数据处理层”“输出层”
问题
数据分析的起点就是问题与目标
目就是眼睛,标就是靶子,也就是用眼睛盯着靶子瞄准,这就是目标思维。也就是说我们一定要知道数据分析的目的是什么,是为了做什么事情而分析,是要分析产品功能、还是想要原因诊断。有了目标我们才能搭弓射箭,而不是把时间浪费在应该用什么弓箭、应该摆什么姿势、应该什么时候射箭这样的问题上。
获取
当我们明确了分析的目标之后,下一步工作就是去找数据。
数据采集就是将原始数据从数据库中取出来,数据分析师在这一步更为重要的工作是搞清楚数据放在哪里+怎么把数据取出来这两件事。
数据
第一种是数据库数据,包括公司中各个业务系统的数据、系统日志数据、行业数据等。
第二种是数据场景,什么叫作场景呢?最常见的例子就是数据分析指标体系,比如零售行业当中的“人货场”体系,其中的人、货、场三个要素都能组成一种数据场景。
第三种是清洗后的数据,这一步是数据分析当中最耗费时间的工作,几乎能占到整个过程 60% 的工作量,主要包括脏数据清洗(空数据值、空指标等)、重复数据排除、无效数据剔除等,主要的清洗数据工具有 Excel、FineBI 等。
分析
数据分析,根据实际场景需要可以分为四种:描述分析、统计分析、挖掘分析、建模分析
举个最简单的例子,学校门口卖烤地瓜的摊主告诉你他今天卖了 100 个地瓜,让你评价一下他的收入怎么样。
拥有数据思维的人这个时候应该会问一句“昨天卖了多少”或者“平时都卖多少”,假如他说平时只卖 50 个,那么评价就是今天比昨天卖得多,这时很多人就不会继续深挖数据了。这就是我们平时经常会犯的错,对比一下数据差异,然后就给个结果出来,抛给领导或者业务人员看,他们自己都能看出来的事情还要数据分析师干吗?那么我们应该怎么做呢?
首先遵守对比原则,可以分为横纵向对比、同比环比,横向对比竞争对手、纵向对比自身的差异,比如说与昨天相比今天是否出摊比较早?是否换了出摊的位置?是否隔壁摊位今天没有来抢生意等。
其次是趋势分析,大体可以分为周期趋势、行业趋势、外部环境趋势等,比如周期可以取一个星期 / 一个月的数据,最近的销售额是否一直在增长?是否是地摊的行业整体向好了?外部环境是否允许更多人来买地瓜了,例如学校门口?
然后细分分析,我们可以将烤地瓜的指标进行细分,细分成为销售个数、单个成本、工作时长或效率等。比如是否是今天的地瓜质量提高了,成本也提高了?是否是工作时长提高了,营业时间提高了?
这时候你就会发现数据中隐藏的很多信息,比如烤地瓜比昨天卖得多,很可能是因为今天老板出摊早,也有可能进了一些好吃的地瓜(成本上升带来销量的提升),也有可能是某些原因造成今天学生流量大(可能是食堂的饭菜不好吃或者其他原因),甚至有可能是因为今天比昨天冷,路人都想买个热地瓜吃。
价值
为什么总是有人抱怨数据分析没有价值、不能落地?原因很简单,他们在做分析的时候并没有关注业务与企业的价值点,所以做出的结果没有意义。
业务方为什么会找我们做数据分析?其实就是为了实现业务价值,价值体现在两点:如何将企业的盈利时间拉长?如何提高单位时间的盈利率?
第一点,盈利时间拉长需要提高用户的持续黏性,让用户和客户不断为企业创造价值,简而言之就是不断优化用户体验,拉长盈利时长;
第二点,需提高企业创造价值的效率,提高单位时间内的盈利率,比如利用数据分析及时监测员工单位产值,从而通过提高人效和产效的方式提高价值效率。