天天看点

《驾驭大数据》一8.4 优秀分析专家身上经常被低估的特质

本节书摘来异步社区《驾驭大数据》一书中的第8章,第8.4节,作者: 【美】bill franks 译者: 黄海 , 车皓阳 , 王悦 , 等 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。

驾驭大数据

下面我们讨论优秀分析专家身上最关键的特质。这些特质对其他业务领域也是有价值的,我们这么说并不是要否定它们对于分析的重要性。下述的每种特质都比我们以前讨论过的更重要。维持既有的分析流程会容易一些,如若要寻求新的突破,建立新的分析流程,人才招聘和人才挽留就显得比较重要了。要想成功地驾驭大数据,完成支撑大数据所需要的具有创新性的新业务分析流程,我们需要跨过更高的标杆。

承诺是普惠每个行业的特质。总会有人愿意挥洒汗水让项目按时交付,使项目获得最终成功。当然也有人不愿意这么卖力地干活。在公司里,我们得弄清楚哪些人靠得住,哪些人靠不住。任何优秀的分析专家都会言出必行。幸运的是,我们在面试过程中通过候选人对自己以前工作和成果的描述,就可以看出这种特质。认真倾听,就能找出可以满足承诺这项要求的候选人。

关于承诺真的不需要讲那么多。我们都知道承诺对于各个领域的重要性,这其中当然也包括分析领域。

创造力并不是大多数人一想到的分析专家就会想到的特质。大多数人以为分析专家的工作就是处理那些一成不变的统计公式。他们只需要按书本上说的那样做就行了,并不需要创新。事实是这样的吗?

肯定不是。根本原因是我们遇到的每个业务问题都是不同的,而解决各种问题的数据往往都会很复杂且不完整。分析专家必须得想清楚要以怎样一种全新的方式,并利用手头上的数据解决新出现的业务问题,这就需要创造力了。没有哪本书或哪套规则能够说清楚我们要怎样做关于业务问题的大量决策,怎样以正确的方式把事情全部做好。

另外,每次分析专家都会遇到一些不可预见的问题。有时候遇到的只是小问题,有时候会遇到大麻烦。每次遇到“@#%$&*!!!”,分析专家就会意识到碰到大麻烦了。创造力就是解决这类问题的新方法。我们遇到的可能是数据问题,也可能是实际动手分析时才发现自己没有真正理解的业务问题。创造力的存在就是要解决这些困难,并得到最终结果,达成目标。

不要低估分析专家创造力的重要性。创造力在那些自称为分析专家的人身上并不常见。以创造力作为评判标准会筛选掉很多人。如果给你10个人,有两三个人能满足要求就不错了。有的公司会使用性格测试,有的会让候选人解决随机出现的问题来评判他们是否有创造力。我评判一个人是否有创造力的方法是,让他自己讲在遇到“@#%$&*!!!”这类分析问题时他是怎么做的他讲自己百测试,或者让候选人解决随机出现的问题来评判他们的创始。有创造力的人讲出来的故事往往很动听,而没有创造力的分析专家只会把自己解决问题的步骤简单地罗列出来。

1.干净的数据只存在于教科书中

干净的数据真的值得在本节中用单独的一部分讲解吗?我们在这里讲干净的数据是因为,分析专家的数据处理方式必须得有创造性。数据永远不会像我们想的和要求的那样干净,数据永远都会有缺陷、不完整和错误,数据还会违背分析方案中的一些假设条件。

我们在学校上学的时候,都认为数据应该是准确的、干净的、完整的。如果有的数据点不是这样,那我们就会弄清楚原因,然后调整数据。每一个在校生都拥有这个疯狂的想法,教科书的例子反映了他们以后将在商业世界中遇到的情况。但是,商业肯定不是按照教科书的方法在运转。数据永远不可能跟课堂案例一样简单。例如,性别编码除了“m”、“f”、“u”以外,还可能由于某些未知原因而变成“h”。同样,客户也许会在杂货商店购买10 000 000美元的商品。还有,虽然产品将被卖出,但其产品代码却并不存在。

这些情况会产生严重的问题。换句话说,当数据并不是我们想要的和我们所要求的,我们要怎么办?我们是不是应该忽视那些没有真正发生购买行为的消费者?我们是不是要把“h”变成“u”?产品代码能否被正确识别?弄清楚如何才能最有效地利用分析数据是任何分析工作中最困难的部分,这需要有一定的创造性。如果分析专家发现数据不完整,不能充分地解答我们期待的问题,就应该发挥创造力找到方法让不可能变成可能。在这个过程中,我们可能要弃用其中某部分数据,或者修正一部分数据。我们可以从快速解决问题并取得小小的胜利开始,然后在此基础上不断完善已有的成果。

追求完善,而非完美 解决业务问题时,我们追求的目标应该是不断完善,而非追求完美,理解这一点很重要。如果只要把数据弄得干净一点,就能获得一些工作成果和提升机会,这该有多好。优秀的分析专家关心的是如何完善工作成果,如何从不标准的数据中努力获得他们想要的结果。分析结果本身可能并不完美,但它们足以支撑决策,我们大可以此为基础不断地改进策略,这样就已经很好了。

会员卡分析就是这样一个领域,它的数据永远也会不完美。即使是最忠实的客户也不会记得每次都使用他们的会员卡,这就意味着每位客户的“整体”消费状况都是不完整的。然而,事情还可以补救。真正优质的客户大部分时间还是记得使用他们的会员卡的。对于理解客户消费,这些数据已经够用。事实上,缺少一些数据并不意味着分析就做不了。当然,有的客户可能会因为信息不完整而被略微低估,但我们根据这些数据其实已经足以做出决策了。优秀的分析专家肯定明白这一点。

2.足够干净的数据

优秀的分析专家都会关心的一个重要问题是,无论数据有多脏,或者多大程度上违背了假设条件,数据是否还足够干净。依靠这些数据我们能得到让人信服的结果吗?我们能通过这些尚可信赖的数据,得到可以使我们真正有所收益的结果吗?如果答案是肯定的,分析专家们肯定会奋力尝试。数据根本不需要过于完美,只要足以支撑我们进行决策就可以了。优秀的分析专家善于创造性地找到验证数据是否干净的方法。

作为一个广泛使用但错误很多的数据源,家庭人口统计已经有数十年历史了。一般来说,人口统计数据供应商都能获得准确的统计信息。但是,我们还是要假设在数据编辑过程中,会遇到家庭数据不准确的情况,但它们并不会妨碍数据的有效性。即使有些家庭的数据有问题,分析所得的粗粒度的模式和发展趋势也是可信的。即使数据不完美,使用这些数据对营销人员来说也是非常有用的。总是有创造性的办法来解决这些已经存在的偏差和问题。如果仅仅是因为数据错误而忽略数据,那许多有价值的分析都会不复存在。

优秀的分析专家会在企业环境中想方设法地让内部数据源产生商业价值。这取决于我们如何看待这件事情,我们可以认为瓶子里面装了半瓶水,也可以觉得瓶子里面空了半瓶水。正如第1章所述,这种观点对处理大数据也是适用的。大数据往往不够干净,经常会包含需要过滤掉的冗余信息。

优秀的分析专家既能理解他们使用的业务模型,也能理解如何才能有效地使用分析手段解决实际的业务问题。优秀的分析专家既能从业务角度看待重要的业务指标并分析产出,也能从技术角度看待这些指标,他们会花时间努力达到这样的认识高度。不管我们的商业头脑怎么样,我们都得有兴趣,并投入足够的关注和精力才能把分析工作做好。如果我们对理解业务本身根本没有任何兴趣和意愿,我们就不可能变成优秀的分析专家。

请注意,商业头脑和行业经验指的并不是同一件事。行业经验只是一组事实和知识的集合,商业头脑是一组软技能的集合。如果某个分析专家很有商业头脑,那么他在转行的时候一般不会有什么问题。就像前面mark那样优秀的分析专家,他们可以把他们的商业头脑运用在其他场合和问题上。我们在面试分析专家的时候,要问清楚他们在以往的项目中是如何进行决策的。如果候选人有商业头脑,他们就会提到自己的一些真实的业务和技术思考。你们之间的讨论肯定会或多或少涉及对解决业务问题方面的考虑。没有商业头脑的分析专家会把精力主要放在技术需求和条件假设上面。

奇异的混合体

优秀的分析专家都是奇异的混合体。在工作中,他们有时会像it人员那样做纯技术性的工作,而有时会像真正的商人那样动用商业头脑。跨界思考问题很困难,这也就是为什么成为一个优秀的分析专家会如此困难。

1.适当的粒度

我们所说的商业头脑,其中一方面内容指的是怎样把分析结果和决策粒度联系起来。什么意思呢?比方说,现在有一位商人要求一名分析专家来提升某次市场营销活动的效果,他规定只要构造出来的模型比目前的方法好2个百分点,就算成功。这就是给分析专家设定的要跨越的标杆。他们要对自己有信心,相信自己的方法的效果至少要比当前的方法好2个百分点。

他们会在演示结果时说自己的模型比基准效果好5.325 26个百分点吗?应该不会。如果误差范围是加减2个百分点他们肯定不会这么说。如果误差范围是加减2个百分点,还有谁会在乎点估计是5.325 26?这个时候百分位纯粹就是干扰位。我们要表达的关键点是,加减2个百分点,结果会在5个百分点上再提升一点;最坏情况也是3个百分点,这样模型才能肯定比2个百分点的基准效果要好。这就是所有商业人士关心的内容。优秀的分析专家不会让业务团队被更多的细节困扰,他们会采取能够让数据增值的作法。他们会用自己的商业头脑来判断需要提供哪些内容,以及如何定位分析结果。

另一个例子与需求预测有关。几年前,一家厂商曾宣称它的需求预测结果比竞争对手准确得多。这家厂商表示在一般情况下,使用者手头只需要额外预备3个单位,而竞争对手推荐需要预备4个单位。项目投资人听到这个当然很高兴,但问了一个问题后,他们就不再那么兴奋了。投资人问的是,他们的最小采购单位是6,现在该怎样来判断两家厂商预测的有效性呢?最小采购单位是6,任何粒度更细的措施都是徒劳的。如果分析专家有很好的商业头脑,并以正确的方式解决问题,就会提前把这些约束条件识别出来作为前期的铺垫。

2.关注重要的事情

实际数据往往会违背前期的假设条件。例如,很多模型都会假设分布是正态的。从理论出发,我们要考虑这些假设条件会在何时被破坏。但从实际出发,如果两个变量之间有很强的作用关系,不管使用何种方法,这种作用关系都会以某种形式显现出来。这是不是说明在先前的假设被严重违背时,虽然我们选择的建模方法不同,但参数估计和影响预测却仍然是相同的?当然不是。但这并不意味着即使违背了先前的假设条件,并使用了不同的方法,起重要作用的因素就会被发现其重要性。如果粒度本身不需要过细,那粗略的作法就很好。

是否存在这种场景,使用线性回归法证明两个变量之间没有任何关系,但使用u型曲线却可以完美地阐释变量之间的关系,从而违背了原先的线性假设条件?确实存在这种场景。关键在于这不是不可能的,变量关系在多数情况下还是能以某种方式识别出来的。如果分析项目的甲方要的是二值决策,数据和模型只需要能准确地给出这种二值决策就可以了。优秀的分析专家知道何时要按照需求上调或者下调结果的精度。图8-1就是这样的一个例子,图中有些数据很明显违背了线性关系的假设条件。但是,如果我们需要的是理解两个变量之间共同变化的趋势,那回归直线就能有效地反映出这种关系的本质。

《驾驭大数据》一8.4 优秀分析专家身上经常被低估的特质

3.文化意识

使用发展中国家作为离岸人力资源是it行业的大趋势之一。分析市场也多多少少受到了影响。我们现在并不是要从经济和道德的角度出发,进行离岸是好还是坏的政治意义上或哲学意义上的讨论。这些问题我们以后再讨论。在这里,我们想要讨论的是当下的离岸市场是否可以满足业务分析场景的全部需要。

编写本书之时,多数离岸人力外包公司关心的还是技术本身,以及怎样对团队进行技术培训。他们往往会重点强调,自己有25个会使用所有的统计软件包的统计学博士。只要你们提出问题,他们就能给出答案。我们已经讨论过,对于优秀的分析专家来说,技术只是基础。而且,如果分析专家没有见识过真正的业务环境,就很难培养出商业头脑。

如果分析问题本身清晰简明,离岸人力外包公司提供的候选人就能派上用场。但是,如果想要依靠离岸人力资源提供端到端的分析支持,这种想法肯定会碰壁。跨地域、跨时区、语言障碍这些情况都将成为问题。这些问题本身就很难处理。离岸人力外包公司与合作方之间存在着巨大的文化差异,更不用说离岸人力外包公司对合作方所在国家的思维和运作方式还缺乏经验和了解。

不管是谁来提供远程支持,都会有同样的风险存在。正如印度的分析专家如果没有见识过美国的业务环境就无法提供有意义的分析一样,如果美国人没见识过印度的业务环境,他们也很难提供有意义的业务分析。

一位同事曾经告诉过我一个很棒的故事,故事内容讲的是一家食品行业的公司招聘离岸团队为宠物食品进行分析。故事开始之前,请想象一下那种罐装狗粮和袋装狗粮,有些上面还印有幸福的小狗。拿到分析结果后,从分析文档啰唆的行文风格和分析专家的口头演讲中,可以清楚地看到,分析专家完全不理解什么是宠物食品。分析结果跟宠物食品根本毫无关系,讲的全是罐装狗肉!你想知道后续的情况吗?分析团队的结果是包装上印制的幸福小狗对罐头里的狗粮根本不会有任何兴趣。相反,幸福的小狗还被放到罐头里被当成了人们的晚餐!

角色互换会很容易出现类似的问题。如果完全不熟悉业务运营环境和文化,就很难拥有正确的商业头脑。我们是否可以依靠离岸的人力资源呢?如果使用得当,还是可以的。但我们不能只是简单地把业务分析问题丢出去,然后就等着纯技术背景的离岸团队自己设定分析策略,解释分析结果,然后填鸭式地告诉我们他们的分析成果。我们需要真正优秀的、有商业头脑的本地分析专家来指导整个分析流程,这样才能确保项目最终成功交付。

演讲能力与沟通技巧对很多工作都是非常重要的,对分析专家来说也是如此。不管分析专家自己多么擅长分析,如果他们干的不是大学毕业生就能干的活儿,别人对他们的要求就会很高,他们既需要得出强有力的分析结果,又需要能把分析结果用吸引眼球的简洁故事讲出来。优秀的分析专家能够牢牢地吸引住不懂技术的人,用他们懂得的语言来描述分析结果,使他们对分析结果感到无比兴奋。优秀的分析专家会讲一个动听的故事,而不是简单地重复统计数字和事实。

分析专家不会面对业务听众大讲特讲共线性分析、模型统计数据汇总和其他一些深入的技术细节。他们会说,“这是我们所发现的,这是它们为什么很重要的原因,这是您应当以此作为结论的依据。”此外,分析专家还会与业务人员进行讨论,告诉他们采取何种措施可以获利。产品销售额会提升吗?利润空间会扩大吗?说到底,业务人员关心的还是分析结果能够怎样帮助到他们,而不是技术本身。

分析专家应该用一种简短的、一针见血的方式来沟通分析结果。不管他们采用的是幻灯片还是书面文档,都需要掌握大量书面交流的技巧。而无论是正式演讲,还是办公室中简单的临时讨论,分析专家都需要掌握很多口头沟通和演讲的技巧。

试驾 评判一名分析专家的演讲能力和沟通技巧最行之有效的方法是,让他们在面试阶段进行演讲。这样我们就能看清楚这个人,分辨他们有没有成为优秀分析专家的潜质。

并非每一位分析专家都能站在大庭广众下,或者站在执行委员会会议上还可以表现得泰然自若。至少他们在刚工作的时候做不到这一点。但是,每一位优秀的分析专家都需要能在办公室或会议室里,站在项目投资方和他们的老板面前,侃侃而谈。评判一名分析专家的演讲能力和沟通技巧最行之有效的方法是,让他们在面试阶段进行演讲。我们既可以给他们安排一个泛泛的题目,也可以让他们自主选择题目。这样就能看到他们的作法和在压力面前的承受能力。面试候选人的沟通技能将会在几分钟内一览无余。

1.结果并不是成功最重要的部分

你肯定对这句话感到吃惊。但是,判断一个分析项目是否成功的标准并不只取决于分析结果的质量。理想情况可能确实如此,但现实情况并非如此。首先,积极地将分析结果弄得更准确是很重要的。每一位分析专家确保每次的分析结果正确无误是非常重要的。但是,站在分析项目投资方的角度看,分析结果本身对于判断项目是否成功最多占了50%。那还有什么事儿同样重要呢?

剩余的50%就体现在分析专家的演讲能力和将结果文档化的能力上。他们能有效地定位分析结果吗?分析专家能否用吸引听众的方式陈述结果,并让听众放心地采取行动?我认为这一点再怎么强调也不为过。无论分析方法本身有多么吸引人,优秀的分析专家也不应该只关心分析方法本身。他们应该留出时间来想如何才能正确地解释、定位结果,并将分析结果更好地兜售给分析的投资方。

傻瓜,这就是交付! 冗长复杂的分析结果需要提炼成可以消化吸收的观点。而分析专家想要具备这样的能力,需要不断实践、辛勤工作。分析专家经常会觉得自己把事情淡化了。虽然要有细节和对分析结果的辩护,但不应该一开始就陷入到细节中。如果讨论过细,业务团队成员的眼神就会变得茫然,他们的注意力也会开始变得分散,这样,他们最终就不会采纳我们的分析结果。优秀的分析专家会让投资方一直充满兴趣。

业务团队才不会关心你已经辛苦了10个星期,也不会关心具体的技术细节,他们只关心结果。分析专家必须清晰有效地传达结果,否则结果就会被无视。好的结果是项目成功的必要条件,但却不是充分条件。优秀的分析专家会理解这一点,会适当地关注交付过程。

2.广告业给我们上的一堂课

分析专家总是喜欢不断地衡量来衡量去。他们喜欢以检验结果是否奏效的方式来进行工作。在直销市场中,这是正确的作法。分析专家还会运行一个模型,并生成一份人员名单,然后再发电子邮件,打电话,或者用其他方式进行联系。分析后台可以准确地告诉我们业务的提升度。如果方法奏效,我们就可以着手干更多类似的事情。如果方法无效,团队会停下来转投其他方向。

许多公司的预算大头都花在了电视、广播、报纸等大众传媒渠道上。这些媒体确实能产生影响。但是,要想非常准确地弄清楚这些媒体究竟能产生多大的影响基本上是不可能的,评估广告产生的影响是很不容易的。尝试评估电视、广播、印刷品营销能够产生多大市场提升度的方法学也是不靠谱的。更低层次采用的方法,例如店面级别的,也好不了多少。广告仍然无处不在,虽然也有一些选择是可以衡量效果的,但公司的预算还是没有转投那些地方,这是为什么?

其中一个原因是,直销市场在谈论使得更好的精准营销能够成为现实的业务分析,没有什么会比听到这些内容更让人兴奋了。直销分析可以用统计方法识别出哪些人最有可能会响应,然后企业就能找到他们,并卖出更多的产品。当然了,销售驱动使得顾客眼前一亮,但实际上没有什么激动人心的故事情节。

广告公司是怎样制订计划的?它们运用多媒体演示效果,和着动听的音乐和动感的视频,说着时下流行的广告语。它们会让听众对他们的计划满怀信心,立即签约。即使这种营销效果在后台不能清楚地计算出来也没有关系,因为听众已经被广告公司带入一场视觉享受的盛宴中了。

我们不能指责广告公司(发那些垃圾信件),相反,我们还要赞扬它们。广告并不像其他活动那样可以衡量效果,但是广告还是要消耗掉公司很大一笔开支。部分原因是因为广告行业有能力吸引投资方的注意力。广告公司能够完全地理解和利用沟通能力与演示技巧。如果想要成为优秀的分析专家,我们可以从广告公司的身上学到很多东西。试想一下,如果活动效果可以准确衡量,再配以有效的分析,以及广告活动在商业活动中注入的兴奋度,这样的项目该有多牛。

直觉是最难定义的特质了。如果看不到他们的行为,很难判断一个人的直觉怎么样。我们说的直觉,就是分析专家对下一步要做什么的感觉。遇到障碍时,分析专家会坐下来冷静地分析,他们会找出可以采取的a、b、c、d四种措施。他们的选择有多准确?他们是不是有很好的直觉,可以使这些方向逐步实现?他们的选择是不是大多情况下都成功了?在最后制订出计划前,他们是不是已经被各种选择搞得手忙脚乱?优秀的分析专家会用一种不可思议的能力选择一条好的道路。

我推荐你们读一读这本书,daniel h. pink(riverhead trade,2006)的《a whole new mind》。这本书总结了一些非常有趣的观点,从技术如何帮助人们在该领域获得成功,到我们之前所谈到的多种特质。pink的书从更广泛的角度讨论了我们刚才讨论过的一些主题。

从许多方面来讲,直觉都是一种与生俱来的技能。但直觉还是可以调整和培养的。最终,直觉融合了以往类似问题的解决方法与经验。直觉是以这些方法和经验作为基础的,保持足够明智的态度,弄清楚何时可以再次应用以往的经验,何时可以做适当的调整以适应新的情况。

好的直觉是成为优秀分析专家的决定性因素,但我们在面试的时候很难判断出一个人的直觉。一些我们认为可以使用的标准可能并不是人力资源的评判标准,因为这些标准太过于主观。经过一段时日,根据分析专家们的表现和处理问题的方法,我们自然就能看出来他们究竟是不是有好的直觉。

是艺术还是科学

本章要表达的一个主题是,分析不止是科学,还是一门艺术。优秀的分析是可靠的科学加上艺术的神来之笔。分析的艺术在于弄清楚如何处理非常规的问题,如何组织一场激动人心的演讲,如何用最好的方式来解释我们的分析成果。优秀的分析专家必须既有科学素养,又有艺术细胞,他们不但是科学家还是艺术家!

聚类分析是一种模型分群算法,下面我们来看一个聚类分析的例子。还没有哪种简单的并被大家广泛认可的度量方法,可以像聚类分析这样方便地找出正确的答案。分群建模方法真的是一门艺术。经常使用分群模型的分析专家都有自己的搜索原则。比如我使用这种模型的时候就有自己的操作流程。我知道自己要往哪儿去,我要找的是哪种模式。但是,我很难给别人讲清楚这一点。同样,其他人也无法向我解释清楚他们的方法。每个分析专家都有自己进行分群模型分析方法,这些方法对于他们来说就是艺术。

信任对于分析专家的工作至关重要,这个观点正在逐渐被人们所接受。面对需要很多艺术处理的分析数据,信任就变得更加重要了。如果没有什么指标可以清楚地告诉我们要做何选择,业务投资方就必须得相信分析专家的直觉,相信他们的艺术处理方法。获得这种程度的信任需要跨越相当大的一步,需要很长时间才能建立起这种信任关系。优秀的分析专家会花时间来建立这种信任,他们愿意成为业务伙伴可以信赖的顾问。

**以艺术家身份出现的分析专家

**

不同的画家面对同一处风景,他们可以使用完全不同的技法但都画出了引人入胜的作品。不同的分析专家也可以使用完全不同的方法来做分析,这就是分析本身的艺术性。有些算法本身没有多少艺术处理的余地,但保持艺术的态度肯定可以更好地支撑决策、定义问题、设计分析方法,以及根据手头数据得到解决方案。优秀的分析专家既是艺术家又是科学家。

最近,分析圈子里面最火的话题是公司中数据科学家所扮演的角色。正如本章之前讲述的那样,数据科学家做的事情与高级分析专家做的事情本质上并没有太多不同。传统意义上的分析专家如果想要变成数据科学家,需要掌握类似mapreduce的这类工具,但学习新工具对于分析专家来说并不算是新事物。数据科学家的工具箱里有新的工具吗?答案是肯定的。他们会有完全不同的分析意图吗?答案是否定的。

和数据科学家这个概念同样重要的是,我们要把分析专家看成是使用数据的艺术家。他们是要深入挖掘公司数据的人,他们也要用优雅的有吸引力的方法来创造性地利用数据解决问题。就像画家可以挥洒颜料作画来装饰墙面一样,数据艺术家们也可以把数据变成业务问题的解决方案。

优秀的分析专家既是艺术家又是科学家。同时拥有两种本领,当然比只拥护有一种技能要强。如果你怀疑这种说法,问问你认识的那些优秀的分析专家,他们的技能和兴趣是什么。你会惊讶地发现他们还有音乐、美术和其他需要创造力的领域的才能,而我们以前并不知道他们还有这些才能。

继续阅读