证明大数据应用和平台业务价值的需求在主流组织中占据了重要地位,对于it和分析经理们来说,获取数据价值并非易事。
例如:对于密歇根的blue cross blue shield公司来说,大数据部署并不是一时冲动的决定。
beata puncevic是这家医疗保险公司分析总监,负责数据工程和数据管理,她说:“对于很多像我们这样的组织,大数据还没有成为运营业务的核心基础。如果你去对很多人(主管)讲,让他们在大数据平台上投资,你是很难与他们产生共鸣的,这是很大的挑战。”
puncevic认为,对于blue cross公司和其它医疗保健企业,这些挑战包括低利润率、资源和技能储备问题,还有相对保守的文化问题。低利润使得很难为技术创新留出钱来。她和她的同事们不得不做很多额外的努力来获得hadoop数据湖的审批和资金。
puncevic组建了团队针对数据湖项目开发了投资回报率框架,评估大数据项目的益处。在构建业务案例的过程中,她还关注了三类与it有关的改善,包括:降低数据处理和管理成本,建立更深刻的分析,创建更灵活和适应性的技术架构。
此外,puncevic说她在争取获得公司资金支持,用于本阶段项目和后续项目阶段。“因此,我们不必担心为了大数据策略的各种方面从个别业务单元获取资金的问题”。
这种策略很有效,这家底特律的保险公司已经启动了未来三到五年的大数据平台建设规划。puncevic上周在美国加州san jose举办的2016 hadoop峰会上说,大数据的好处对于整个医疗行业来说是“潜力巨大的”。除了节省it开支,她还提到了降低医疗成本的益处,同时可以改善患者就医体验,促进医学预防工作。所有这些都是通过更好的分析获得的。
利用大数据获益之路
大数据的价值为progressive casualty保险公司及其车险客户也带来了绝对真实的价值。brian durkin是该公司企业架构组的创新战略师,他说progressive公司使用hadoop集群增强了snapshot项目,基于从车辆收集到的运行数据奖励安全未出险驾驶员购险折扣。durkin在另一场分会上表示,自从2008年该项目启动以来,该保险公司已经发放了价值超过5.6亿美元的折扣优惠。
他说:“这不是科学实验,而是已经在真实发生的事。我们在这方面全身心投入,这对我们的客户也很重要。”
为了跟踪参保驾驶员并计算折扣,该集群环境需要收集大量数据进行处理和分析,他们的集群环境与blue cross公司的是类似的,都是基于hortonworks hadoop分布式框架的。progressive公司已经收集了24亿数据,集群留存了所有信息。为了分析驾驶模式,识别坏习惯驾驶的司机并警示他们,durkin认为:“越旧的数据越有价值。所以他们留存了所有数据并对所有历史数据进行分析。”
处理数据需要大量处理资源,progressive公司部署了许多高级分析工具供公司数据科学家使用,包括sas、r编程语言和h2o。pawan divakarla是该保险公司在美国俄亥俄州mayfield village分部的数据和分析业务负责人,他表示许多业务主管们都乐意为此买单。
他说:“我们公司完全是数据驱动的公司,我们希望人们有主观动机和想法,但是他们需要用数据证明他们的想法。”
hadoop的高价值应用
零售商macy公司运行了bi和分析应用,也是基于hortonworks的hadoop系统,他们为此支持营销、销售计划、产品管理和其它业务运营。每天都有成千上万的商业用户访问数以百计的bi仪表盘,这是他们做决策需要使用的关键功能。
chakrapany说:“你不会只想看到hadoop用作廉价存储解决方案的,它的价值原不止于此。”
hadoop仍然在逐渐走向成熟,目前还有一些功能比较粗糙。他提醒说,使用hadoop的新用户应该了解到它有一些不稳定性,有些it管理功能也不太完善。“如果你认为它是绝对可靠的,那么这种想法是不正确的”。他说,尽管如此他还是认为hadoop可以真正成为企业级的数据分析平台供macy公司使用。
但是,chakrapany并不认为从大数据分析和基于hadoop的bi应用获益是理所当然的事。去年,他组建了团队在内部宣讲大数据环境的优点,希望游说更多业务单元使用它。他的团队还跟踪hadoop平台产生的业务价值,包括定性和定量两方面。
chakrapany说:“我们不想只是统计用户数量和查询数量,统计分析了多少数据,那些只是数字。关键部分在于,这些数据给企业带来了哪些帮助。”
====================================分割线================================
本文转自d1net(转载)