本讲义出自<b>arsalan tavakoli</b>在spark summit east 2017上的演讲,主要对于虚拟化分析的技术路线的发展进行了探讨。
对于企业而言,往往希望数据积累的越多,获取的智能也就越多。但是怎样才能做到这一点呢?其实需要依靠三大支撑:<b>数据、分析以及人</b>。面对参差不齐并且传播速度非常快的大量数据,多种多样,越来越复杂的分析手段以及需要涉及更多的人、更多的职责以及人与人之间工作交接的低效的挑战,今天的技术栈足以应对了么?
从最初的数据仓库、到第二代的hadoop+data lake,再到如今,经过了三代技术栈的更新,目前databricks + apache spark成为了最好的解决方案,然而技术还需要不断进步与发展。