本講義出自<b>arsalan tavakoli</b>在spark summit east 2017上的演講,主要對于虛拟化分析的技術路線的發展進行了探讨。
對于企業而言,往往希望資料積累的越多,擷取的智能也就越多。但是怎樣才能做到這一點呢?其實需要依靠三大支撐:<b>資料、分析以及人</b>。面對參差不齊并且傳播速度非常快的大量資料,多種多樣,越來越複雜的分析手段以及需要涉及更多的人、更多的職責以及人與人之間工作交接的低效的挑戰,今天的技術棧足以應對了麼?
從最初的資料倉庫、到第二代的hadoop+data lake,再到如今,經過了三代技術棧的更新,目前databricks + apache spark成為了最好的解決方案,然而技術還需要不斷進步與發展。