天天看點

分析零距離 資料可視化産品選型指南

文章講的是<b>分析零距離 資料可視化産品選型指南</b>,大資料的核心不是“大”,也不是“資料”,而是蘊含在其中的商業價值。作為挖掘資料背後潛在價值的重要手段,商業智能和分析平台成為大資料部署中的關鍵環節。然而,擷取價值的難點并不在于資料分析應用的部署,而在于專業資料分析人才的缺乏。市場研究機構IDC甚至認為,資料分析人才的欠缺可能會成為影響大資料市場發展的重要因素。

  “讓每個人都成為資料分析師”是大資料時代賦予的要求,資料可視化的出現恰恰從側面緩解了專業資料分析人才的缺乏。Tableau、Qlik、Microsoft、SAS、IBM等IT廠商紛紛加入資料可視化的陣營,在降低資料分析門檻的同時,為分析結果提供更炫的展現方式。為了進一步讓大家了解如何選擇适合的資料可視化産品,本文将圍繞這一話題展開,希望能對正在選型中的企業有所幫助。

分析零距離 資料可視化産品選型指南

  一、資料可視化概述

  資料可視化是技術與藝術的完美結合,它借助圖形化的手段,清晰有效地傳達與溝通資訊。一方面,資料賦予可視化以意義;另一方面,可視化增加資料的靈性,兩者相輔相成,幫助企業從資訊中提取知識、從知識中收獲價值。

  維基百科對資料可視化的定義較為權威,它認為資料可視化是技術上較為進階的技術方法,而這些技術方法允許利用圖形、圖像處理、計算機視覺以及使用者界面,通過表達、模組化以及對立體、表面、屬性以及動畫的顯示,對資料加以可視化解釋。

  資料可視化的曆史可以追溯到二十世紀50年代計算機圖形學的早期,人們利用計算機建立出了首批圖形圖表。到了1987年,一篇題為《Visualization in Scientific Computing(科學計算之中的可視化,即‘科學可視化’)》的報告成為資料可視化領域發展的裡程碑,它強調了新的基于計算機的可視化技術方法的必要性。

  随着人類采集資料種類和數量的增長,以及計算機運算能力的提升,進階的計算機圖形學技術與方法越來越多的應用于處理和可視化這些規模龐大的資料集。二十世紀90年代初期,“資訊可視化”成為新的研究領域,旨在為許多應用領域之中對于抽象的異質性資料集的分析工作提供支援。

  目前,資料可視化是一個既包含科學可視化,又包含資訊可視化的新概念。它是可視化技術在非空間資料上新的應用,使人們不再局限于通過關系資料表來觀察和分析資料資訊,還能以更直覺的方式看到資料及資料之間的結構關系。

  2.市場調查

  IT168網站在2014年3月進行了一項有關資料可視化的調查,從中可以看出,目前已經部署資料可視化的企業僅為15%,但有56%的企業計劃1-2年内部署相關應用。從企業部署可視化的目的來看,排在前三位的分别為:通過可視化發現資料的内在價值(36%)、滿足高層上司的決策需要(30%)和滿足業務人員的分析需要(25%),僅有9%的企業選擇需要更美觀的展現效果。

分析零距離 資料可視化産品選型指南

▲資料可視化知名度、流行度和上司者調查

  在針對Tableau、Qlik、Tibco software、SAS、Microsoft、SAP、IBM和Oracle八家資料可視化産品和服務提供商的調查中,筆者分别從知名度、流行度和上司者三個角度進行分析。從知名度來看,八家廠商幾乎不分先後,隻有微小的差距;從流行度來看,SAP、IBM和SAS占據前三位,所在比例分别為19%、18%和17%;從上司者來看,Tableau以40%的優勢遙遙領先,這與2014年Gartner的魔力象限排名也非常吻合。

  3.技術趨勢

  資料可視化的思想是将資料庫中每一個資料項作為單個圖元元素,通過抽取的資料集構成資料圖像,同時将資料的各個屬性值加以組合,并以多元資料的形式通過圖表、三維等方式用以展現資料之間的關聯資訊,使使用者能從不同的次元以及不同的組合對資料庫中的資料進行觀察,進而對資料進行更深入的分析和挖掘。

  傳統的資料可視化工具僅僅将資料加以組合,通過不同的展現方式提供給使用者,用于發現資料之間的關聯資訊。近年來,随着雲和大資料時代的來臨,資料可視化産品已經不再滿足于使用傳統的資料可視化工具來對資料倉庫中的資料抽取、歸納并簡單的展現。新型的資料可視化産品必須滿足網際網路爆發的大資料需求,必須快速的收集、篩選、分析、歸納、展現決策者所需要的資訊,并根據新增的資料進行實時更新。是以,在大資料時代,資料可視化工具必須具有以下特性:

  (1)實時性:資料可視化工具必須适應大資料時代資料量的爆炸式增長需求,必須快速的收集分析資料、并對資料資訊進行實時更新;

  (2)簡單操作:資料可視化工具滿足快速開發、易于操作的特性,能滿足網際網路時代資訊多變的特點;

  (3)更豐富的展現:資料可視化工具需具有更豐富的展現方式,能充分滿足資料展現的多元度要求;

  (4)多種資料內建支援方式:資料的來源不僅僅局限于資料庫,資料可視化工具将支援團隊協作資料、資料倉庫、文本等多種方式,并能夠通過網際網路進行展現。

  4.專家觀點

  中國傳媒大學新聞學院沈浩教授:随着非結構和半結構化資料的增長,資料可視化的發展需要迎合多類型的資料,詞雲、泡泡圖、熱圖等形式的出現更加貼合新的資料類型。另外,在展現形式上,資料可視化工具還應該滿足直接釋出到雲端、移動端的需求。

  阿裡巴巴資料平台事業部資深開發工程師甯朗:資料可視化是大資料和大智慧之間的橋梁,大資料将資料變為設計師,每個人都可以利用。

  Splunk中國區進階售前工程師崔玥:資料可視化重新定義了資料分析,如同Windows重新定義了作業系統,它将資料從晦澀的代碼中脫離出來,通過簡單的圖形界面和大衆更易接受的方式,提供一個展現、監控資料的平台,讓資料分析工作更簡單。

  QlikView南北亞區售前經理張子斌:資料可視化利用人類發現複雜資料中的異常、模式、趨勢甚至相關性的天然能力,這是我們無法用資料的行和列做到的。好的資料可視化伴随有記憶體中的關聯技術、移動和社交商業探索能力,能讓使用者自由、高效地挖掘資料以找出重要規律并做出時間關鍵的決策。

作者:王玉圓

來源:IT168

原文連結:分析零距離 資料可視化産品選型指南