天天看點

社交圖譜分析:激發大資料時代新活力

社交圖譜分析:激發大資料時代新活力

社交網絡把網際網路轉化成為一個複雜的關系網,社交圖譜分析提供了一種了解這種關系的方法。facebook ceo馬克·紮克伯格最早提出社交圖譜這樣一概念,它是一種表明“我認識你”的網絡圖譜。它反映了使用者通過各種途徑認識的人:家庭成員、工作同僚、開會結識的朋友、高中同學、俱樂部成員、朋友的朋友等等。社交圖譜主要由一些主流的社交網絡産生,使用者向自己認識的人發送邀請來建構和維持他們的社會關系。

社交圖譜模型是細粒度使用者行為預測模組化強有力的推動者,因為它能夠更全面的結合群組、人際關系和影響力等語境明确潛在的個人行為。這些模型通過分析使用者的行為和互動交流,提供客戶體驗詳盡細微的觀點。

在進行社交圖譜分析時,如果你隻對少數人感興趣,分析工作會很簡單。隻需要調查他們之間的關系,或者挖掘與他們相關的行為資料即可。另一方面,如果你設法評估動态的行為模式,如地球上的每個人、每個地點、每件事之間可能的關系,加上他們可能對彼此談話的内容,動态、實時、完美的預測他們未來的行為……這些都是不現實的,隻能出現在科幻小說的幻想世界中。

世界正在逐漸意識到社交圖譜分析的潛能,在公衆、個人和研究機構擴大應用範圍。它正在迅速發展成為一個大資料市場最有前途的細分領域,并成為各種商業和開源圖形資料庫(通常是nosql)的核心應用。在很多企業中,社交圖譜分析已經在反欺詐、影響力分析、輿情監測、市場細分、參與優化、體驗優化,以及其他需要快速确定複雜行為模式的領域成功應用。

為了激發更多的潛能,社交圖譜分析産生的大資料源一觸即發。在最基本的層面上,你可以模拟社交圖譜,如節點與線路、實體與關系、個體與社會等形成的網絡圖。圖形分析專家使用”vertex”和”edge”等術語做着類似的工作。有消息稱,相關公共部門執行大規模并行圖形分析的基礎設施,包括4.4萬億節點(記錄)和70萬億的邊界(這些記錄之間的關系)。facebook自有社交圖譜分析的基礎設施能夠處理數十億節點和萬億級的邊界。

可以想象一下,網絡級圖形分析正在自發的大規模運作,存儲處理、記憶體、互連、資料中心的面積和功耗等,令其他任何大資料的部署變得相形見绌,它有以下四個方面的優勢:一是可擴充性需求實作跨越式增長;二是資料源的範圍不斷擴大;三是資料容量、多樣性、工作負載的并發性不斷增長;四是對實時性、低延遲的需求快速上升到新的高度。

圖形分析将推動大資料的規模和複雜度進化到下一個高度。hadoop是這一進化過程的重要組成部分,但它不一定是核心。将全部資料存儲的在記憶體中的大規模并行圖形資料庫架構将推動這一程序,還有nosql資料庫,它們專注于發現、關聯和預處理所有來源的行為資料。

如果你對圖形分析産生了濃厚的興趣,就需要熟悉大資料的3v特征,即容量、速度和多樣性。随着硬體成本的不斷降低和對資料計算架構的把握,在不久的将來,将有很多組織機構開始運作全球範圍的圖形分析雲,這些分析雲将在記憶體中零延遲的處理eb級的資料。

<b>原文釋出時間為:2013-08-18</b>

<b></b>

<b>本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号</b>