點選檢視原網頁,下面寫的是個人總結
1.複雜網絡與圖
複雜網絡與圖是同一種事物,由節點和連邊構成。圖是數學領域的研究内容,“圖論”的算法是普适性的,側重于理論。複雜網絡側重于工程,是将“圖論”的理論帶入到現實的生活生産中,結合圖算法理論、應用場景以及科學技術等方面能力,幫助觀察和了解真實的客觀世界。
2. 複雜性
哲學思想還原論認為萬事萬物都有更基本的元素構成,通過研究更基本的元素可以了解複雜的整體,這個思想已經取得了許多成果,比較突出的有基因工程等。
不過,有時從簡單的元素入手卻不能了解複雜的整體,比如一隻螞蟻與蟻群的行為,說明現實世界系統具有“複雜性”,而複雜性背後是網絡關聯。
具有自組織、自相似、吸引子、小世界、無标度中部分或全部性質的網絡稱為複雜網絡。(錢學森)
複雜網絡主要有以下幾個特點:
第1,結構複雜,不用解釋太多,自然界就是複雜的,抽象出來的網絡也是複雜的。
第2,網絡進化,世界在發展,代表它的網絡也是在變化,網絡中會不斷地産生新的節點,也會産生新的關系,同樣,也會在消失着一些節點和關系。今天我們是朋友,明天你們和他們也會成為朋友。
第3,連接配接多樣,連接配接邊不是隻代表一種類别的關系,隻要能代表事物和事物之間關系的都可以描述成邊,隻要是屬于我們所要研究範疇的。你和她是朋友關系,也可能還存在着同僚關系。
第4,動力學複雜性,它代表一種動态的特性,事物之間的影響是可以傳播的,一個事物發生了改變,可能會影響與它有關聯的其它事物的改變,并将這種改變傳播出去,把這種傳播變成可計算化,正是動力學所要研究的方向。
第5,多重複雜性結合,正是多種事物互相關聯和互相影響,展現出它的變化複雜性和未知性,未來發展趨勢,并非一個簡單的線性公式所能解釋的。
第6,節點的多樣性,和連接配接多樣性一樣,網絡中的節點可以代表任何事物,隻要是屬于我們所要研究的範疇。
3. 實作技術
資料結構:矩陣結構與關系型資料庫結構,矩陣結構效率更高(NoSQL資料庫),關系型結構資訊更完善。Neo4j圖查詢資料庫,适合中小規模的圖。
大資料:分布式存儲與分布式處理。為實作分布式需切分網絡,常用切分有三種:
按點切,切度值大的節點;
按邊切,切弱連接配接;
随機切,結構不明顯的網絡可用,不太實用。
可行方案:基于Hadoop+Spark技術,把算法轉換為分布式計算,在叢集上運作。
大規模圖查詢展現:InfiniteGraph、OrientDB、InfoGrid和HypergraphDB等
4. 應用
社團檢測:潛在客戶挖掘、關聯群體風險分析等;
網絡中心性分析:網頁排名(PageRank),供應鍊核心企業識别,資訊傳播樞紐節點識别等;
網絡傳播預測:流行病傳播,金融風險傳播,輿論傳播;
網絡關系滲透:節點之間的關系(三度影響);
關聯交易分析及投融資黑洞:虛假交易,擔保圈分析等。