開源從最初的“洪水猛獸”,已經俨然成為一個名媛,備受各大企業喜愛。近日,領英(linkedin)宣布即将開源一個企業級的資料挖掘軟體:wherehows。
領英
資料挖掘,對于很多人來說已經不再陌生。大資料的崛起,dt時代的來臨,資料挖掘對于企業來說顯得越來越重要。而領英雖然成立時間僅有14年,但是在自己的領域有着很好的口碑。
當然,資料挖掘在其中的作用不言而喻。此次開源自己内部的應用軟體wherehows,主要目标是從分布式的多種中繼資料中進行挖掘。
據悉,wherehows已經挖掘了50,000條資料集,14,000條評論和35,000,000個工作機會,多達15pb的資料。
wherehows
龐大的資料需要一個完整的資料生态鍊來完成這些資料的資産轉化,不同類型的資料用最适合的,專業的工具進行分析,制定專業的解決方案。但是,要想在不同平台、架構、系統中總覽所有資料變得非常困難。于是,為了避免做無用功浪費生産力,領英制作了自己的資料挖掘軟體wherehows。
此次開源wherehows,領英希望開源社群能夠做些貢獻,比如解決bug,增加特性之類的,但與此同時,廣大開源愛好者也可以從中學習領英的技術經驗,這種互惠互利的方式,也正是衆多企業開源自己應用的原因之一。
本文轉自d1net(轉載)