开源从最初的“洪水猛兽”,已经俨然成为一个名媛,备受各大企业喜爱。近日,领英(linkedin)宣布即将开源一个企业级的数据挖掘软件:wherehows。
领英
数据挖掘,对于很多人来说已经不再陌生。大数据的崛起,dt时代的来临,数据挖掘对于企业来说显得越来越重要。而领英虽然成立时间仅有14年,但是在自己的领域有着很好的口碑。
当然,数据挖掘在其中的作用不言而喻。此次开源自己内部的应用软件wherehows,主要目标是从分布式的多种元数据中进行挖掘。
据悉,wherehows已经挖掘了50,000条数据集,14,000条评论和35,000,000个工作机会,多达15pb的数据。
wherehows
庞大的数据需要一个完整的数据生态链来完成这些数据的资产转化,不同类型的数据用最适合的,专业的工具进行分析,制定专业的解决方案。但是,要想在不同平台、框架、系统中总览所有数据变得非常困难。于是,为了避免做无用功浪费生产力,领英制作了自己的数据挖掘软件wherehows。
此次开源wherehows,领英希望开源社区能够做些贡献,比如解决bug,增加特性之类的,但与此同时,广大开源爱好者也可以从中学习领英的技术经验,这种互惠互利的方式,也正是众多企业开源自己应用的原因之一。
本文转自d1net(转载)