天天看点

《数据科学家修炼之道》一2.4 要点

本节书摘来异步社区《数据科学家修炼之道》一书中的第2章,第2.4节,作者: 【美】zacharias voulgaris(弗格里斯)译者: 吴文磊 , 田原 责编: 陈冀康,更多章节内容可以访问云栖社区“异步社区”公众号查看。

数据科学的历史比人们通常想象得要悠久,然而,直到上一个10年(2000~2010年)才得以落地。

drew conway在2010年9月创作的著名的韦恩图,有效地总结了数据科学的本质。

数据科学带来了许多新规则,它们改变了我们传统处理数据的方式,主要有如下几个。

mapreduce。

hadoop分布式文件系统(hdfs)。

高级文本分析。

大规模数据编程语言(如pig、r、ecl等等)。

替代性数据库结构(如hbase、cassandra、mongodb等等)。

数据科学的规则转变了我们处理数据的手段,而这对我们的生活产生了巨大的影响。正如它带来对处理大数据有至关重要价值的新思维一样。

数据科学的提升带来的新思维,同样带来了数据科学家的职业生活和他与人相处的新变化。