天天看点

搜索引擎反作弊

作弊的本质是:在网页排名信号中,加入噪音,反作弊的关键是,去除噪音。

早期作弊方法:重复关键词,卖链接。

针对商业相关的搜索,采用一套 抗干扰 强的搜索算法。

出链向量间余弦距离几乎为1(卖链接)。

作弊网站需要相互链接,形成一个Clique,互联网大图中有一些Clique,用图论知识解决。

具体:http://blog.csdn.net/malefactor/article/details/7389311

继续阅读