天天看點

搜尋引擎反作弊

作弊的本質是:在網頁排名信号中,加入噪音,反作弊的關鍵是,去除噪音。

早期作弊方法:重複關鍵詞,賣連結。

針對商業相關的搜尋,采用一套 抗幹擾 強的搜尋算法。

對外連結向量間餘弦距離幾乎為1(賣連結)。

作弊網站需要互相連結,形成一個Clique,網際網路大圖中有一些Clique,用圖論知識解決。

具體:http://blog.csdn.net/malefactor/article/details/7389311

繼續閱讀