天天看点

Social Media排序算法的四种模式

在social media领域,不管是搜索结果,还是页面展示,只要不是编辑挑选的,只要是机器智能决定的,都需要以某种顺序排列。

那么,除了按时间顺序或按投票数排列外,还会有哪些有效的展示模式呢?

下面罗列我所见:

模式一、reddit模式

文章的新鲜程度;

支持票数和反对票数;

discoverers和followers效应(削减followers的投票权重)。

Social Media排序算法的四种模式

从上图可以看出,让新鲜且投票数还不足够多的文章能快速突破进入榜单,是很重要的。

模式二、oneriot pulserank模式

pulserank 所考虑的因素:

新鲜程度 freshness ;

域名的权威程度 domain authority :这个不同team会有不同看法,到底是传统门户的域名权重更大,还是独立博客的域名更有价值。

推荐者的权重 people authority :系统要能识别推荐者是否是spammer,要能发现某些推荐者总是推荐同一个链接或者同一个域名下的链接(你总是日复一日地推荐某一个站的链接,应该降低你的权重),也要能发现某些人的推荐总能得到更大范围的“二次传播”。

传播加速度 acceleration :主要检测推荐的速率,从而区分新出现的页面和广为人知的热门页面。

当然它还考虑来自twitter、digg以及oneriot share的推荐数量。

推荐越多,排在pulse搜索结果最前面的可能性越大;新鲜程度也影响非常大,其他因素的影响比较难以被注意到。所以这还是 reddit模式的增强版,只不过聚合了不同social站点的推荐数,并加了几个因子。

参考资源:

模式三、digg模式

1、投票的速度:比如一篇文章最开始的半小时内能迅速收集到40~50个投票,那么是谁投的就无关紧要,这篇文章就会上首页。

3、评论的数量,以及评分的数量。如果一篇文章有40个评论,其中20个对它评级在-4分以下,那么显然这篇文章不会上首页。

4、bury的数量。还会考虑到bury的类型,如重复的故事、spam、错误的分类等。如果一篇文章在upcoming队列中,获得了3个bury,那么它就永远被buried了。如果文章是在首页并且拥有1000个diggs,那么需要大约10~15个bury才能让它消失(消失指只能访问最终页面,任何类别的导航页都不会看到这篇文章了)。

5、投票用户的 popular ratio。如果10~15个popular ratio在70%以上的用户都投了一篇文章,那么它上首页会很容易。你可以 digg用户页面上查到每个用户的popular ratio。

digg 的算法久经考验,不断被修正,并且充分利用了它所能收集的一切信息,值得借鉴。

用户的声望;

用户好友的声望;

评论;

域名权重;

浏览数和停留时间。

参考来源:

模式四、seeds模式

它所用到的两个技巧倒是经常看到:

遍历 friendship :spammers或水平不那么高的用户,要想从 seeds 这里获得连接显然是不大可能的。

其他参考文章:

还推荐您阅读我的以下文章:

继续阅读