1、作者: 阮一峰日期: 2008年1 月 11日我一直对 slashdot.org 感兴趣,今天下午对它研究了一番。slashdot.org 创办于1997 年,是一个著名的科技新闻网站。它的稿件都是由读者投稿,编辑审核后发表。但是,真正有趣的部分却是它的读者留言。通常情况下,它的每条新闻有几百条读者留言,多的可以达到上千条,甚至几千条。留言比新闻本身提供更多的信息,许多人都是为了看留言而访问 slashdot.org。但是,熟悉互联网的人都知道,网上最多的就是垃圾留言。为了保证网站质量,必须从上千条留言中,找到最有价值的发言,将那些垃圾留言过滤掉。这就成slashdot 站长面对的最大问题。事
2、实上,现在 slashdot的留言过滤系统是世界上最强大的。我感兴趣的,就是 slashdot.org 如何做到这一点。1. 人工过滤所有留言采用人工打分的方法进行过滤。5分为最佳留言,-1分为垃圾留言。2. 匿名用户留言默认分为0分,注册用户为1分。3. 评分员(moderator)有权为每条留言打分。打分的方法采用分配形容词,所有可用的形容词分别为normal(一般发言) 、offtopic (与主题无关) 、flamebait(挑拨) 、 troll(没有价值) 、redundant(废话) 、insightful(启发性) 、interesting(有趣) 、informative(提
3、供有用信息) 、funny(搞笑) 、overrated(评价过高)和 underrated(评价过低) 。所有正面的形容词为+1分,所有负面的形容词为-1分。4. 评分员由系统从活跃的注册用户中随机抽取。每一次,系统会分配给抽中的评分员5分,每评一次就减少1分,换句话说,评分员最多只能给5条留言打分。打分的有效期为3 天,过期未使用的分数自动作废。5. 经常被打高分的留言用户,道德值(karma)会提高;经常得到低分的留言用户,道德值会下降。道德值高的用户,留言时会自动+1分;道德值低的用户,留言时默认为-1分,系统将自动将其发言过滤。6. 系统还会随机抽取注册用户,请其对评分员的评分进行二次评估,判断评分是否公正。经常被认为不公正的评分员,其道德值会下降。7. 系统默认全文显示3分及3分以上的留言, 2分的留言只显示标题。但是,用户可以自己设置显示的“门槛” (Threshold) 。8. 所有在显示门槛之上的留言,按照得分高低降序排列。得分高的留言就是最有价值的留言,会出现在最前列。=上面8 点就是 slashdot.org 留言过滤系统的基本设计。看上去非常强壮,实际效果也很好,最有价值的留言确实都显示了出来。唯一的缺点就是这个系统建立在大量用户参与的基础上,小网站没法用,不具有推广价值。(完)