标签:Spam

Web Spam研究方向发展问题

今年关于Web Spam的Workshop已经停开了,这是不是意味这Web Spam这个方向没有研究的余地了呢?答案是否定的。根据对最新数据集ClueWeb09 Dataset的 研究,对于一些热门查询的前10结果,大部分页面(尤其是英文页面)是作弊页面 [1]。这说明现在作弊还是非常流行的,对信息检索造成了严重的后果。这也从某个侧面说明,我们现在的反作弊……

Web Spam相关实验室与学者与实验室

学者 Juan Martinez RomoAU YEUNG Ching-man, AlbertBaoning WuBin ZhouDavid F. GleichCraig MacdonaldBeate KrauseGordon V. CormackGeorgia KoutrikaHongbo DengJames CaverleeJi……

[Reading Notes] 2010 ICISTM Can Your Judge a Man by His Friends?-Enhancing Spammer Detection on the Twitter Microblogging Platform Using Friends and Followers

方法 这篇文章利用机器学习与社交网络信任传播相结合的方法来检测微博中的作弊者。该方法分为两步:第一步,首先利用用户的基础属性(和该用户相关的一些 特征)构建一个基学习器(分类器),然后利用该基学习器以及人工标记的一些训练集来预测其他的用户的类别(作弊与非作弊);第二步,首先利用第一步中得到 的结果,结合用户社交网络的信任传播模型得到一个用户的扩展属性集,……