由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
WaterWorld版 - 谁在推特污染aiww标签? 如何应对?zz
相关主题
F1 status被系里suspended,ISO说要terminate SEVIS了5毛的最大悲哀在于为金钱出卖灵魂 (转载)
Google门前的一张照片,笑死了为什么在国外的更多人恨共产党?
大家教我几句英语骂人的话。奢求的英文怎么说?
伟大的党啊,我爱你!(转自北大未名) (转载)愿祖国挺过2012
骂人大全 (转载)现在的很多乱像,其实是社会进步的反映
民主国家澳大利亚:实施互联网强制过滤计划 (转载)陈光诚所在的朝阳医院外的保安,NBC选图。。。
请版主介入toughtough 的签名档图片铊铊们进来,看看对的起她吗
不明白tg为啥禁了facebook华夏快递 : 又到“六四”下雨时 (转载)
相关话题的讨论汇总
话题: 垃圾话题: 账户话题: 标签话题: aiww话题: 推特
进入WaterWorld版参与讨论
1 (共1页)
p*********w
发帖数: 23432
1
谁在推特污染aiww标签? 如何应对?zz
原文:
http://jiblog.jiruan.net/?p=2951&utm_source=feedburner&utm_medi
熟悉推特的人都知道,这是一个分布式的信息系统,人人可以自说自话,而说的话只影
响到关注自己的人(也就是Followers),或者自己所@的人。但是若要超出这个范围,
便需要使用关键词搜索功能。一般人们习惯把#放在需要标识的关键词之前(也可以不
放),把特定的信息聚集起来。这种方式非常有效,但是也有一个致命的弱点,就是容
易受到污染。也就是有些恶意的人(或者叫垃圾信息账户-Spammer)能将毫不相关或
者虚假的信息加上标签发布到推特上,使得其他查看此标签的人得不到有效的信息。
下面就#aiww这个标签做一个简单的分析。首先看一下典型两个垃圾信息账户。
账户1 @lidamink:
lidamink-top-spammer-on-tagoaiww
账户2 @eiuielk:
eiuielk-top-spammer-on-tagoaiww.png
其特征是发布一些虚假的或者不相关的信息,并且同时污染其它标签如 #cnjasmine。
而且它们的关注者都非常少。
wumao-analysis-on-tagoaiww
上图(点击看大图)是用一个网络分析器搜集到的从4月26日到5月2日标签为#aiww的
8000个推的统计信息。其中上面提到的两位发的推占据了排行榜的第一和第二的位置,
分别是22.51%和22.43%。也就是10句推里面就有4.5句是这两位发送的。
如果你搜一下aiww,得到的结果大致就是这样(这里7条推里面只有2条不是恶意的,其
中上面两位占据了4条):
search-aiww2
这就是这些垃圾信息发布者所要得到的效果。那么有没有对策呢?有。有些推友已经制
作了列表把这些垃圾账户搜集起来,例如,最上面提到的账户2就被如下6个列表所收录:
wumao-list-top-spammer-on-tagoaiww.png
之所以称这些账户是五毛,大概是因为如果没有来自政府的金钱利益,很少人愿意干这
种肮脏而且被人骂的活儿。
我特意把排在前10位的账户检查了一下,发现结果如下:
@lidamink 发帖22.51%
@eiuielk 发帖22.43%
@ideletey 发帖6.20%
@jchang_22079 发帖5.8%
@xiazuhu 发帖3.38%
@andingzirua 发帖3.27% 已被取消帐号(Suspended)
@lalivea 发帖3.09%
@liunianzhijian 发帖2.87% 已被取消帐号(Suspended)
@nizhexin 发帖2.85% 已被取消帐号(Suspended)
@bichunlong 发帖2.66% 已被取消帐号(Suspended)
让人惊讶的是,这10个都是垃圾发送者,总共加起来占据了信息的75.06%(也就是8000
个推里面6005个是由这十位垃圾发的。它们其中4个已经被取消帐号(占推数11.65%)
。被取消帐号的原因估计是推特管理员接到很多人举报,把这些账户确定为垃圾信息发
送者,按照推特的规则取消帐号(因为推特显然也不希望有太多的垃圾账户来干扰正常
使用者,并增加服务器的负担)。如果你试图访问这些被取消账户的时候就出现如下图
片:
Screen shot 2011-05-03 at 12.14.28 AM
那如何举报呢?非常简单,只需要到该账户的页面,点击右侧的齿轮图标,然后选第三
个选项Report xxx for spam。
Report xxx for spam
由上面的分析可以看出,推友们已经成功地把一些垃圾信息发布者赶出了推特,但是一
些大的仍旧继续在作恶。对大多数人来说,这些垃圾发布者是不会影响他们的,但是对
于有些著名的网友就会被@回复的方式骚扰,下面就是一个使用这种策略的垃圾。你能
看到它发一些毫不相干的推给@gaodongmei, @lihlii等人。
垃圾发送者 @型
有人可能会说,五毛也有发言的自由,这点我非常同意。但是当五毛们用恶意的手段来
干扰你获取信息自由的时候,你就可以用手中的权利来Report Spam。
特此我制作了上面提到的前10个垃圾中还未被取消帐号的列表:
http://twitter.com/#!/ruanji/top-spammers-tag-aiww
请使用你手中的权利消除这些垃圾。举手之劳,造福推友。
除此之外,大家也可以考虑用新的标签来聚集相关内容。比如,在使用#aiww的同时,
也使用#aiwwnew,这样人们就可以使用这个新的标签#aiwwnew得到相对不受干扰的结果。
p*********w
发帖数: 23432
2
ruanji 吉软糖
推友们太给力了,污染aiww标签最厉害的两个账户(@lidamink 和 @eiuielk )已经被
取消账户了。感谢你们。
1 hour ago

【在 p*********w 的大作中提到】
: 谁在推特污染aiww标签? 如何应对?zz
: 原文:
: http://jiblog.jiruan.net/?p=2951&utm_source=feedburner&utm_medi
: 熟悉推特的人都知道,这是一个分布式的信息系统,人人可以自说自话,而说的话只影
: 响到关注自己的人(也就是Followers),或者自己所@的人。但是若要超出这个范围,
: 便需要使用关键词搜索功能。一般人们习惯把#放在需要标识的关键词之前(也可以不
: 放),把特定的信息聚集起来。这种方式非常有效,但是也有一个致命的弱点,就是容
: 易受到污染。也就是有些恶意的人(或者叫垃圾信息账户-Spammer)能将毫不相关或
: 者虚假的信息加上标签发布到推特上,使得其他查看此标签的人得不到有效的信息。
: 下面就#aiww这个标签做一个简单的分析。首先看一下典型两个垃圾信息账户。

1 (共1页)
进入WaterWorld版参与讨论
相关主题
华夏快递 : 又到“六四”下雨时 (转载)骂人大全 (转载)
南京大爆炸,中国媒体集体失声 (转载)民主国家澳大利亚:实施互联网强制过滤计划 (转载)
复旦山西籍博士生父亲被拆迁人员活活打死(转载)请版主介入toughtough 的签名档图片
西方诸多媒体恶意报道我上海河蟹盛宴zz不明白tg为啥禁了facebook
F1 status被系里suspended,ISO说要terminate SEVIS了5毛的最大悲哀在于为金钱出卖灵魂 (转载)
Google门前的一张照片,笑死了为什么在国外的更多人恨共产党?
大家教我几句英语骂人的话。奢求的英文怎么说?
伟大的党啊,我爱你!(转自北大未名) (转载)愿祖国挺过2012
相关话题的讨论汇总
话题: 垃圾话题: 账户话题: 标签话题: aiww话题: 推特