about

本站是一个致力于对未名空间的帖子进行收集存档和科学分析的非盈利性站点。随着Web 2.0和SNS的兴起,用户逐渐成为了互联网的主轴,对用户行为的分析和理解也越来越受到人们的重视。未名空间作为最大的海外华人论坛之一,拥有广阔的用户群和可观的发帖量,如果能够对这些数据进行分析整理,将有助于我们更好地理解当前海外华人的生存形态和情感需求,为更深层次的社会学和人类学研究提供宝贵的数据。即便在较低的层面上,这些数据也将帮助我们互联网从业者加深对海外华人这一用户群的了解,从而有针对性地为他们设计更适合的互联网应用。

不幸的是,未名空间仍然采取古老的定期删除旧帖子的运行模式,大量的宝贵帖子因此而被永久删除,本人自己就经历过辛苦撰写的武侠小说因为未名空间的删帖而丢失的情形。因此,本站效仿Internet Archive,将这些旧帖保存下来,力图还原一个在这个中国激烈变革的时期海外华人生活和思想百态的原貌。

对未名空间的帖子进行科学研究,本站并不是第一家。2008年密歇根大学的一个学生项目就曾对当时ChinaNews, MilitarySalon三个版面的部分帖子进行了分析,并得出了有益的结论。可惜这一研究涵盖的范围太小(只有三个版面的部分帖子),分析的项目有限(随着项目的结束,未能对数据进行更深入的分析),限制了它的价值。差不多在同一时间,一个域名为zhaomaja.com的网站受到了人们的关注,其提供的查找马甲的新奇功能令人眼前一亮,可惜的是这一项目的研究方法并未公开,限制了其学术价值,而另据铜锈们普遍反映其结果的False Positive数太高,也限制了其实用价值,这个网站也在不久后十分遗憾地销声匿迹了。

本站目前具有的功能如下:

  1. 对买买提每天的新帖进行下载存档,并提供大家浏览(*)。这些数据是其它研究的基础,也是效仿Internet Archive,将买买提的历史记录下来,供后人凭吊。
  2. 基于以上数据对买买提的小圈子现象进行分析,用户可以输入任意ID来查找和他最亲近的ID。我们还会对宏观的小圈子结构进行分析并定期作出报告。
  3. 基于以上数据对买买提的马甲现象进行分析,用户可以输入任意ID来查找他的疑似马甲。
  4. 其它简单的统计数字查询,譬如可以查询各个版面每天的发帖量、任意版面在某个时间段内的水王是哪些ID、或者哪些ID最喜欢在哪些时间段发贴,等等。
  5. 针对一些震动买买提的大事,本站会对手头的数据进行相应的分析,并基于分析结果作出评论。

如果要联系本站,或提供意见和建议,可发送email至contact email

(*) 这一功能的目的在于提供查看未名空间中已被删除的旧帖,以避免发帖人劳动成果的流失,同时也可为相关科学研究提供宝贵的资料。为了保持连续性,我们也提供对新帖的预览,但是不推荐用户在本站阅读这些新帖。具体来说,对于近一周的帖子,我们只显示每贴的前50个字作为预览,用户可以点击页首的链接去未名空间阅读全贴;而对于超过一周以前的旧帖,我们则记录和显示每贴的前500个字,因为我们认为从帖子的前500字已经足够看出其大致内容,也能满足对帖子内容的各项学术分析所需。另一方面,超过500字的长贴如果是原创并有一定质量,应该会得到标记并在未名空间永久保存,若是转载则也在网上其它地方存在,两种情况下都可以截取一句话Google一下来看到其完整内容,所以也就没有必要记录了。最后,如果你认为你的帖子涉及隐私,不适合永久保存,请联系本站。

2014-06-03 12:10:10由admin编辑