由买买提看人间百态

topics

全部话题 - 话题: 聚类
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)

发帖数: 1
1
来自主题: DataSciences版 - 聚类问题请教
遇到一个聚类的问题,一直没有好的处理方法
原始数据是300个词的定义,我用LDA从定义中抽出关键词然后用word-net算出了pair
similarity.因此形成了一个300*300的similarity matrix.
我的设想是measure出词之间的distance,然后将他们聚类。
但我的理解是,这是一个高维空间,如果map到二维,距离就不能反应真实的语义差别。
请问各位
1) distance如何measure?
2)是否需要降维,还是就直接聚类。用何种算法?DBSCAN 或者Spectral Clustering
是否可以应用在这里?
3)聚类完了之后如何evaluate 聚类效果?
过去没有弄过这方面的数据,对聚类的理解也比较初级,希望各位指点一下。
k***t
发帖数: 276
2
来自主题: JobHunting版 - 最大 0/1 聚类子矩阵最优解
此题有无标准最优解? O(MN)??
有一个 m x n 的矩阵,元素为 0 或 1。一个子矩阵,如果它所有的元素都是 0, 或
者都是 1,则称其为一个 0-聚类 或 1-聚类,统称聚类(Cluster)。请找出最大的聚类
(元素最多的聚类)。
s*********d
发帖数: 19
3
来自主题: CS版 - 求助关于聚类问题
比如100个点,我想平均分成4类(每类都是25个点),每个类内都是按照最小距离(或
者其他准则)生成,有没有通用的算法?最好能有现成的code在网上
一般都是用K-means,但是不能保证聚类每类的个数都相等,想找个每个类都相等的(
所以需要的算法肯定不是最优聚类)
s*********d
发帖数: 19
4
来自主题: Computation版 - 求助关于聚类问题
比如100个点,我想平均分成4类(每类都是25个点),每个类内都是按照最小距离(或
者其他准则)生成,有没有通用的算法?最好能有现成的code在网上
一般都是用K-means,但是不能保证聚类每类的个数都相等,想找个每个类都相等的(
所以需要的算法肯定不是最优聚类)
j*****h
发帖数: 62
5
来自主题: CS版 - 请教一个聚类的问题
假如我现在有n个bit string. (每个string由m个非0即1的bit组成)。任意两个
bit string之间的距离定义为他们xor以后结果的bit string中出现1的次数。
多个bit string可以通过bit or操作聚成一个bit string cluster.请问如何
设计一个算法,给定n个这样的bit string,以及给定k个cluster数目限制,
找到最优的聚类,使得所有的n个bit string到他们各自的聚类以后,对应的
bit string cluster的距离之和最小。
我想到用bottom up的用贪婪算法heuristic。初始的时候,每个bit string代表一个
cluster. 然后每一步迭代,找出距离最近的两个cluster,or成一个新的
cluster,这样cluster数目减少一个。迭代直到cluster 总数等于k结束。
可是数学上我不知道如何证明这个算法得到的是否是最优解,如果不是,这
个approximation离最优解有多大差距。
s*********d
发帖数: 19
6
来自主题: CS版 - 求助关于聚类问题
你的意见没有错
但是我现在的实际问题需要把点数等分(不管数据聚类的最优结果是不是等分)
或者我想做的事是:
在均分数据的前提下,能符合最小距离聚类准测

pdist
t****a
发帖数: 1212
7
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图
板上的各位最近好像对程序设计语言的讨论很多,那么可能会对这张图感兴趣。
从wiki抓来的,简单做了一下聚类。
d*****u
发帖数: 17243
8
来自主题: CS版 - 有无这种聚类的算法?
你知道有几个区域吗?
如果不知道,就是普通的聚类分析啊,matlab和R这些软件都直接有命令的
还可以指定各种distance metrics
如果知道有几个区域,可以用k-means等等
q***s
发帖数: 2243
9
来自主题: CS版 - 有无这种聚类的算法?
汇报一下,最后我用的QuadTree来实现的。
我的要求很简单,一个平面上,分布了很多点,用QuadTree来把不要的空间去掉,然后
就是聚类了。
谢谢各位!
s*****n
发帖数: 134
10
来自主题: CS版 - 求助关于聚类问题
Kmeans 是很适合你要求的算法,Matlab的统计工具包里也有现成的函数。这里是注解
和用法 http://www.mathworks.com/help/toolbox/stats/kmeans.html
另外也可以参考Hierarchical Clustering, http://www.mathworks.com/help/toolbox/stats/bq_679x-3.html
聚类的原则可以是欧式距离,也可以是1-correlation 之类不同的metric, 函数pdist
可以很方便的算出不同Metric下一组数据点两两之间的距离。
平均分类虽然表面上看起来很工整,但事实上并不一定有很好的实际意义和根据。如果
你用上面两个模型做出来的结果不同的cluster之间元素数目差距很大,也就说明原来
的数据分布并不太平均,不是吗?
q***s
发帖数: 2243
11
来自主题: Programming版 - 有无这种聚类的算法? (转载)
【 以下文字转载自 CS 讨论区 】
发信人: qlnus (dd), 信区: CS
标 题: 有无这种聚类的算法?
发信站: BBS 未名空间站 (Wed Oct 27 04:28:18 2010, 美东)
不知道所说的名字对不对?
具体要求是:在平面上分布了很多点,这些点并非随即分布的,而是聚集在某几个区域
,有没有这种算法,来计算出这些点的区域的位置,比如坐标和区域的半径。
多谢各位!
q***s
发帖数: 2243
12
来自主题: Programming版 - 有无这种聚类的算法? (转载)
汇报一下,最后我用的QuadTree来实现的。
我的要求很简单,一个平面上,分布了很多点,用QuadTree来把不要的空间去掉,然后
就是聚类了。
谢谢各位!
d****h
发帖数: 4291
13
做完genotyping,要画个聚类树
求推荐一个软件
本人比较肉,还有以前不是做这个的
最好容易上手那种,免费的
多谢
e*******o
发帖数: 4654
14
来自主题: Biology版 - 区间聚类
把区间的首尾当x y 聚类可行?
l*******s
发帖数: 1258
15
来自主题: DataSciences版 - 聚类问题请教
首先没搞清你的目标到底是啥?
如果是就把这300个词聚类,那么不难,啥LSA LDA都可以,或者考虑下neutral
network language model,都有现成的实现。
至于evaluation,是个问题,目前要么靠目测,要么算不同k值下每个cluster从
centroid到各个点的距离之和,plot出来,看看拐点在哪,那个k值一般就是最好的。
或者你要是有label的数据,那就用类似classification的方法验证。

发帖数: 1
16
加入【加拿大移民/签证DIY指导群】,加拿大移民局法定移民顾问 世景Sir 在线答疑
,帮你解决:
各类移民留学DIY、移民局补料对策、白本签证申请、拒签再申方案、移民局内部调档
、申请状态查询等等遇到的问题!
加群主微信:visa787,即可进群~
上一篇我们详细介绍了加拿大的移民途径分类《史上最全移民加拿大攻略(一):移民法
框架下的移民途径分类》,让我们对加拿大的移民方式有一个初步的认识和了解,接下
来我们会一一详细讲解各个途径的移民项目。
世景Sir是在加拿大生活18年的老移民,作为加拿大持牌移民法律顾问,具有移民局法
定资质代理移民留学及各类签证申请,擅长根据申请人条件背景制订高成功率申请方案
,准确把脉加拿大移民政策法规变动。
世景Sir就通过下面这篇长文,从加拿大移民法所搭建的移民框架角度,将这些令人头
晕目眩的加拿大移民政策项目信息归一下类,希望可以帮到有意移民加拿大的朋友早日
找到适合自己努力方向的攻略。
史上最全移民加拿大攻略(一):移民法框架下的移民途径分类
史上最全移民加拿大攻略(二):家庭团聚类移民
史上最全移民加拿大攻略(三):技术移民EE快速通道
史上最全... 阅读全帖
i***s
发帖数: 39120
17
新闻源:@太蔟:一位朋友的女儿学文科的,高考分报人大可选个好专业,报北大只能选个差专业。这姑娘不知怎么着了魔,一定要上北大,在家人朋友的苦苦劝说下,最终还是选了报北大历史系。一个文科傻妞就此诞生。天作孽,犹可恕;自作孽,不可活。
记者 陈伟斌 整理报道 现在正是广大高考学子填高考志愿的时节,这条微博的出现引发网友们批评、质疑、谴责甚至谩骂,网友“太蔟”不得不限制评论。@太蔟的实名认证信息为哈尔滨工业大学教授、科普作家。
“我认为历史应该是一门观察并且研究社会运动规律的科学,大有可为。”网友“代谢聚类谨”在看到“太蔟”的微博后如是表态,这也是几乎所有“挺文派”网友的观点,且“挺文派”在参与评论的网友中占据了大多数。他们觉得,并非说学理科就一定会好,学文科就是“傻妞”,一般都需要看学生的个人爱好与人生选择。“太蔟”的态度,只能说他有“专业歧视”。“学了不热门专业就成了自作孽,您这说法有待商榷。”
至于网友“细雨润石”留言表示:“语言类适合女孩子,理性认识世界,也可以用‘农村包围城市’的途径达到嘛”时,“太蔟”的回应更引发了诸多网友的不满:“是很适合,所以才有文科傻妞的说法。娶了文傻会很痛苦... 阅读全帖
d*****u
发帖数: 17243
18
来自主题: CS版 - 求助关于聚类问题
可以用hierarchcial agglomerative clustering
在第二层就是四类,每个类个体数相同
(每个层深度可能不同,深度代表距离)
p*****2
发帖数: 21240
19
来自主题: JobHunting版 - 程序设计语言启发以及聚类分析图

memoize是什么意思呀?你发现有哪些递归不能转成尾递归呢?
iterate函数指的是foreach这类的吗?
h***x
发帖数: 586
20
来自主题: Statistics版 - 问一个聚类分析
晕,啥都往model上靠,这类问题有dependent variable吗?
x*****u
发帖数: 3419
21
来自主题: Poetry版 - 类 书z
类 书 (转载)
将历史文献上的各种资料分类汇集在一起的的文献,称之为“类书”。因此,类书
具有“资料汇编”的性质。
类书辑录的资料,一般不是单门或专题性质的,而是囊括自然界和人类社会的一切知识
的,所谓“区分胪列,靡所不载”(《玉海》李桓序语),“凡六合之内,巨细毕举”
(陈梦雷《上诚亲王汇编启》语),所以,十分接近于现代的百科全书。现代的百科全
书的每一词目,总是编写成文,而不是专门有关原材料的汇集。
一、 类书在目录学中的地位
虽然类书的内容是“经、史、子”集所不能涵盖的,但习惯上总
是把这类文献放到“子部”中。例如:张之洞《书目答问》将类书置于子部,在“类书
”做注云“类书实非子,从旧例列于此。”也有将类书置于“杂家”的,如:《隋书经
籍志》“杂家”包括“诸子之属”、“杂家之不名一体者”、“类事之属”、“释家之
属”。虽未明确标明这些属名,但从书籍排列的次序上看,界限非常清楚。
类书在子部中独立成类,始于唐开元时毋煚(jiǒng)《古今书录》(已佚)。但五代
刘眗《唐书经籍志》里,丙部子录有十七家,其第十五家为“类事家”。从此,类书脱
出杂家而单独成类。
此后... 阅读全帖
m***r
发帖数: 359
22
来自主题: DataSciences版 - 大数据日报 2015年2月楼
大数据日报 2015-02-07
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-02-07/short.html
1) 【OpenStack架构设计指南】 by @勤奋的适兕
关键词:云服务, OpenStack
《OpenStack架构设计指南》官方已经发布预览,还有6%的内容尚待翻译,不过不耽误
大家的阅读。希望大家多多批评指正,也希望更多的人参与到review环节。 @陈沙克 @
OpenStack中国社区 @ben_杜玉杰 [1]
[1] http://docs.openstack.org/zh_CN/arch-design/
2) 【AerospikeDB与Redis性能比较】 by @Linuxeden开源社区
关键词:数据库, NoSQL
【AerospikeDB与Redis性能比较】 原标题:AerospikeDB与Redis性能比较:在AWS上的
N... 阅读全帖
b*****l
发帖数: 3821
23
来自主题: Wisdom版 - 阿弥陀佛和他的极乐世界 ZZ
阿弥陀佛和他的极乐世界
陈义孝居士著
一、极乐世界的有无问题
在我们还未针对问题作出分析之前,要请您且先看看,一些关于佛教与科学十分巧合的
数据如下:
●古人普遍认为天是圆的,地是方的;佛却说地不是方的,而是圆的,叫做‘地轮’。
此事后来科学发达了,测知地的确是圆的,叫做‘地球’。
●《华严经》和《梵网经》等记载,华藏世界,如云似海,重重无尽。
近代世界著名的数学家和物理学家爱因斯坦,以数理证明宇宙是四度空间的连续体,认
为宇宙是膨胀的,而且是极其宏大乃至无穷无尽的!他引用‘相对论’来说明质量与能
量所表现的一个静的宇宙和一个动的宇宙,两者间的错综组合,形成了变化莫测的宇宙
。这与佛教所说的重重无尽的宇宙观,相当接近。
●佛教说,百亿须弥,百亿日月,构成一个三千大千世界,那只是一佛之化土而已。
所谓‘三千大千世界’,即一千个太阳系为一小千世界,一千个小千世界为一中千世界
,一千个中千世界为一大千世界。现代的天文学家已探测到在银河系中,有著本身发光
如同太阳的恒星近十亿个,依理推测应有三百亿个之多。并在太阳系的空间,还有数不
尽、算不清的星云星系,而且每一个星球都有一或两个卫星月球。这与... 阅读全帖
f*******a
发帖数: 663
24
来自主题: DataSciences版 - Science上新clustering算法的分析测试
原帖见
http://www.mitbbs.com/article_t/DataSciences/6761.html
一点分析心得,与大家共享,以期抛砖引玉。
感谢zhaoce的总结一文让我看到这篇文章;也非常感谢f0008朋友在我始终无法下载附
件的情况下把附件发给了我。
===========================================================================
聚类算法能利用的一般是局部特性,如邻域点距离、基于核函数的密度估计。Mean-
shift算法就是一个非常经典的算法,以梯度方法迭代至局部密度峰值点。
这个算法的思路其实与Mean-shift很类似,虽然作者要在文章中反复说和Mean-shift不
一样,但本质上非常相近。MS以梯度寻找峰值点,而这个算法则是直接在点群中搜索峰
值点。这样做是基于一个近似假设:峰值点和点群中的某点距离不远。举个极端的例子
:只有一类,20个点均匀分布在一个圆上。MS算法可以准确聚到圆心,只要核大小足够
。而这个算法,只能聚在这20个点中的某个点上。这个假设在一般情况下可以接受,也
能... 阅读全帖
t******n
发帖数: 2939
25
☆─────────────────────────────────────☆
weatherman (weatherman) 于 (Wed Jun 19 10:31:41 2013, 美东) 提到:
发信人: weatherman (weatherman), 信区: Military
标 题: 不得不说山东人是中国人外在形象上最拿的出手的
发信站: BBS 未名空间站 (Wed Jun 19 09:43:33 2013, 美东)
先不说演艺圈的巩俐,青霞,冰冰,以及前国母蓝萍,现国母丽媛.就连老陈一个没念过书
的农民,盲人,往那儿一站也是气宇不凡,上电影演个大佬不用化妆的.
相比之下,南方人,尤其是江浙闽粤一带的人,实在就太萎缩了,不是女里女气,就是象个
黑瘦猴.
☆─────────────────────────────────────☆
mdmx (没大没小) 于 (Wed Jun 19 10:33:32 2013, 美东) 提到:
北方人有杂交优势

☆─────────────────────────────────────☆
anw (道法自然... 阅读全帖
m**x
发帖数: 8454
26
汉族南北两地的血缘的差异在宋代已经形成,其分布规律与现代的分布规律基本一致。
袁义达说,他们对不同时期的各省姓氏分布的数据进行生物遗传距离的分析,获得了宋
朝、明朝和当代的汉族人群的三张聚类图,从“宋朝姓氏分布的地域亲缘关系聚类图”
可以看出,汉族从宋朝开始已经形成了南北二大区域:南部的广东和福建与北部的其余
14个省。“明朝姓氏分布的地域亲缘关系聚类图”也非常清楚地把明朝中国人分为南北
两大人群,形成福建、广东和广西三省为南方人群,其他14省为北方人群的局面。而且
明朝的人群地理分布特征已与当代的分布基本一致,其南北两大异源汉族的地域分界线
也应在武夷山和南岭一带,而不是在长江。与宋朝的地域人群分布相比较,广西已与湖
南分离而与广东、福建聚类。
“当代姓氏分布的地域亲缘关系聚类图”反映了当代中国汉族的南北两大人群的异源性
,以及明显的分界地域在南部的武夷山和南岭一带。29个省区市分为南北两大块,而且
其遗传距离很大。南方汉族包括福建、台湾、广东、广西、海南省、香港和澳门。
总之,宋、明、今三个时期的姓氏遗传距离分析结果表明,在中国1000年前的宋朝已经
形成了南北两大区域的人群,从姓... 阅读全帖
d******a
发帖数: 32122
27
来自主题: Military版 - 玉林狗肉节花样百出:烹制活狗

玉林汉族的主体可能是苗瑶
“平话人群分为四支,即桂北、桂南、五岭和玉林人群。“
“从平话人Y 染色体单倍型的分布特点可以看出在父系遗传方面,平话人在遗传结构上
保留了一定的汉族血统,但大部分已经被南方少数民族所取代。”
”从遗传结
构上看,平话人群并非汉族移民的后裔,而是被汉族同化了的广西原住民族。”
平话人群是骆越人的后裔
平话汉族(Plebeian Han)是汉族的一个古老支系族群,人口总数在300-400万之间,主
要分布在广西,另外靠近广西的湘南、云南和粤西北等地也有部分散居。平话人的形成
历史甚至比客家人、粤语人群、闽语人群还早。在文化上,平话汉族既保留了典型的汉
族语言和文化特征,同时又具有当地少数民族的语言文化特色,包括语音、服饰和饮食
习惯。平话人群分为四支,即桂北、桂南、五岭和玉林人群。平话在各地的名称不一,
如南宁市郊区、邕宁、临桂称平话,阳朔叫平声,右江一带叫蔗园话,融安、融水称土
拐话,贵港、横县叫土白话,平乐叫土话,横县叫村话,左江一带叫客话(不同于客家
话),永福叫百姓话等等[5]。
1. Y染色体单倍群分型
平话汉族Y 单倍群的主要类型是O2a*, O3... 阅读全帖
M*******g
发帖数: 41
28
来自主题: Statistics版 - 还是run SVM的问题
建议你用Jordan 他们的办法。
http://www.cs.berkeley.edu/~jordan/fasp.html
先用kmeans()聚类压缩数据,比如得到1000个类簇;
然后在前一步kmeans()得到的1000个类簇中心上运行SVM;
最后属于同一个类簇的所有点得到相同的label,也就是各
个类簇中心的label。
我前一段时间有一个很大的数据,50多万个点,20个特征,
需要运行谱聚类(spectral clustering),结果他们的算法
五分多钟就算完了。虽然他们的算法是聚类问题,
你是分类问题但是原理应该差不多。
c***s
发帖数: 70028
29
王菲与那英早前现身某时尚秀场(资料图)
羊年春节将至,央视春晚正在紧张筹备,各卫视春晚也在火热录制中,明星阵容陆续曝光。
据华商报记者了解,湖南卫视依旧会打出自家艺人牌撑场面;辽宁卫视则打出了重聚王菲那英两“天后”的必胜牌。至于卫视常客“赵家班”,今年春晚会不会露脸的消息相当神秘。
辽宁卫视:赵本山不上徒弟上
多年来,“赵家班”都占据了辽视春晚的大半壁江山,辽宁卫视甚至被网友戏称为“本山台”。不过今年有消息传出,赵家班将集体缺席辽视羊年春晚。辽视春晚将在1月28日录制,语言类节目的明星阵容包括久未露面的相声大师杨振华;曲艺大家单田芳、刘兰芳、田连元;也有春晚常青树潘长江、巩汉林、冯巩、郭冬临;还有开心麻花团队以及新晋相声新秀嘻哈包袱铺 等。但其中并未见赵本山的名字。加之辽宁卫视《本山选谁上春晚》改版更名为《组团上春晚》,评委也由赵本山变为潘长江、巩汉林的一系列举动,被业界认为是赵家班淡出辽视春晚的证据。但有网友爆料,包括小沈阳、宋小宝、程野在内的多位赵家班成员均现身2015年辽视春晚录制现场,传闻也不攻自破。
除语言类节目长项之外,今年辽宁卫视在歌舞节目方面也将发力,有消息称,辽视今年... 阅读全帖
w*********g
发帖数: 30882
30

東亞人的基因組成
轉載自http://tieba.baidu.com/p/1642727650
走了不少论坛,发现大部分人对于人种的认识还停留在20世纪80年代以前。长期以来,
西方的带有强烈种族主义色彩的传统体质人类学一直主导着人类学的研究,直到分子人
类学的出现,彻底地颠覆了人类原先对于种族的认识。
分子人类学的基础是,所有的现代人都是起源于非洲智人,也就是一般所说的「非洲起
源说」。与其相对的是「多地区起源说」,主要坚持的是一些中国的古人类学家。由于
意识形态的原因,国人长期被官方宣传为中国人起源于本土,也就是从元谋人—众长江
古猿—蓝田人—北京猿人—山顶洞人一路进化而来。而在国际上,非洲起源说早已成为
主流学说。现代人的非洲起源说不仅在遗传学上,而且在化石证据上比「多地区起源说
」更加雄辩和具有说服力。
远古时代的古人类具有许多不同的人种,比较著名的有欧洲的尼安德特人,东南亚的爪
哇人,东亚大陆的北京猿人,以及非洲的现代智人。按照非洲起源说,现代人来自于非
洲智人。而其他古人种后来相继灭绝,并且没有任何证据显示和现代人发生过混血。非
洲智人大约形成于15万年前,大约10万年前... 阅读全帖
v*******e
发帖数: 1715
31
来自主题: Thoughts版 - Re: 什么中国文化?
嘿嘿,每当我看到...的核心是...,我第一反应是:这个问题,是可以核心化的么?
从事物角度,当事情复杂到一定程度,一个核心往往什么用也没有.
而事物复杂化的一个原因是多样化和多点生长.
如果说的更数学点, 如果两类,外延基本都是一圆,你可以用两个圆的圆心(核心)说明
两类的区别. 但如果两类乃是GAUSSIAN分布,恐怕核心概念就弱了,你得至少加上VARIANCE,
才能说明两类的界限和区别. 而当两类是任意分布(可以用MULTIPLE GAUSSIAN逼近),
要说明白两类区别,光提出两类的平均值,更无价值,而必须针对多个聚类(情景)分别考察.
文化,东西方,这两类,恐怕都太太太大了吧....想用一个核心的概念给人任何有价值的
理解...我都对此表示怀疑.
我虽然反对核心的概念,但我不反对局部(个别聚类)的比较,比如在立人立功(以及起应用
范围)上比较. 但千万别以为那是什么核心--或存在什么核心.
如OVERLAP看过的什么"结构",到可能全面点吧--至少方法论上,结构比核心好.
...我这是在胡扯什么啊.
w*********g
发帖数: 30882
32
以上谈的是父系,还需要说明一下母系,这很关键。相比于父系基因,母系遗传基因的
种类要丰富得多。这是因为在男子和父系霸权下,作为个人,成功的男人可以占有多个
女人,失败的男人甚至可能留不下后代。作为民族或部落同样如此,失败民族和部落很
可能会灭族,他们的父系基因会很少保留下来甚至完全消失。而对于女人情况则不同,
作为战利品和男人的附属物,女人一般不会象男人那样受到种族灭绝,而是会被胜利的
异族男人所占有。在这种状况下,形成了东亚民族独特的父系母系双起源的现象。北方
汉族的母系60%甚至更高比例是古亚洲人的M系,而南方汉族普遍比北方汉族要低,有些
低于一半。有些人觉得南方人比北方人相对长地更接近欧洲人,就是这个道理。对于日
本,大概70%是古亚洲人。韩国略低于日本。满族高达80%。蒙古族有的只有一半强。东
南亚人各地不大一样,有的高一些,有的比东亚低很多。东亚人的新亚洲人主成分主要
是N系下的R系下的B,F等。至于印第安人,各地差异巨大。北美部分地方有少数至多数
的M系成分,有的地方欧亚成分很纯。南美普遍是M系成分较高,和东亚情况差不多。
以上说的是Y染色体和mtDNA的情况。当然,决定体... 阅读全帖
w*********g
发帖数: 30882
33
以上谈的是父系,还需要说明一下母系,这很关键。相比于父系基因,母系遗传基因的
种类要丰富得多。这是因为在男子和父系霸权下,作为个人,成功的男人可以占有多个
女人,失败的男人甚至可能留不下后代。作为民族或部落同样如此,失败民族和部落很
可能会灭族,他们的父系基因会很少保留下来甚至完全消失。而对于女人情况则不同,
作为战利品和男人的附属物,女人一般不会象男人那样受到种族灭绝,而是会被胜利的
异族男人所占有。在这种状况下,形成了东亚民族独特的父系母系双起源的现象。北方
汉族的母系60%甚至更高比例是古亚洲人的M系,而南方汉族普遍比北方汉族要低,有些
低于一半。有些人觉得南方人比北方人相对长地更接近欧洲人,就是这个道理。对于日
本,大概70%是古亚洲人。韩国略低于日本。满族高达80%。蒙古族有的只有一半强。东
南亚人各地不大一样,有的高一些,有的比东亚低很多。东亚人的新亚洲人主成分主要
是N系下的R系下的B,F等。至于印第安人,各地差异巨大。北美部分地方有少数至多数
的M系成分,有的地方欧亚成分很纯。南美普遍是M系成分较高,和东亚情况差不多。
以上说的是Y染色体和mtDNA的情况。当然,决定体... 阅读全帖
w*********g
发帖数: 30882
34
以上谈的是父系,还需要说明一下母系,这很关键。相比于父系基因,母系遗传基因的
种类要丰富得多。这是因为在男子和父系霸权下,作为个人,成功的男人可以占有多个
女人,失败的男人甚至可能留不下后代。作为民族或部落同样如此,失败民族和部落很
可能会灭族,他们的父系基因会很少保留下来甚至完全消失。而对于女人情况则不同,
作为战利品和男人的附属物,女人一般不会象男人那样受到种族灭绝,而是会被胜利的
异族男人所占有。在这种状况下,形成了东亚民族独特的父系母系双起源的现象。北方
汉族的母系60%甚至更高比例是古亚洲人的M系,而南方汉族普遍比北方汉族要低,有些
低于一半。有些人觉得南方人比北方人相对长地更接近欧洲人,就是这个道理。对于日
本,大概70%是古亚洲人。韩国略低于日本。满族高达80%。蒙古族有的只有一半强。东
南亚人各地不大一样,有的高一些,有的比东亚低很多。东亚人的新亚洲人主成分主要
是N系下的R系下的B,F等。至于印第安人,各地差异巨大。北美部分地方有少数至多数
的M系成分,有的地方欧亚成分很纯。南美普遍是M系成分较高,和东亚情况差不多。
以上说的是Y染色体和mtDNA的情况。当然,决定体... 阅读全帖
t*********u
发帖数: 26311
35
您好,这里是聚美优品”,一个客服人员正在用甜美的声音在处理着聚美优品顾客的投
诉,电话那头的顾客对自己刚刚购买的Burberry手表提出了质疑,客服人员并未过多询
问,就引导用户进行了退货处理。
但这里并不是北京东二环中汇广场的聚美优品总部,或是某个客服中心——河北三河市
的燕郊镇的一所普通居民楼里的民宅。在工商部门的注册信息上,这家公司叫做祎鹏恒
业商贸有限公司(以下简称为祎鹏恒业),是聚美优品的供货商之一。
民宅不大,在客服的隔壁房间,几个美工正在过时的台式机上努力地处理着Armani(阿
玛尼)时装的实拍图片,稍后这些精修过的图片将出现在京东商城的某个活动上。这家
公司的另一个身份也是京东全球购的供货商。
祎鹏恒业的库房在燕郊开发新区内,这个刚刚租下的近千平米库房内存货不多。一辆快
递车停在库房门口,几个工人懒散地卸下了来自中国各省的纸箱,在仓库库员粗暴地撕
开纸箱后,露出来的廉价塑料袋里随意塞满了各类可疑的奢饰品服装。
在祎鹏恒业的官方语境下,这些都是海外供货商采购的正品,通过正规渠道进入中国市
场,但纸箱上的快递单说明他们来自湖北武汉,当然,根据货品不同,有些箱子的发货
地也... 阅读全帖
t*********u
发帖数: 26311
36
【 以下文字转载自 ebiz 讨论区 】
发信人: tingtingliu (Grand Cherokee Overland), 信区: ebiz
标 题: 暗访电商假货链条:聚美等平台涉嫌知假售假
发信站: BBS 未名空间站 (Mon Jul 28 16:55:17 2014, 美东)
您好,这里是聚美优品”,一个客服人员正在用甜美的声音在处理着聚美优品顾客的投
诉,电话那头的顾客对自己刚刚购买的Burberry手表提出了质疑,客服人员并未过多询
问,就引导用户进行了退货处理。
但这里并不是北京东二环中汇广场的聚美优品总部,或是某个客服中心——河北三河市
的燕郊镇的一所普通居民楼里的民宅。在工商部门的注册信息上,这家公司叫做祎鹏恒
业商贸有限公司(以下简称为祎鹏恒业),是聚美优品的供货商之一。
民宅不大,在客服的隔壁房间,几个美工正在过时的台式机上努力地处理着Armani(阿
玛尼)时装的实拍图片,稍后这些精修过的图片将出现在京东商城的某个活动上。这家
公司的另一个身份也是京东全球购的供货商。
祎鹏恒业的库房在燕郊开发新区内,这个刚刚租下的近千平米库房内存货不多。一辆快
递车停在... 阅读全帖
W*******s
发帖数: 18705
37
这些人还左一个聚类部右一个聚类部,分裂鱼版不遗余力,貌似清高,实乃低俗得不能
再低俗了。既然有聚类部,那就别盯着这里了,来的再久再长,这地皮也是老邢的。
l*****e
发帖数: 416
38
来自主题: ChineseClassics版 - 聊斋两篇:野狗与笑之以鼻
赞自说自话 :)
这种聚类树枝图我过去的文章里也弄过,然而一来专业相去甚远,二来也是委托别人做
的,我自己还是没怎么动手。不过有一点是可以肯定的,聚类之前,首先要分出一个个
的个体,这个个体的定义无疑是主观界定的。故此,台湾族群(未必是全是闽南啊,也
有客家,外省,等等)不可能同chinese整体完全聚类在一起,作图之前就已经定义为
不同个体了。
m***r
发帖数: 359
39
来自主题: DataSciences版 - 机器学习日报 2015年3月楼
机器学习日报 2015-03-07
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-07/short.html
1) 【52nlp上HMM相关文章索引】 by @52nlp
关键词:算法, HMM
HMM系列文章是52nlp上访问量较高的一批文章,这里做个索引,方便大家参考。 [1] [
2]
[1] http://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ==&mid=203765668&idx=1&sn=e0899d1267bf728b2a4b2de1869e0d06#rd
[2] http://www.52nlp.cn/hmm%E7%9B%B8%E5%85%B3%E6%96%87%E7%AB%A0%E7%B4%A2%E5%BC%95
2) 【TKDE: Tweet分割和在NER上的应用】 by @AixinSG
关键词:... 阅读全帖
m***r
发帖数: 359
40
来自主题: DataSciences版 - 机器学习日报 2015年3月楼
机器学习日报 2015-03-07
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-03-07/short.html
1) 【52nlp上HMM相关文章索引】 by @52nlp
关键词:算法, HMM
HMM系列文章是52nlp上访问量较高的一批文章,这里做个索引,方便大家参考。 [1] [
2]
[1] http://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ==&mid=203765668&idx=1&sn=e0899d1267bf728b2a4b2de1869e0d06#rd
[2] http://www.52nlp.cn/hmm%E7%9B%B8%E5%85%B3%E6%96%87%E7%AB%A0%E7%B4%A2%E5%BC%95
2) 【TKDE: Tweet分割和在NER上的应用】 by @AixinSG
关键词:... 阅读全帖
p*********w
发帖数: 23432
41
来自主题: ChinaNews版 - 玩聚网的消失zz
玩聚网的消失zz
from www.chinese.rfi.fr
图片/Reuters
作者 上海特约记者 曹国星
郑昀再一次在《行政执法通知书》上签下名字, 按上手印, 离开谈话室。他想再不应该
到这里来了——北京市广渠门内白桥大街22号,北京市(政府)新闻办公室, 是网站管
理的几个核心部门之一。签名之后, 郑昀自2006年创办的玩聚网就这样被关闭了。
最新一期的《第一财经周刊》以一篇《保证书的世界》描述了玩聚网从创办、发展、到
因被“执法”,而被短暂关闭,最终关闭的过程。报道说,“网络世界里到处都是保证
书,因为这里到处都是错误。”
报道从某个角度描述了,在中国大国里,言论警察们是如何扼杀技术创新的,而为何这
个拥有近5亿网民的互联网,却需要用GFW这段电子长城将网络严密地封闭。
玩聚网创建于2006年,它主要追踪IT业界人士使用的各种社会化媒体分享源,如微博客
、阅读器分享、网摘收藏等,综合分享推荐的次数、推荐者权重和信息源类型等多种因
素,自动聚合然后推荐。
该网站2008年推出了玩聚SR(SNS搜索引擎),很快在IT圈内获得一批用户。按照郑昀
的想法,这个网站将在“自动发现... 阅读全帖
g****t
发帖数: 31659
42
来自主题: Military版 - 玩聚网的消失zz
【 以下文字转载自 Returnee 讨论区 】
发信人: powershadow (鲍鱼○英语好好玩), 信区: Returnee
标 题: 玩聚网的消失zz
发信站: BBS 未名空间站 (Tue Nov 30 20:46:53 2010, 美东)
玩聚网的消失zz
from www.chinese.rfi.fr
图片/Reuters
作者 上海特约记者 曹国星
郑昀再一次在《行政执法通知书》上签下名字, 按上手印, 离开谈话室。他想再不应该
到这里来了——北京市广渠门内白桥大街22号,北京市(政府)新闻办公室, 是网站管
理的几个核心部门之一。签名之后, 郑昀自2006年创办的玩聚网就这样被关闭了。
最新一期的《第一财经周刊》以一篇《保证书的世界》描述了玩聚网从创办、发展、到
因被“执法”,而被短暂关闭,最终关闭的过程。报道说,“网络世界里到处都是保证
书,因为这里到处都是错误。”
报道从某个角度描述了,在中国大国里,言论警察们是如何扼杀技术创新的,而为何这
个拥有近5亿网民的互联网,却需要用GFW这段电子长城将网络严密地封闭。
玩聚网创建于2006年,它主要追踪IT业界人士使... 阅读全帖
W*******a
发帖数: 1769
43
来自主题: Military版 - 南方系推出凯迪猫眼云情报系统

控制操纵舆论更上一层楼
从“我爸是李刚”到“烟草局长日记”再到最近的“郭美美炫富”,网络热点事件的
不断涌现,在引起各方关注讨论的同时,也让与事件相关的政府部门和企业开始意识到
,对网络舆情进行及时全面的了解掌握,并具体做出合适的反应已成为“危机公关”中
的重要组成部分。
今日,由南方报业入股的凯迪网络推出“猫眼舆情监测系统”V1.0版,并正式投入
运行。这一系统是凯迪网络在试水“网络热点事件调查”、“公共事件舆情研判”后,
再次推出的包括全网舆情预警、情报分析、市场调查、策略咨询等系列产品在内的舆情
数据服务,它也标志着南方报业传媒集团在数据加工和数据分析领域的又一创新。
“重点探索网络言论价值产业化。”这是南方报业传媒集团管委会主任、南方日报
社社长杨兴锋在去年5月正式宣布南方报业入股凯迪网络时,为她指出的定位和方向。
凯迪:涉足舆情数据产品水到渠成
在凯迪推出“猫眼云情报信息中心”这一服务之前,市场上的网络舆情服务机构大
致可分为四类:第一类是由软件公司和传统的市场调查公司演变而来,如拓尔思、方正
、邦富等,以技术见长,擅于抓取网络舆情数据;第二类是依托主流媒体,如人民... 阅读全帖
p*********w
发帖数: 23432
44
来自主题: Returnee版 - 玩聚网的消失zz
玩聚网的消失zz
from www.chinese.rfi.fr
图片/Reuters
作者 上海特约记者 曹国星
郑昀再一次在《行政执法通知书》上签下名字, 按上手印, 离开谈话室。他想再不应该
到这里来了——北京市广渠门内白桥大街22号,北京市(政府)新闻办公室, 是网站管
理的几个核心部门之一。签名之后, 郑昀自2006年创办的玩聚网就这样被关闭了。
最新一期的《第一财经周刊》以一篇《保证书的世界》描述了玩聚网从创办、发展、到
因被“执法”,而被短暂关闭,最终关闭的过程。报道说,“网络世界里到处都是保证
书,因为这里到处都是错误。”
报道从某个角度描述了,在中国大国里,言论警察们是如何扼杀技术创新的,而为何这
个拥有近5亿网民的互联网,却需要用GFW这段电子长城将网络严密地封闭。
玩聚网创建于2006年,它主要追踪IT业界人士使用的各种社会化媒体分享源,如微博客
、阅读器分享、网摘收藏等,综合分享推荐的次数、推荐者权重和信息源类型等多种因
素,自动聚合然后推荐。
该网站2008年推出了玩聚SR(SNS搜索引擎),很快在IT圈内获得一批用户。按照郑昀
的想法,这个网站将在“自动发现... 阅读全帖
C****1
发帖数: 63
45
“双十一”网购狂欢节,商家绞尽脑汁出奇招引客,买家磨拳擦掌拼网速抢货,这就是
一场全民网上盛会。衣食住行,你所能想到的,都作为商品放在了双十一的货品架上。
“科技改变生活”,直到今天这句话才让人有了深刻的理解。
如今,我们的日常生活已经不离开互联网,互联网已经影响改变着我们的日常生活
方式。那么,这种改变究竟有多大?这种联系究竟有多密不可分?
下面一组数据可以说明。
马云更应该感谢男人?!男人才是潜力股
1
中国网购消费者中,男性占55%、女性占45%
大数据揭秘:双十一你将如何“剁手”?
“中国网购消费者中,男性占55%、女性占45%”。在第17届中国杭州西湖国际博览
会重点项目——2015中国(杭州)国际电子商务博览会上,全球著名市场调查公司尼尔
森公布的这项数据让不少人大跌眼镜。这与人们印象中“女性更爱网购”的普遍印象形
成反差,男性网购消费者的占比高于女性10个百分点!
Are you kidding? 网购不是女人的专利吗? (╯ ̄Д ̄)╯
连马云都说过阿里的成功离不开女人。他说,“阿里巴巴70%的买家是女性、55%的
卖家是女性,这是我们主要的资源。所以我要感谢女性,没有你... 阅读全帖
p*********w
发帖数: 23432
46
来自主题: Joke版 - 玩聚网的消失zz
玩聚网的消失zz
from www.chinese.rfi.fr
图片/Reuters
作者 上海特约记者 曹国星
郑昀再一次在《行政执法通知书》上签下名字, 按上手印, 离开谈话室。他想再不应该
到这里来了——北京市广渠门内白桥大街22号,北京市(政府)新闻办公室, 是网站管
理的几个核心部门之一。签名之后, 郑昀自2006年创办的玩聚网就这样被关闭了。
最新一期的《第一财经周刊》以一篇《保证书的世界》描述了玩聚网从创办、发展、到
因被“执法”,而被短暂关闭,最终关闭的过程。报道说,“网络世界里到处都是保证
书,因为这里到处都是错误。”
报道从某个角度描述了,在中国大国里,言论警察们是如何扼杀技术创新的,而为何这
个拥有近5亿网民的互联网,却需要用GFW这段电子长城将网络严密地封闭。
玩聚网创建于2006年,它主要追踪IT业界人士使用的各种社会化媒体分享源,如微博客
、阅读器分享、网摘收藏等,综合分享推荐的次数、推荐者权重和信息源类型等多种因
素,自动聚合然后推荐。
该网站2008年推出了玩聚SR(SNS搜索引擎),很快在IT圈内获得一批用户。按照郑昀
的想法,这个网站将在“自动发现... 阅读全帖
a********6
发帖数: 76
47
来自主题: ebiz版 - 我来分析一下聚美优品
转个贴,就是上面提到的被删除的答案,大牛们给分析分析:
http://finance.jrj.com.cn/consumer/2014/05/21135617257866.shtml
涉及大量数据,匿了。虽然我说的根本不是market rumor,而是fact。
既然你关心正品,我默认你关心的是一线和二线品牌,如雅诗兰黛、伊丽莎白雅顿
、兰蔻、欧莱雅、欧珀莱等,所以我就不说那些三四线品牌了(佰草集、相宜本草等等
)。
如果按照一二线化妆品品牌销售的定义来说,所有非官方认证渠道销售的化妆品,
都是“假货”。即,只要渠道假就是假。如果以此为定义,所有垂直化妆品电商渠道(
包括聚美、乐峰),95%以上是假货。其中,一线化妆品全部都是假货(一线化妆品指
:国际大牌,百度指数上2,000,正常销售渠道常常破千的)。
为什么?因为这些国际大牌为了维持自己的价格策略和品牌形象,绝对不会把货拉
到聚美这种折扣平台上去卖的,妈的动不动砍我30%的价,你玩我呢?有些稍微低档一
些的一线品牌(如SK-II)去天猫开旗舰店,更多是从品牌宣传角度考虑的,那上面的
价格也不便宜。
(解释个没说清楚的地方,上面说了... 阅读全帖
s**********e
发帖数: 2888
48
来自主题: ChinaNews版 - 关于罗永浩和方舟子之我见
近日,罗永浩为了证明我是“骗子”、“人渣”、“伪君子”、“精神病”、“心理残
疾”、“人格扭曲”、“双重标准”、“选择性打假”,以一个没有受过任何学术训练
的高二退学生的身份,在微博上不停地指控我妻子“学历造假”、“硕士论文剽窃”,
要我表态。所谓我妻子没有上过大学、靠给高官当保姆上的研究生的“学历造假”,不
过是曾被我揭露剽窃的深圳大学传播学院副教授孙海峰等人捏造、传播的谣言。而所谓
“硕士论文剽窃”,我在4月份已在微博、博客和新语丝网站上多次说明、表态过,我
妻子也写过一篇文章做过解释,不再多说。
2006年罗永浩曾给我不参与管理的“打假基金”捐过1千元钱,罗永浩从此认为我
应该对其感恩戴德,不应该批他骂他,否则就是“人品有问题”。在同一年罗永浩为了
拉我去牛博网开博客,请我吃过一顿饭,饭钱不详,应不超过1千元,罗永浩以此嘲笑
我吃饭从来不付钱。请罗永浩留下汇款地址,我将把这两笔钱及利息合3千元给他。
我曾经说过回国时曾多次受骗,其中受的最大欺骗之一是听信了一位流氓的理性主
义谎言:受罗永浩邀请到刚开张的牛博网给他拉人气,到被他冲冠一怒为红颜踢走时已
带去350万点击率(远远超过其... 阅读全帖
g*********r
发帖数: 9366
49
☆─────────────────────────────────────☆
theboymy (御厨) 于 (Sun Jan 1 21:47:43 2012, 美东) 提到:
首先,我真心不是方黑。最开始还是很景仰方舟子的。但是关注了方舟子和罗永浩最近
的口水战,我不由得不相对更支持罗永浩一些。
首先,刘菊花女士抄了就是抄了,网上有人已经发了和原文的对照,不仅仅是有些段落
文字一字不差,甚至连小标题都是照搬。方舟子先生可以不站出来“大义灭亲”,如果
他保持沉默大家也不会说他什么,大家都能看出来是因为他为了老婆;或者他可以表示
不去研究老婆的论文,声明不发表意见,大家也不会说什么。但是,请注意但是,方舟
子先生先是站出来说老婆没抄,继而摆出一付“黑社会嘴脸”,威胁别人,这个就实在
是说不过去了。
更何况,罗永浩(以后打“老罗”吧,省事)开始是问“对事实真相有洁癖”的方舟子
(省去先生,省事)为什么打假双重标准,没人针对刘菊花。方舟子从始至终都没有回
答这个问题,而是反复表示谁打(假)他老婆,他就报复谁。
这个报复真是无所不用其极啊,一会“打比方”说别人老婆出墙,一会说人家... 阅读全帖
p********l
发帖数: 2032
50
来自主题: GreatPit版 - 『爆料』各版的版聚
各版的版聚爆料:
http://www.mitbbs.com/mitbbs_search_result.php?cx=partner-pub-9
发信人: cwh (妇女主任), 信区: WashingtonDC
标 题: 版聚花絮
发信站: BBS 未名空间站 (Sun Apr 29 18:03:49 2012, 美东)
1. BEIJING MM让许多人惊艳啦。 BEIJING MM是DC 版的版花,大家要保护好BEIJING
MM。
2. 忘带刀啦,也不知版友们如何切西瓜,蜜瓜
3. DC版的美妈只肯与ZHIWEI握手,ZHIWEI握着美妈的小手不放。
4. 大使馆鉴证处的LD,也是DC版的版友,亲切出席,大家有任何鉴证问题都有DC版的版
友回答.
5. 今天看见好几个菜,本来想着回头再拿的,结果一转眼就没了,速度啊.
6. 今天的羊肉串真是大亮点
7. 忘啦唱DC版的版歌啦
发信人: Dreamer (不要问我从哪里来), 信区: Dreamer
标 题: 这两个月参加了纽约版一些人在facebook上发的版聚
发信站: BBS 未名空间站 (Sun Apr 1 19:2... 阅读全帖
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)