由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
USANews版 - 总统辩论谁赢了?-方舟子统计学雄文
相关主题
随鸡抽样CNN/ORC: Trump National Poll 49
Florida Poll,希拉里领先5 pointHow Donald Trump could win -- CNN
CNN/ORC最新民调:川普亚利桑那 +5,北卡-1CNN's Poll from 521 persons - Hillary wins !?
川普演說:69%讚Hillary won the final debate 52% to 39% (CNN / ORC poll)
CNN民调:75%美民众认为情况差 高过94及06年TRUMP的一些有争议的话,看来对于女性选民没怎么失分
未脫稿暴走 川普國會演說「總算有總統樣子」最新民调:川普、克林顿在南卡大幅度领先
CNN是不是转向了?怎么天天发文说希拉里坏话现实生活里,还真的没听到川普的支持者的声音
CNN Iowa poll, Trump大幅领先2016被做了手脚的民意调查(亲身经历)
相关话题的讨论汇总
话题: cnn话题: 样本话题: 结果话题: 调查话题: 误差
进入USANews版参与讨论
1 (共1页)
k**k
发帖数: 214
1
http://fangzhouzi.baijia.baidu.com/article/645903
方舟子 10月04日 09:43
今年是美国大选年,将在11月8日投票选出新一届总统。按惯例两个主要政党的总统候
选人要举行三场辩论。今年的第一场辩论在9月26日举行之后,几乎所有美国媒体请的
裁判、评论员都一致认为民主党候选人希拉里大胜共和党候选人川普。但是辩论的胜负
判断本来就是很主观的,即使媒体一致认为希拉里获胜也不会让川粉(川普的狂热支持
者)接受,因为他们本来就认为美国主流媒体基本上都是自由派,都是支持希拉里的。
举行辩论的主要目的是要影响选民,那么,我们可以给胜负定一个客观标准,那就是认
为哪一方获胜的选民人数比较多,这一方就获胜了。第一场辩论刚刚结束,CNN就立即
报道了他们通过一家民意调查机构ORC对521名选民做民意调查的结果,62%认为希拉里
赢,27%认为川普赢,据此可以说希拉里大获全胜。
但是网上有很多对这次辩论结果的投票,有的票数几十万、几百万,都是一面倒地认为
川普赢。川普就因此宣布自己赢了,说除了“没人看的CNN”,所有的“民意调查结果
”都是他赢得了辩论,并嘲笑说CNN只对300人(其实是500多人)的调查怎么能算数呢
。川粉也坚信网上投票结果,跟着川普嘲笑CNN的民意调查人数太少,甚至有一家一直
力挺川普的微信公众号还抱怨人们想去CNN网站投票找不到门,大骂CNN。
其实那种网民自己去投的网上投票的结果才是完全不可信的,即使有几百万、几千万票
数,也不可信。首先是网上投票很容易作弊,一个人可以反复地投,也就是刷票。有的
网站为了避免刷票,限定一个IP只能投一次票,但是通过代理服务器是可以随便换IP的
,这种限制难不倒懂点网络技术的人,何况还有现成的刷票软件可以自动换IP刷票,想
刷多少票都可以。有一个关于支持谁当总统的网络投票有高达一千七百万次投票,95%
是支持川普,谁会傻到去相信这样的投票结果没有作弊?即使投票的网民都很诚实,不
作弊,网上投票结果也不可靠。支持者会到处拉票,比的是哪方支持者更狂热更爱拉票
。川普支持者往往比希拉里支持者狂热、偏执,川普支持者就被发现在某些论坛拉票,
列出了各个投票网站的链接号召川普支持者去投票。再退一步说,即使某个网站的网络
投票没人作弊也没人拉票,其投票结果也只是反映该网站读者的意见,而不能反映全体
选民的民意,因为一个网站的读者往往是有倾向性的,例如美国有一个著名的极右网站
Breitbart是一直支持川普的(其主编是川普竞选团队的CEO),该网站的读者就基本上
是支持川普的,投票的结果当然是大部分人(约75%)认为川普获胜,其实我们应该惊
讶的是其读者中居然还有25%认为希拉里获胜。
所以网上投票说难听点是垃圾,说好听点是好玩,不能当真。想要知道民意,就要做民
意调查。民意调查要由组织者通过打电话、发邮件等方式主动找人询问(以打电话为主
,但是现在很多人都不接陌生电话了,所以也有网上调查,但是是通过发邮件邀请的方
式,不是网民自己找上门),这样就可避免调查对象重复投票、拉票、倾向性等问题。
如果要调查的人群很小,挨个挨个去问就可以了。例如对“你认为总统辩论谁赢了”这
问题,你想统计一个班的学生的看法,让每个学生依次回答就可以了。但是如果你想了
解全校学生的看法,假定一个学校有三万名学生,一个个去问显然是不现实的,即使能
做到,工作量也太大了。在这种情况下就可以采取随机抽样的方式,只找一部分人做调
查。如果找的人数太少,没有代表性,结果容易出现偏差;但是如果找的人数太多,则
是浪费。那么找多少人合适呢?或者说,需要多大的样本呢?
样本的大小和几个因素有关。一个因素是置信度,它表示的是你对调查结果的信心。因
为不是对所有的人做调查,置信度不可能是百分之百,但是如果调查了足够多的人数,
你就会对调查结果的可靠性很有信心。一般取置信度95%,意思是有95%的几率是这个结
果。另一个因素是抽样误差,据此可以知道调查结果的正负变化范围(所谓置信区间)
。可接受的误差越大,需要的样本就越小,反之,可接受的误差越小,需要的样本就越
大。民意调查可接受的误差通常是2%~5%。“你认为总统辩论谁赢了”是个比率问题(
支持希拉里和支持川普之比),在调查前我们是不知道比率的,这时候可以设置为50%
,因为在比率为50%时需要的样本最大。知道了人群总数(总体)、置信度、误差和比
率这些参数之后,统计学上就有公式可以计算需要的样本大小。网上有现成的民意调查
计算器(例如http://www.surveysystem.com/sscalc.htm ),把这些参数输进去,就可以算出样本大小。假定总体有3万人,置信度95%,误差5%,算得样本大小为379。也就是说,你要知道3万名学生对“你认为总统辩论谁赢了”这个问题的看法,随机抽样379人做调查就够了,调查结果有95%的可能是成立的,有5%的误差——假如调查结果是50%的人认为希拉里赢,意思是如果重复调查20次,有19次的结果是45%~55%的人认为希拉里赢。
如果我们想要知道一个30万人的城市对这个问题的民意呢?其他参数不变,把总体改成
30万,算得的样本大小是384,只需要多调查5个人。如果要调查的是全美国人口呢?美
国人口大约是3亿人,算得的样本大小还是384。在总体足够大以后(几万人以上),需
要的样本大小基本不变了,调查全国和调查一个城市需要的样本大小其实是一样的,这
虽然违反直觉,但是事实就是如此。
所以,要对全美国做民意调查,随机抽查300人也是可以的,川普、川粉的嘲笑只不过
暴露了他们对统计学的无知。不过,抽查300人的误差有些大,全国性民意调查的误差
一般控制在3%左右,因此需要的样本大小通常是1000人左右。CNN/ORC调查了521人,误
差是4.5%,误差稍大,但是因为调查的结果比率悬殊(62%:27%),这个误差并不会改
变希拉里大胜的结论。CNN/ORC调查采用的是简单随机抽样的方式,这样抽得的随机样
本不一定能很好地符合人群分布特征,例如其中认同民主党的人数偏高。所以有时候为
了获得能代表人群分布的样本,会采取分层抽样的方式,先根据人群特征设定各个群体
的比例,然后再在各个群体随机抽样。
因为是抽样调查,即使精心地设计,也不能保证每次调查结果就一定可靠。但是如果有
别的调查机构也做了类似调查,那就可以相互验证。如果各个调查的结果都一致,就说
明非常可靠。CNN是第一个公布总统辩论的民意调查结果的,随后其他民意调查也都得
到了类似的结果:NBC News的结果52%:21%,ppp的结果51%:40%,YouGov的结果49%:22%
,Politico的结果49%:26%,Echelon Insights的结果48%:22%,路透社的结果:48%:23
%,福克斯的结果61%:21%,Post-ABC的结果53%:18%。所有的调查结果都认为希拉里赢
了,而且除了ppp的调查,都认为希拉里大获全胜,认为希拉里赢的选民人数是认为川
普赢的选民人数的2~3倍。不知为何川普、川普支持者只顾着骂最先出头的CNN,而无
视其他的调查结果?特别是保守派电视台福克斯一直是支持川普、获得川普的信任的,
其民意调查结果比分比CNN还悬殊,认为希拉里赢的人数是认为川普赢的人数的3倍,川
普、川粉怎么不去骂福克斯?
当然,再多的民意调查结果也不会让川普承认自己输了,他本来就是极度自恋的人,从
不认输也从不认错。而川粉对川普是一种类似邪教的追随,川普认为自己赢了,他们也
就只能跟着喊他赢了,然后认为所有的民意调查结果都是不可靠的,都是被民主党收买
的,只有他们刷出来的网上投票才能代表民意。
2016.10.3
t******g
发帖数: 238
2
呵呵,按照川粉的德性,第一选择是无视这篇文章(到目前为止是这样),第二选择是
开始攻击老方的人品。

【在 k**k 的大作中提到】
: http://fangzhouzi.baijia.baidu.com/article/645903
: 方舟子 10月04日 09:43
: 今年是美国大选年,将在11月8日投票选出新一届总统。按惯例两个主要政党的总统候
: 选人要举行三场辩论。今年的第一场辩论在9月26日举行之后,几乎所有美国媒体请的
: 裁判、评论员都一致认为民主党候选人希拉里大胜共和党候选人川普。但是辩论的胜负
: 判断本来就是很主观的,即使媒体一致认为希拉里获胜也不会让川粉(川普的狂热支持
: 者)接受,因为他们本来就认为美国主流媒体基本上都是自由派,都是支持希拉里的。
: 举行辩论的主要目的是要影响选民,那么,我们可以给胜负定一个客观标准,那就是认
: 为哪一方获胜的选民人数比较多,这一方就获胜了。第一场辩论刚刚结束,CNN就立即
: 报道了他们通过一家民意调查机构ORC对521名选民做民意调查的结果,62%认为希拉里

l****e
发帖数: 609
3
估计有人读不懂

【在 k**k 的大作中提到】
: http://fangzhouzi.baijia.baidu.com/article/645903
: 方舟子 10月04日 09:43
: 今年是美国大选年,将在11月8日投票选出新一届总统。按惯例两个主要政党的总统候
: 选人要举行三场辩论。今年的第一场辩论在9月26日举行之后,几乎所有美国媒体请的
: 裁判、评论员都一致认为民主党候选人希拉里大胜共和党候选人川普。但是辩论的胜负
: 判断本来就是很主观的,即使媒体一致认为希拉里获胜也不会让川粉(川普的狂热支持
: 者)接受,因为他们本来就认为美国主流媒体基本上都是自由派,都是支持希拉里的。
: 举行辩论的主要目的是要影响选民,那么,我们可以给胜负定一个客观标准,那就是认
: 为哪一方获胜的选民人数比较多,这一方就获胜了。第一场辩论刚刚结束,CNN就立即
: 报道了他们通过一家民意调查机构ORC对521名选民做民意调查的结果,62%认为希拉里

n**********n
发帖数: 984
4
"他本来就是极度自恋的人,从不认输也从不认错。"
t******g
发帖数: 238
5
结果更欢乐,川粉另开一贴,执行第二选择去了。

【在 t******g 的大作中提到】
: 呵呵,按照川粉的德性,第一选择是无视这篇文章(到目前为止是这样),第二选择是
: 开始攻击老方的人品。

A***g
发帖数: 1816
6
CNN的投票也是网上投的,在同一篇文章里自扇
y***z
发帖数: 136
7
没用了,床粉中国城刷盘子,管你统计学

【在 k**k 的大作中提到】
: http://fangzhouzi.baijia.baidu.com/article/645903
: 方舟子 10月04日 09:43
: 今年是美国大选年,将在11月8日投票选出新一届总统。按惯例两个主要政党的总统候
: 选人要举行三场辩论。今年的第一场辩论在9月26日举行之后,几乎所有美国媒体请的
: 裁判、评论员都一致认为民主党候选人希拉里大胜共和党候选人川普。但是辩论的胜负
: 判断本来就是很主观的,即使媒体一致认为希拉里获胜也不会让川粉(川普的狂热支持
: 者)接受,因为他们本来就认为美国主流媒体基本上都是自由派,都是支持希拉里的。
: 举行辩论的主要目的是要影响选民,那么,我们可以给胜负定一个客观标准,那就是认
: 为哪一方获胜的选民人数比较多,这一方就获胜了。第一场辩论刚刚结束,CNN就立即
: 报道了他们通过一家民意调查机构ORC对521名选民做民意调查的结果,62%认为希拉里

H****S
发帖数: 1359
8
如果希轮可以把良心从狗肚子里淘回来承认abc,cnn还有nbc那些个election polls是
rigged,真实情况是川普领先希婆至少十个点,床粉可以大度点,希婆确实赢了第一轮
debate。

【在 t******g 的大作中提到】
: 呵呵,按照川粉的德性,第一选择是无视这篇文章(到目前为止是这样),第二选择是
: 开始攻击老方的人品。

c*******4
发帖数: 1874
9
CNN的随机取样可以做到民主党41%,共和党26%。真是科学的统计阿。自己抽自己的脸
z******7
发帖数: 772
10
首先置信度不是你的信心是95%,也不是事情发生的概率是95%,而是同样的事情重复
100次根据统计模型平均95次会得出相同的结论。
换言之平均有五次是错的。假如95个实验结果阴影,5个结果阳性,这不是说明后五个
人运气好找到了宇宙真相,而是很有可能结果是假阳性。
其次,你用的统计模型正确不正确也是一个问题。你计算273那个数字基于样本抽取做
到随机化的条件下得到的。假如你能做到像用中国人民身份证号随机抽样才能做到的那
种程度的随机化,当然结论就是正确的。
然而,每个看cnn大选辩论的人都会同样关注cnn的网络投票吗?我听说很多trump的支
持者都倾向于认为主流媒体有偏见,他们又怎么会守在网上遇到cnn的问卷调查。最后
大约43,30,27的左中右比例恰好说明,抽取到的样本没有反应总体; cnn的民调针对总
体显示47, 11, 42的左中右比例,要么是election poll错了,要么是debate poll错了
,二者必居其一。
一句话概括,cnn所谓历史最差debate poll,不是因为历史最差的debate performance
,而是因为历史最差的抽样方法。
相关主题
未脫稿暴走 川普國會演說「總算有總統樣子」CNN/ORC: Trump National Poll 49
CNN是不是转向了?怎么天天发文说希拉里坏话How Donald Trump could win -- CNN
CNN Iowa poll, Trump大幅领先CNN's Poll from 521 persons - Hillary wins !?
进入USANews版参与讨论
l****e
发帖数: 609
11
你可以用上权重,得出的结果还是Trump输了辩论。
在看看别的电话调查吧,是一样的结果:Trump输了辩论

【在 c*******4 的大作中提到】
: CNN的随机取样可以做到民主党41%,共和党26%。真是科学的统计阿。自己抽自己的脸
: 。

c*******4
发帖数: 1874
12
一个调查样本误差这么大,早就不是统计误差的范围内了。已经是人为挑选调查者了。

【在 l****e 的大作中提到】
: 你可以用上权重,得出的结果还是Trump输了辩论。
: 在看看别的电话调查吧,是一样的结果:Trump输了辩论

l****e
发帖数: 609
13
你说是人为挑选是没有根据的。
也可以有两种解释
1. 扔十次硬币,如果8次都是头朝上,也不能否认朝上的的概率是50%。所以还要看看
以前cnn的调查者是不是每次都是民主党多很多?
2. CNN的偏左的媒体,他们是从自己的观众中随机选的调查者,所以民主党人多,但是
可以用上权重。
anyway,没有什么好争论的。fox news的电话调查也是Trump输了。

【在 c*******4 的大作中提到】
: 一个调查样本误差这么大,早就不是统计误差的范围内了。已经是人为挑选调查者了。
r**********n
发帖数: 5281
14
Who cares
c********g
发帖数: 15629
15
想起方舟子怎样为三年饥荒饿死几千万这件事辩护了。

【在 k**k 的大作中提到】
: http://fangzhouzi.baijia.baidu.com/article/645903
: 方舟子 10月04日 09:43
: 今年是美国大选年,将在11月8日投票选出新一届总统。按惯例两个主要政党的总统候
: 选人要举行三场辩论。今年的第一场辩论在9月26日举行之后,几乎所有美国媒体请的
: 裁判、评论员都一致认为民主党候选人希拉里大胜共和党候选人川普。但是辩论的胜负
: 判断本来就是很主观的,即使媒体一致认为希拉里获胜也不会让川粉(川普的狂热支持
: 者)接受,因为他们本来就认为美国主流媒体基本上都是自由派,都是支持希拉里的。
: 举行辩论的主要目的是要影响选民,那么,我们可以给胜负定一个客观标准,那就是认
: 为哪一方获胜的选民人数比较多,这一方就获胜了。第一场辩论刚刚结束,CNN就立即
: 报道了他们通过一家民意调查机构ORC对521名选民做民意调查的结果,62%认为希拉里

R******1
发帖数: 394
16
川粉不在乎,只要床大爷让他们嗨了就行。

【在 k**k 的大作中提到】
: http://fangzhouzi.baijia.baidu.com/article/645903
: 方舟子 10月04日 09:43
: 今年是美国大选年,将在11月8日投票选出新一届总统。按惯例两个主要政党的总统候
: 选人要举行三场辩论。今年的第一场辩论在9月26日举行之后,几乎所有美国媒体请的
: 裁判、评论员都一致认为民主党候选人希拉里大胜共和党候选人川普。但是辩论的胜负
: 判断本来就是很主观的,即使媒体一致认为希拉里获胜也不会让川粉(川普的狂热支持
: 者)接受,因为他们本来就认为美国主流媒体基本上都是自由派,都是支持希拉里的。
: 举行辩论的主要目的是要影响选民,那么,我们可以给胜负定一个客观标准,那就是认
: 为哪一方获胜的选民人数比较多,这一方就获胜了。第一场辩论刚刚结束,CNN就立即
: 报道了他们通过一家民意调查机构ORC对521名选民做民意调查的结果,62%认为希拉里

z******7
发帖数: 772
17
你可以把除了cnn以外所有的debate polls统计一下结果,看一下trump赢得多还是
hilary赢得多。
因为如果其他polls的抽样方法问题不是特别大的话,p值分布应该是均匀分布。
换言之如果有100个比较正常的poll,95个都hilary赢,统计上还是相当有说服力的。
但即使退一步说,假设100个poll里95个hilary赢(虽然这不是事实),你也只能说明
hilary在debate赢了是显著的;
无论如何,“hilary以63-27这样的比分赢了trump”这件事可以确定统计上毫无显著性
可言。
而后者这样已经明确被验证为谬误的结论还在被媒体不断传播,才是让trump支持者愤
怒的地方。
我不参与投票,但可以想见hilary这一轮针对debate poll的campaign,最终的结果就
是刺激trump得到更高的turnout

【在 l****e 的大作中提到】
: 你可以用上权重,得出的结果还是Trump输了辩论。
: 在看看别的电话调查吧,是一样的结果:Trump输了辩论

s*********r
发帖数: 9493
18
分析得挺中肯。

【在 k**k 的大作中提到】
: http://fangzhouzi.baijia.baidu.com/article/645903
: 方舟子 10月04日 09:43
: 今年是美国大选年,将在11月8日投票选出新一届总统。按惯例两个主要政党的总统候
: 选人要举行三场辩论。今年的第一场辩论在9月26日举行之后,几乎所有美国媒体请的
: 裁判、评论员都一致认为民主党候选人希拉里大胜共和党候选人川普。但是辩论的胜负
: 判断本来就是很主观的,即使媒体一致认为希拉里获胜也不会让川粉(川普的狂热支持
: 者)接受,因为他们本来就认为美国主流媒体基本上都是自由派,都是支持希拉里的。
: 举行辩论的主要目的是要影响选民,那么,我们可以给胜负定一个客观标准,那就是认
: 为哪一方获胜的选民人数比较多,这一方就获胜了。第一场辩论刚刚结束,CNN就立即
: 报道了他们通过一家民意调查机构ORC对521名选民做民意调查的结果,62%认为希拉里

1 (共1页)
进入USANews版参与讨论
相关主题
2016被做了手脚的民意调查(亲身经历)CNN民调:75%美民众认为情况差 高过94及06年
美国社区的最后一道防线支持Trump!Law & Order!未脫稿暴走 川普國會演說「總算有總統樣子」
From CNN!-Trump gives America chance to correct courseCNN是不是转向了?怎么天天发文说希拉里坏话
华人支持希拉里的vs支持川普的是4.5:1CNN Iowa poll, Trump大幅领先
随鸡抽样CNN/ORC: Trump National Poll 49
Florida Poll,希拉里领先5 pointHow Donald Trump could win -- CNN
CNN/ORC最新民调:川普亚利桑那 +5,北卡-1CNN's Poll from 521 persons - Hillary wins !?
川普演說:69%讚Hillary won the final debate 52% to 39% (CNN / ORC poll)
相关话题的讨论汇总
话题: cnn话题: 样本话题: 结果话题: 调查话题: 误差