由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 关于SEM和SD的争议
相关主题
请教--关于p value的计算请问高手们一个统计学问题
斯坦福大学的在线课程-Writing in the sciences 下周开课Question about statistical test for data significance
请教大家个问题关于ttest简单地说说生物医学里的统计应用吧
我想往data mining方面折腾,可是3 way anova
请教一个简单的数据统计问题请教!这种情况下能做什么统计?
我就抛砖引玉了吧找博后如果面同一个学校的几个lab,他们怎么想?
统计问题,同样是两组数据比较,anova和t-test的p value不一样别和大势做对(黑生物贴,不喜勿入)
问个统计学的问题NPR也劝退阿
相关话题的讨论汇总
话题: sem话题: sd话题: excel话题: sample话题: population
进入Biology版参与讨论
1 (共1页)
T****i
发帖数: 15191
1
看来很有争议,值得再讨论一下。
我不是统计出身,所以也不敢说我说的就是对的。所以讨论之前我先引用些:
先看看这个 http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2959222/
摘了中间一部分:“The SEM is a measure of precision for an estimated
population mean. SD is a measure of data variability around mean of a sample
of population. Unlike SD, SEM is not a descriptive statistics and should
not be used as such. However, many authors incorrectly use the SEM as a
descriptive statistics to summarize the variability in their data because it
is less than the SD, implying incorrectly that their measurements are more
precise. The SEM is correctly used only to indicate the precision of
estimated mean of population. ”
好吧,可以讨论了。我的理解是:
按照定义,SEM是要知道estimated population mean。所以需要足够的sample。比如当
你要统计北方汉族男子平均身高的时候,你的sample size很大,所以你可以假设你的
sample 和你要看的population 差不多了。所以这时你可以用SEM。
而如果你只测量3个人身高,你只能用SD来测量你的样本内部的variation。你根本不能
用SEM (虽然软件允许你用),更不能说你的结果跟北方汉族男子平均身高有什么关系。
通常生物实验只有几个sample,你根本不可能知道population mean。
还有关于t-test 和ANOVA,其实也有很多trick在里面。你得分辨是one-tail, two-
tail, one-way, two-way, 等等。Excel里面t-test 也有几个function, 比如ttest,
tdist。每个function 还都有好几个parameter。你得先搞清楚这些,才能用。否则,
虽然Excel 总能给出个结果,但不能保证结果正确。Excel 根本就不是个好的科学统计
和绘图软件。严肃的科学家根本不应该用Excel做统计。建议用JMP, Sigma Plot,
Graphpad Prism。
还有,statistical significance和biological significance可以是两回事。很多人
的结果显示10%甚至更低的差别,却声称significant,我从来不信这种data,就是我自
己的也不信,不认为这类差别有生物学意义。
d*****n
发帖数: 166
2
统计这东西,做informatics同学可能有体会,有时候大牛看上了list里的一个基因,
那是千方百计把它给整成significant的,几轮下来,还真就是了。

sample
it
more

【在 T****i 的大作中提到】
: 看来很有争议,值得再讨论一下。
: 我不是统计出身,所以也不敢说我说的就是对的。所以讨论之前我先引用些:
: 先看看这个 http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2959222/
: 摘了中间一部分:“The SEM is a measure of precision for an estimated
: population mean. SD is a measure of data variability around mean of a sample
: of population. Unlike SD, SEM is not a descriptive statistics and should
: not be used as such. However, many authors incorrectly use the SEM as a
: descriptive statistics to summarize the variability in their data because it
: is less than the SD, implying incorrectly that their measurements are more
: precise. The SEM is correctly used only to indicate the precision of

D*a
发帖数: 6830
3
说了半天,你说的“用SEM而不是SD,从而看到显著差异”,还是错了。
在知道自己想要统计什么的前提下,excel做基本的mean SD SEM,ttest和作图并没有
问题。不会统计的,正经的统计软件一样是瞎用,而且正经的统计软件trick更多,随
便搞搞transformation什么的,唬外行更容易。
顺便推荐一下,Coursera,edx,udacity等MOOC网站上面很多统计课,有的教统计,有
的也教软件,建议想要学习的正经上个课,不要从看paper或者现用现抱佛脚来积累统
计知识。
T****i
发帖数: 15191
4
好吧,我错了。P value 跟SEM 或 SD 没有关系。不过SEM的确给人差异更大的印象,
有利于对读者施加心理影响。

【在 D*a 的大作中提到】
: 说了半天,你说的“用SEM而不是SD,从而看到显著差异”,还是错了。
: 在知道自己想要统计什么的前提下,excel做基本的mean SD SEM,ttest和作图并没有
: 问题。不会统计的,正经的统计软件一样是瞎用,而且正经的统计软件trick更多,随
: 便搞搞transformation什么的,唬外行更容易。
: 顺便推荐一下,Coursera,edx,udacity等MOOC网站上面很多统计课,有的教统计,有
: 的也教软件,建议想要学习的正经上个课,不要从看paper或者现用现抱佛脚来积累统
: 计知识。

w***r
发帖数: 709
5
票房需要

【在 d*****n 的大作中提到】
: 统计这东西,做informatics同学可能有体会,有时候大牛看上了list里的一个基因,
: 那是千方百计把它给整成significant的,几轮下来,还真就是了。
:
: sample
: it
: more

T****i
发帖数: 15191
6
好久不见,Dua 美眉博后位置找好了?

【在 D*a 的大作中提到】
: 说了半天,你说的“用SEM而不是SD,从而看到显著差异”,还是错了。
: 在知道自己想要统计什么的前提下,excel做基本的mean SD SEM,ttest和作图并没有
: 问题。不会统计的,正经的统计软件一样是瞎用,而且正经的统计软件trick更多,随
: 便搞搞transformation什么的,唬外行更容易。
: 顺便推荐一下,Coursera,edx,udacity等MOOC网站上面很多统计课,有的教统计,有
: 的也教软件,建议想要学习的正经上个课,不要从看paper或者现用现抱佛脚来积累统
: 计知识。

S**********e
发帖数: 1789
7
根据我做项目几个月,你把变量按连续做,4分法做,取log做,结果都不会一样,想要
什么样的结果,自己挑方法吧。
样本数量变化也影响结果。现在发现流行病和统计结果也不是那么准确。

【在 d*****n 的大作中提到】
: 统计这东西,做informatics同学可能有体会,有时候大牛看上了list里的一个基因,
: 那是千方百计把它给整成significant的,几轮下来,还真就是了。
:
: sample
: it
: more

D*a
发帖数: 6830
8
找好了,干了三个月了~

【在 T****i 的大作中提到】
: 好久不见,Dua 美眉博后位置找好了?
T****i
发帖数: 15191
9
恭喜Dua美眉,贺喜Dua美眉。祝你早日变PI。

【在 D*a 的大作中提到】
: 找好了,干了三个月了~
D*a
发帖数: 6830
10
多谢多谢~走着看吧

【在 T****i 的大作中提到】
: 恭喜Dua美眉,贺喜Dua美眉。祝你早日变PI。
相关主题
我就抛砖引玉了吧请问高手们一个统计学问题
统计问题,同样是两组数据比较,anova和t-test的p value不一样Question about statistical test for data significance
问个统计学的问题简单地说说生物医学里的统计应用吧
进入Biology版参与讨论
H*******i
发帖数: 196
11
根本不是一个东西吧。。SEM描述的是你获得的样本均值和真实值有多大差异,SD描述
的是你样本的分布。
当然SEM的作用是和样本大小相关的,就算是极大的样本,t test 95%也是+-2SEM
很多文章标+-SEM我不知道有什么意义。
significance就像以前某个帖子里的笑话一样,找20个条件,怎么找不到有一个95%相
关的。。 如果不用另一个途径检验,肯定是没有说服力的

【在 T****i 的大作中提到】
: 好吧,我错了。P value 跟SEM 或 SD 没有关系。不过SEM的确给人差异更大的印象,
: 有利于对读者施加心理影响。

t*d
发帖数: 1290
12
我的实验里大部分时候是应该用SEM的。比如我常比较加药组和placo组,每组n个样本
,需要检验两组的平均值是否相同。因为我们比较的对象是均值,所以用SEM是合适的。
这篇文章将得比较清楚:
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2064100/
Statistical significance 和 biological significance 是另外一个故事。我看到的
比较严谨的作者通常在需要的时候会注明是 statistical significance。

sample
it
more

【在 T****i 的大作中提到】
: 看来很有争议,值得再讨论一下。
: 我不是统计出身,所以也不敢说我说的就是对的。所以讨论之前我先引用些:
: 先看看这个 http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2959222/
: 摘了中间一部分:“The SEM is a measure of precision for an estimated
: population mean. SD is a measure of data variability around mean of a sample
: of population. Unlike SD, SEM is not a descriptive statistics and should
: not be used as such. However, many authors incorrectly use the SEM as a
: descriptive statistics to summarize the variability in their data because it
: is less than the SD, implying incorrectly that their measurements are more
: precise. The SEM is correctly used only to indicate the precision of

K****n
发帖数: 5970
13
英文写得比中文要好啊

sample
it
more

【在 T****i 的大作中提到】
: 看来很有争议,值得再讨论一下。
: 我不是统计出身,所以也不敢说我说的就是对的。所以讨论之前我先引用些:
: 先看看这个 http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2959222/
: 摘了中间一部分:“The SEM is a measure of precision for an estimated
: population mean. SD is a measure of data variability around mean of a sample
: of population. Unlike SD, SEM is not a descriptive statistics and should
: not be used as such. However, many authors incorrectly use the SEM as a
: descriptive statistics to summarize the variability in their data because it
: is less than the SD, implying incorrectly that their measurements are more
: precise. The SEM is correctly used only to indicate the precision of

H*******i
发帖数: 196
14
因为LZ没有理解这段英文在说啥。。 就好像有些文章看了个题目摘要,但其实不了
解那文章内容,就强行引用说明自己观点。。

【在 K****n 的大作中提到】
: 英文写得比中文要好啊
:
: sample
: it
: more

a***y
发帖数: 19743
15
但是JMP作图只能选加上SEM的error bar
说明用SEM做error bar是比SD正确的。
但是如果你做一个表格,需要标示样本的variation,就是要标mean +/- SD。或者mean
[25-75% quartile].

sample
it
more

【在 T****i 的大作中提到】
: 看来很有争议,值得再讨论一下。
: 我不是统计出身,所以也不敢说我说的就是对的。所以讨论之前我先引用些:
: 先看看这个 http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2959222/
: 摘了中间一部分:“The SEM is a measure of precision for an estimated
: population mean. SD is a measure of data variability around mean of a sample
: of population. Unlike SD, SEM is not a descriptive statistics and should
: not be used as such. However, many authors incorrectly use the SEM as a
: descriptive statistics to summarize the variability in their data because it
: is less than the SD, implying incorrectly that their measurements are more
: precise. The SEM is correctly used only to indicate the precision of

a***y
发帖数: 19743
16

是不是显著差异,和你用SD还是SEM做error bar一点关系都没有。
样本量小,power不够,很多方法都是会考虑这个问题的。
样本量小还要significant,说明两组差异是很大的。差异越小,越需要大量的n才能
significant。
即使是10%的差异,样本量够大也是可以significant的。
比如,也许白人睫毛比亚洲人平均就是长个10%,但是你这个必须有足够样本才能
significant,但是不代表这个10%差异不存在,不显著。
类似,比如,法国人平均比英国人高10%,5%,都是可以证明的。只有5%不代表没意义。

【在 D*a 的大作中提到】
: 说了半天,你说的“用SEM而不是SD,从而看到显著差异”,还是错了。
: 在知道自己想要统计什么的前提下,excel做基本的mean SD SEM,ttest和作图并没有
: 问题。不会统计的,正经的统计软件一样是瞎用,而且正经的统计软件trick更多,随
: 便搞搞transformation什么的,唬外行更容易。
: 顺便推荐一下,Coursera,edx,udacity等MOOC网站上面很多统计课,有的教统计,有
: 的也教软件,建议想要学习的正经上个课,不要从看paper或者现用现抱佛脚来积累统
: 计知识。

H*******i
发帖数: 196
17
个人觉得LZ结论说“很多文章标error bar用+-sem是误导”没有错的,逻辑上给读者应
该看90%,95%,99%置信区间,如果一个柱状图或者数据点在没有给出n的情况下标示+-
SEM,意义是什么(难道图上标个+—SEM就可以比较significant么)? 就算是n极大
,+—SEM标示68%区间? 标SD尽管不能比较组间的差异,但至少有其他意义,说明实验
可重复,精确性。

mean

【在 a***y 的大作中提到】
: 但是JMP作图只能选加上SEM的error bar
: 说明用SEM做error bar是比SD正确的。
: 但是如果你做一个表格,需要标示样本的variation,就是要标mean +/- SD。或者mean
: [25-75% quartile].
:
: sample
: it
: more

l**********1
发帖数: 5204
18
Sure, if with R or Bayesian or MCMC then every gene id its p value is
statistical,
pls refer,
http://users.soe.ucsc.edu/~raquel/software/
or one 2009 paper,
http://www.ncbi.nlm.nih.gov/pubmed/19995439
origina was from,
http://www.mitbbs.com/article_t/Faculty/31558807.html
17th floor

【在 d*****n 的大作中提到】
: 统计这东西,做informatics同学可能有体会,有时候大牛看上了list里的一个基因,
: 那是千方百计把它给整成significant的,几轮下来,还真就是了。
:
: sample
: it
: more

1 (共1页)
进入Biology版参与讨论
相关主题
NPR也劝退阿请教一个简单的数据统计问题
不是所有人都转去cs了我就抛砖引玉了吧
请教这个图是用什么软件做出来的?统计问题,同样是两组数据比较,anova和t-test的p value不一样
如何在同一个EXCEL图中显示2个差异很大的数字?问个统计学的问题
请教--关于p value的计算请问高手们一个统计学问题
斯坦福大学的在线课程-Writing in the sciences 下周开课Question about statistical test for data significance
请教大家个问题关于ttest简单地说说生物医学里的统计应用吧
我想往data mining方面折腾,可是3 way anova
相关话题的讨论汇总
话题: sem话题: sd话题: excel话题: sample话题: population