关于ttest的讨论汇总 - 话题女王

f********n
发帖数: 6465

来自主题: Biology版 - ttest的提问

用EXCEL算TTEST.
问题一,TAILS的=1,=2单尾和双尾有什么区别呢?要怎么选择?
问题二,TYPE的1,2,3又有什么区别要怎么选择呢?
成对,等方差双样本,异方差双样本有什么区别啊?
同一个细胞系,用不同的浓度1uM,1mM的AGONIST处理相同细胞系的相同数量的细胞,每种
浓度都做3次实验(处理后可以产生cGMP)_,看这两种浓度处理的细胞得到的cGMP量是否
有显著的差别.TYPE选什么?
问题三,在用TTEST之前,是否要用FTEST先算一算看能否用TTEST,还是说可以直接用
TTEST?
TTEST(array1,array2,tails,type)
Array1 为第一个数据集。
Array2 为第二个数据集。
Tails 指示分布曲线的尾数。如果 tails = 1，函数 TTEST 使用单尾分布。如果
tails = 2，函数 TTEST 使用双尾分布。
Type 为 t 检验的类型。
如果 type 等于检验方法
1 成对
2 等方差双样本检验
3 异方差双样本检验

r****y
发帖数: 1437

来自主题: Computation版 - ttest in matlab

Is following results consistent with what matlab said about "ttest"
function? Should 'right' means "the mean >0", then how could it failed
to reject null hypothesis here. Or their manual is wrong, 'right' and 'left'
should be exchanged?
>> [h, p]=ttest([-20:0.001:-10], 0, 0.05, 'right')
h =
0
p =
1
>> [h, p]=ttest([-20:0.001:-10], 0, 0.05, 'left')
h =
1
p =
0

o****o
发帖数: 8077

来自主题: Statistics版 - 请问sas如何做两万次ttest不崩溃？

作T检验，只需要三个统计量嘛，N,MEAN,STD
先求summarized statistics，再用BY-processing。跑得时间不见得少，不过至少不会
崩溃。而且这个用BY-PROCESSING可以很容易并行，最后合并结果也很容易。
134
135
136 options fullstimer;
137 data class;
138 set sashelp.class;
139 array col{20000};
140 do j=1 to dim(col); col[j]=rannor(0); end;
141 drop j;
142 run;
NOTE: There were 19 observations read from the data set SASHELP.CLASS.
NOTE: The data set WORK.CLASS has 19 observations and 20005 variables.
NOTE: DATA statement used (Total process time):... 阅读全帖

f********n
发帖数: 6465

来自主题: Biology版 - ttest的提问

一直和学生争论,把我也弄糊涂了.
使用ttest之前必须要用ftest先算一算，用ttest计算的时候ＴＹＰＥ是选２还是３？

r*********o
发帖数: 490

来自主题: Statistics版 - 请问sas如何做两万次ttest不崩溃？

我用的code框架如下，sas总是崩溃，有啥好办法？
ods listing close;
ods output ttests=pvals;
proc ttest data=sashelp.class;
class sex;
var col1-col20000;
run;
ods output close;
ods listing;

s********e
发帖数: 323

来自主题: Statistics版 - 请教一下proc ttest， weighted data

用proc ttest，加上weight了，结果里的mean应该是weighted mean吧，df用的是原来
的unweighted N。这样对吗？
在网上看到这么做的，
先用proc means加上weight，算weighted mean，assign成一个data，然后在用proc
ttest，不加weight，这样的话mean和df都和前面一样，但是t statistics不一样，结
果p value也不一样。
到底应该用哪个啊？
多谢！

H******e
发帖数: 100

来自主题: Biology版 - student's ttest.

ttest in excel.

f********n
发帖数: 6465

来自主题: Biology版 - ttest的提问

ftest的值小于0.05能说明什么呢?是在接下来的ttest中选type３？

h******e
发帖数: 1791

来自主题: Biology版 - ttest的提问

单尾，双尾取决于你的零假设。如果零假设是a = b，则双尾；如果是a > b或a < b则
单尾。
等方差，异方差取决与你的样本的性质，不知道的话在等方差下做一次，再在异方差下
做一次，如果都significant，就不用过多考虑了。
所谓在ttest前用ftest是指test等方差或异方差吧？

l*****k
发帖数: 587

来自主题: Statistics版 - help with pairwise ttest in sas

new to sas...
I have a category variable that have 10 levels, a numerical
variable evalue.
Is there an easy way to generate pairwise ttest among the 10
levels of category using evalue?
Thanks

a***e
发帖数: 1627

来自主题: Statistics版 - 请问sas一道题，ttest

Perform a t-test of the null hypothesis that the means of the two groups are
equal.
Group 1: 39,40,32,60, 19,52,41,32, 13, 37, 28
Group 2: 70,47,54,27,31,42,37,41,9,18,33,23,49,41,59
但是sample size 不一样大，请问各位怎么写啊？？
data hw;
input group $ blood @@;
datalines;
1 39 1 40 1 32 1 60 1 19 1 52 1 41 1 32 1 13 1 37 1 28
2 70 2 47 2 54 2 27 2 31 2 42 2 37 2 41 2 9 2 18 2 33 2 23 2 49 2 41 2 59
;
proc ttest data=hw;
by group;
var blood;
run;
可是为什么没有p-value 那些东西呢？？？
谢谢

r*********o
发帖数: 490

来自主题: Statistics版 - 请问sas如何做两万次ttest不崩溃？

你是说把data transpose吗，那样怎么做ttest啊

p*****m
发帖数: 7030

来自主题: Biology版 - 请教一个简单的数据统计问题

我觉得这么说就行了只要sample size足够大 sample variance几乎不会影响test
statistics 所以即便是非正态分布的数据用ttest也不会影响分析结果。但是如果
sample size太小非正态分布的数据会让ttest倾向于否定H0（原因我不太清楚）
因此不适合ttest 我觉得你们两个说的其实是一回事两个角度而已

the
generating
not

s*******r
发帖数: 592

来自主题: Statistics版 - 气死了，这个TA是不是跟我有愁？

我的code都可以run，绝对没有问题的。比如说这次有一题是要求用PROC UNIVARIATE
测试pairwise ttest，她非要我用PROC TTEST才满意，她给我回信说我的结果确实有，
但是她不明白我为什么不用TTEST，给我扣了10分，我晕倒（明明是老师上课说的一个
trick，而且我也确定老师想考这点）。刚才问了一个抄我code的人，他直接抄我的得
分都比我高。。。。这叫什么事？我们都是女孩子，平时照面也打招呼的，还不好意思
直接撕破脸，火大！

p*****m
发帖数: 7030

来自主题: Biology版 - 请教一个简单的数据统计问题

nod 我其实能理解大家这么干是为啥还不都是想显得自己quantitative么（主动或
者被迫的）可实际上现在大多数生物学研究的对象和手段只能允许很粗糙的quali
tative的判断你非要假装quantitative这个就不仅要闹笑话还要misleading的
比如说吧某人要是show了3次重复的western blot的结果然后分析一下发现mean差
了2% 同时做了个ttest发现mean的差异显著性很大。暂且先不说他就3个结果能不
能用mean来represent数据也不说ttest能不能随便用他这个2%的差距就算再显著
你真的相信它能被别的试验室重复能代表一些有根据的生物学现象？

y***i
发帖数: 11639

来自主题: Biology版 - 我就抛砖引玉了吧

,
statistically
from
theorem
results.
请注意这一句，repast的说法看来很准确
"The t-test ....require normality of the sample means.....in addition that
the sample variance follows a scaled Χ2distribution....Normality of the
individual data values is not required if these conditions are met."
而且 "However, if the sample size is large Slutsky's theorem implies that
the distribution of the sample variance has little effect on the
distribution of the test statistic."
所以说，对大样本数ttest完全成立。ttest远比一般的理解更powerful。现在问题是

y***i
发帖数: 11639

来自主题: Biology版 - microarray 统计问题

两个条件对比，本来计划是(a1,b1), (a2,b2)...(a6,b6)，做paired ttest。但样本的
RNA量太小，microarray data非常差。
我现在想能不能每5个样本的RNA合在一起做：
(a1+a2..+a5, b1+b2...+b5), (a6+a7..+a10, b6+b7...+b10)。。。。然后再做paired
ttest？

c****r
发帖数: 576

来自主题: Biology版 - 简单介绍 Bioinformatics Tools for NGS 分析

东西看着不错，可是写作实在让人无语。你或者全用英文，或者都用汉语，这样每句都
中英夹杂真别扭。我就不相信你那些英文都没有汉语翻译。比如
“总体来说，对RNA-seq的数据分析尚未被标准化，相对于对microarry的分析，即便是最
基本的call significant genes in RNA-seq依然处于发展阶段，在microarry，大家都
知道，有RMA normalization，数据被normalize 之后，可以用ttest，SAM等手段找
significant genes，但是RNA-seq，单就normalization仍尚无定论。”
完全可以改成
“总体来说，对RNA测序的数据分析尚未被标准化，相对于对微阵列的分析，即便是最
基本的RNA测序显著变化的基因（？）依然处于发展阶段，在微阵列，大家都
知道，有RMA 标准化，数据被标准化之后，可以用ttest，SAM等手段找
显著变化基因，但是RNA测序，单就标准化仍尚无定论。”

c****r
发帖数: 576

来自主题: Biology版 - 简单介绍 Bioinformatics Tools for NGS 分析

y***i
发帖数: 11639

来自主题: Biology版 - 大家发文章用standard deviation，还是standard error？

我觉得是sunnyday对。证据是比较两个数据组用ttest，而ttest的公式计算的是SE。
另一角度可以这么想：你的数据组抽样越多，SE越小；同时数据组抽样越多，越能可靠
的确定两个数据组的细微差别。所以sunnyday说比较平均值的差异该用SE是对的。
但直觉上看用SE其实不爽。因为我们更希望整个数据分布有大的差异，which is SD.

y***i
发帖数: 11639

来自主题: Biology版 - 大家发文章用standard deviation，还是standard error？

K****n
发帖数: 5970

来自主题: Biology版 - 请问高手们一个统计学问题

热烈庆祝 ttest p-value达到0.048636103！可得一星儿
重点是单尾 paired ttest
首先你要强调每一对儿A, B是对同一个东西／概念的两次测量
其次你要坚决咬定你的H0 是A-B<0
不知道记得对不对

w****r
发帖数: 1046

来自主题: Statistics版 - 还是那个MACRO的问题

IF THEN 不起作用，还是２个test都做. Thanks!!!
OPTIONS MACROGEN;
%MACRO TWO_SAMPLE (IN=, Y=, A=, ALPHA=);
PROC UNIVARIATE DATA=&IN NORMAL NOPRINT;
BY &A; VAR &Y;
OUTPUT OUT=ONE MEAN=MEANY STD=STDY N=N PROBN=PNORMAL;
DATA TWO;SET ONE;
IF PNORMAL>0.05 THEN DO;
PROC TTEST DATA=&IN;
CLASS &A; VAR &Y;
ODS OUTPUT TTESTS=TT;
DATA TT;SET TT;
IF _N_=2;
KEEP PROBT;
RENAME PROBT=PROB;
DATA THREE;IF _N_=1 THEN SET TT;SET TWO;
END;
IF PNORMAL ne 0.05 THEN DO;

i**f
发帖数: 1195

来自主题: Statistics版 - 数据不正态怎么办

??
npar1way is able to come up with ttest output with anova option but i don't
think it is appropriate to say 'if the data don't follow normality, you can
do the t-test using npar1way'. In that case, people will go for wilcoxon.
you can still use proc ttest even data is not normal, but is it a correct
way to do that?

S*****A
发帖数: 44

来自主题: Statistics版 - 求助！！ MEAN test 问题！

销售数据，把所有的几千家店分成高价店和低价店两种类型，然后做ttest 测试这两种
店卖的平均数量是不是significant different。
但是因为这几千家店的size是不一样的，有的很大，有的很小，所以以上的test可能就
没啥意义了。然后现在引进了数据就是每家店的预测销售数据（店面大数据相应就大
，小就小），再做mean test看看平均销售量是不是different。
该怎么操作啊？ SAS 哪个procedure能做这个？开始就用的简单的ttest 做的。
谢谢大家了！！！！

y***i
发帖数: 11639

来自主题: Statistics版 - microarray 统计问题请教！！

y***i
发帖数: 11639

来自主题: Statistics版 - 各位大侠：请教一个统计学问题

如果我想ttest对比A,B两组样本。每组有3N个样本。但因为条件限制，我不能得到任何
一个样本的数据。这3N个样本每3个一小组，我只能得到每小组的3个样本的和，或者说
平均值。所以我要对比的是A, B两组N个平均值数据。
这种情况下我得到的ttest pValue需要修正么？要怎么修正才等于每个样本对比的
pValue?(假设符合标准分布)

r********n
发帖数: 6979

来自主题: Statistics版 - 如何解读非常小的p－value？

我知道你和后面一个人说的什么意思了
可能是我原帖里面没有说清楚
你们说的是这个test本身可能type I error比较高(一个pvalue没法说明这个test的好
坏)
这些我都同意
问题是我关心的不是test本身的好坏（当然这个是个问题，只是不是我现在关心的问
题）
假设test本身的assumption都成立
我关心的是两种分类方法的好坏
t－test只是用来分辨的一种方法而已（也可以用别的statistical test）
用分类方法一把1000个sample分成两类：假设一类有400个sample，一类有600个
sample
然后可以在这两组之间做一个unpaired ttest
得到第一个pvalue＝0.00001
用分类方法而把1000个sample分成另外两类：假设一类有250个sample，一类有750个
sample
再做一个unpaired ttest
得到第二个pvalue＝0.000001
我的问题是
因为第二个pvalue比第一个pvalue小（虽然两个pvalue本身都已经highly significant）
也就是说第二种分类方法分出来的... 阅读全帖

c********h
发帖数: 330

来自主题: Statistics版 - 统计牛人来帮个忙啊

你可以用别的test
我大概的意思是，用ttest举例说明为什么这两个test是一样的
你的直觉没有考虑A+B还是要take mean的，而且对方差也有影响
你如果用two sample ttest并且假设两个样本的variance相同的话，这两个就是一码事
，我同意winair的说法
test Y vs X的时候，还是用B vs A中对sigma的估计，df就完全一样了
这个sample correlated也是没办法，dependence这种东西就是很麻烦，不行就用
permutation test吧

DF
test

n******u
发帖数: 79

来自主题: Statistics版 - 请教一个two sample t test 的问题

我有两组independent的data 如下：
group1 group2
20% 50%
30% 28%
12% 69%
13% 39%
我想比较这两组数是不是significantly different。
可不可以转化成如下的0到1的值，然后用two sample ttest？我主要是不确定0到1的数
能不能用t test？
group1 group2
0.2 0.5
0.3 0.28
0.12 0.69
0.13 0.39
还有一个问题就是，可不可以用Mann–Whitney two-sample 来代替two sample ttest
来算？因为sample size比较小

h***i
发帖数: 3844

来自主题: Statistics版 - 统计学难学吗？

但指导t-test法诞生的并非人们所熟悉的概率论或数理统计的理论。
不妨碍概率论出现在ttest之前
我就抓住这，就来攻击你的逻辑，你看如何。
余下的，等我写完code再有空去攻击。
由概率论和ttest先后转进到理论和方法的指导关系
不才，我立刻把你堵回去，用你的不妨碍去反推

发帖数: 1

来自主题: Military版 - 中国AI大幅退烧迅速遭抛弃

有好数据，你用ttest anova，然后说你玩的是大数据，结果还很好。

q**j
发帖数: 10612

来自主题: Automobile版 - 难道就没有比VOLVO S60更靠谱的Sedan了吗？

xc90的重量比mdx大300磅，但是还是同一个级别的。另外重量大
了更加安全，这个是帮mdx/edge的，不是帮xc90的条件。说sample size的时候，我们
在比较difference，哪个大不重要。你可以说大样本证明mdx/edge好，也可以说大样本
证明xc90不安全。没有影响。你是学统计的么？看这个
http://geography.uoregon.edu/geogr/topics/ttest.htm
只有在两种车死亡率的方差相差非常非常大的情况下才会有区别。

d*********3
发帖数: 277

来自主题: Immigration版 - TSC 485 处理时间统计分析

统计表明LIn and SRC ttest p value = 0.61, no significant difference
Variable Dates__between_FP_and_AD_LIN
Sample size 201
Lowest value 11.0000
Highest value 151.0000
Arithmetic mean 40.3085
95% CI for the mean 36.5369 to 44.0801
Median 33.0000
95% CI for the median 31.0000 to 35.0000
Variance 735.3244
Standard deviation 27.1169
Relative standard deviation 0.6727 (67.27%)
Standard error of the mean 1.9127
Coefficient of Skewness 1.9843 (P<0.0001)
Coefficient of Kurtosis 4.5839 (P<0.0001)
D'Agostino-... 阅读全帖

t***t
发帖数: 7

来自主题: Montreal版 - 问一下关税

【以下文字转载自 Canada 讨论区】
发信人: ttest (test), 信区: Canada
标题: 问一下关税
发信站: BBS 未名空间站 (Sat Nov 4 22:40:58 2006), 转信
在美国的网站上买东西送过来，关税是怎么算的？去哪里查各种商品的关税？
如果让厂商送到美国的同学那里，再托同学ups过来，是不是就可以逃税了呢？
谢谢

t***t
发帖数: 7

来自主题: Toronto版 - 问一下关税

t***t
发帖数: 7

来自主题: Vancouver版 - 问一下关税

v***t
发帖数: 27100

来自主题: Running版 - Galen Rupp wins US Olympic marathon trial

Galen Rupp made his first marathon a special one Saturday, racing away from
three-time Olympian Meb Keflezighi over the final four miles to win the ho
ttest U.S. Olympic trials race in history in 2 hours 11 minutes 12 seconds.
Kelfezighi hung on for second in 2:12:20.

x****o
发帖数: 21566

来自主题: Joke版 - 测测你是左逼还是右棍 -- 中国版

http://www.zgtrend.com/game/ttest/political.html?from=timeline&

b**x
发帖数: 3451

来自主题: PKU版 - kao,被莲花给震的，俺都忘了问正经问题了, anova

咦？不对啊，one-way就是比较多余两组的啊，只能用在两两对比的应该是ttest啊。我
再看看去。

c*******h
发帖数: 1096

来自主题: CS版 - one sample T-test算p-value是不是忽悠人的？

sample多少当然有影响么
还有就是ttest的话是看0和1两头的，无论是靠近0还是靠近1都不是什么好事

a***n
发帖数: 404

来自主题: CS版 - one sample T-test算p-value是不是忽悠人的？

我那个例子的分布确实不是正态的，不过那只是我随便举得一个例子而已，如果有其他
的确定的正太分布的大小不同的sample，结果应该也会出现那样的p值逐渐变小的情况
吧。
我这个post主要还是想讨论下one smaple ttest的p值的实际意义到底大不大。不是纠
缠于具体的细节。

a***n
发帖数: 404

来自主题: CS版 - one sample T-test算p-value是不是忽悠人的？

如此说来，转了一圈，好像又回到了原来的问题上，既然test有各种各样的条件：适用
背景，样本大小。。。
那么貌似怎么做出能否使用ttest又变成了一个问题，比方对于不同的实验，什么样的样
本大小叫合适？
如果统计的人没法给出这样的定义，那么test方法本身好像意义也不大了。另外貌似很
多情况下，我指paper里面，使用的各种test的情况并非像搞统计的人说的样本容量有
限，没有办法才使用这样的方法去估计，实际上是有大量的样本，为了得到一个
hypothesis的正确验证而去做的这样的test,也就是我的标题所在。因为很多情况下，
尤其cs的paper里面，得到大量的数据好像并非难事，或者说并非不可能。那样的话，
那么多的paper里面使用这样的test不是变成了trick了么？既然sample可以变，p值也
能变。而这样使用test的paper恐怕不少吧。

D**g
发帖数: 739

来自主题: Biology版 - 请教一个简单的数据统计问题

除非你事先（比如在grant里）讲好只比较谁和谁。但实际情况一般是这样的：如果你
只想比较A和B，就不需要设六种条件了吧。试验条件只要A和B就成了。如果你看到了六
个条件的BAR图，再选择差别大的做比较，实际上已经是把所有的15种可能都比较了（
用眼睛和用统计方法是一样的）。multiple comparison的基本意思就是：如果你撞一
次撞到运气而得到一个positive结果的可能是5%，那么你撞很多次从而得到一个
positive的结果的可能就不再是5%，而是比5%大得多。最典型的是microarray的结果，
如果你比较任意两个RNAsample的基因表达结果，你得到的P-value<0.05甚至0.0001 都可能
有N多。
生物实验中由于统计方法不正确造成的错误结论应该很多吧。举个最容易犯的错误：t-
test。很多人喜欢用EXCEL，里面的ttest之TYPE有三个选项：1，2，3. 其中2，3是问
两个group的ariance是不是一样。这个一样不一样是需要统计检验去确定的。选2还是
选3应该根据检验结果。但很多人都是看那个得到的p比较小就选哪个。

y***i
发帖数: 11639

来自主题: Biology版 - 请教一个简单的数据统计问题

我做过的分析里 ttest type 2还是3 差异总是相当小。还没见过差距显著的情况。

t-
候不

r****t
发帖数: 10904

来自主题: Biology版 - 请教一个简单的数据统计问题

另外，这个“sample size太小非正态分布的数据会让ttest倾向于否定H0”的说法根
据是什么？一般讲 small sample 用 U-test, 我能想起来的是两个原因：1. median
比 mean robust; 2. for small sample U-test statistic 简单到可以手算。因为我
没学过，所以有很多别的好处你可以补充。我看来，错误地 reject H0 is your alpha
, which is calculated against your H0 precisely, hence is not related to the
sample, be it large sample or small sample.
对于 sample size 很小的情况，也有 u-test 不适合但是 t-test 更适合的时候。这
个直接和前面我的帖子里面的态度有关，如果你知道数据确实是 normal 的（比如
model 是正态的，或者有很强的理由相信数据是正态，比如对一个柱子测 5 次长度这
种，而不仅仅是从几个 normality test

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天