由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 大牛给解释下,什么叫自由度拆借?
相关主题
230 Variables and 4400 Observations 算是high-dimensional data么请问一个分布。谢谢
[合集] factor analysis 变量的分布问题regression的时候提高自由度对模式有什么好处?
问问各位大佬:SVM和RF在几百个sample几万个variable的情况下X 是随机变量, 那么 X + X 等于 2* X 吗?
sampling weight variable怎么用到linear regression里啊?如果x 是正太分布,y|x 也是正太分布,那么y的边际分布是不是也是正太分布呢?
求教如何用sas从一个大population选sample问一个随机变量分布的收敛的问题
问个三参数的学生分布的问题?假如一个变量 X 是 另外几个变量的函数, X=f(Y1, Y2,...,Yn), 假设Y1,。。YN 的分布是知道的,如何得出X的 分布
贝叶斯进行点估计的时候 先验概率怎么选择[合集] 多变量回归
请问:指数分布随机变量和求教一个sas读data的问题
相关话题的讨论汇总
话题: 拆借话题: 自由度话题: variable话题: 释下话题: sample
进入Statistics版参与讨论
1 (共1页)
l*********s
发帖数: 5409
1

,先检验每个 variable 是否服从 t 分布,再看哪个 variable 发生了显著变化。所
以当 sample size 很小时,因为无法“稳定和精确地确定其分布”,用 t-test 就有
问题。
sample 内部,在 variable 这个维度上,就可以“稳定和精确地确定其分布”,并把
得到的信息拆借回 sample 维度上。这种拆借经常是以自由度的形式。而且拆借的效率
很有限:几万的自由度,拆借过来只有几个自由度,甚至 even worse。
d*******o
发帖数: 493
2
不懂什么叫系统生物学。
笨猫觉得,做生物的其实和做marketing的差不多,observation都是人。生物通过基因
预测人会不会得病,marketing通过demographic和行为变量预测人会不会买东西。区别
是,marketing可以通过大量的数据建模, 尤其是social network based web
analytics,动不动就可以用几十万人的数据。
搞生物的不可能做几十万张microarray,做了十张就了不得了。没法做supervised
modeling. 所以做生物的哥们只有变量和变量之间做做t-test,最多cluster一下了。
h***x
发帖数: 586
3
笨猫回答问题还是很热情的,虽然大多数时候都是瞎扯

【在 d*******o 的大作中提到】
: 不懂什么叫系统生物学。
: 笨猫觉得,做生物的其实和做marketing的差不多,observation都是人。生物通过基因
: 预测人会不会得病,marketing通过demographic和行为变量预测人会不会买东西。区别
: 是,marketing可以通过大量的数据建模, 尤其是social network based web
: analytics,动不动就可以用几十万人的数据。
: 搞生物的不可能做几十万张microarray,做了十张就了不得了。没法做supervised
: modeling. 所以做生物的哥们只有变量和变量之间做做t-test,最多cluster一下了。

l*********s
发帖数: 5409
4
俺也是瞎问来着,这个维度概念太高深了,估计教授也未必能讲清楚 ^__^
d*******o
发帖数: 493
5
大侠,跪请赐教。

【在 h***x 的大作中提到】
: 笨猫回答问题还是很热情的,虽然大多数时候都是瞎扯
D******n
发帖数: 2836
6
very ft, what is "拆借"? It must be a very force-giving translation.

【在 l*********s 的大作中提到】
: 俺也是瞎问来着,这个维度概念太高深了,估计教授也未必能讲清楚 ^__^
h***x
发帖数: 586
7
不敢,俺不知道,所以不说

【在 d*******o 的大作中提到】
: 大侠,跪请赐教。
1 (共1页)
进入Statistics版参与讨论
相关主题
求教一个sas读data的问题求教如何用sas从一个大population选sample
几个简单的用R的问题。问个三参数的学生分布的问题?
SAS data merge求助贝叶斯进行点估计的时候 先验概率怎么选择
问一下这个双变量变换的问题 谢谢请问:指数分布随机变量和
230 Variables and 4400 Observations 算是high-dimensional data么请问一个分布。谢谢
[合集] factor analysis 变量的分布问题regression的时候提高自由度对模式有什么好处?
问问各位大佬:SVM和RF在几百个sample几万个variable的情况下X 是随机变量, 那么 X + X 等于 2* X 吗?
sampling weight variable怎么用到linear regression里啊?如果x 是正太分布,y|x 也是正太分布,那么y的边际分布是不是也是正太分布呢?
相关话题的讨论汇总
话题: 拆借话题: 自由度话题: variable话题: 释下话题: sample