由买买提看人间百态

topics

全部话题 - 话题: parametric
1 2 3 4 5 6 7 8 9 下页 末页 (共9页)
m*****o
发帖数: 17
1
【 以下文字转载自 Graphics 讨论区 】
发信人: mritrio (MRI), 信区: Graphics
标 题: A question about selecting u,v in a parametric surface
发信站: BBS 未名空间站 (Thu Nov 2 14:03:15 2006)
Dear all,
I have a basic question about the parametric surface. I have a set of
unstructured 3D points acquired by a scanner. A coarse mesh was generated
based on the geometry of the subject that was scanned. Now I want to get a
parametric representation of the surface, but some global fitting is needed
since the data is too noisy.
From
H******d
发帖数: 176
2
google了。还是不是特别明白。
还有,RF test一般都是parametric test吗?
请高手指教。谢谢!
g*****p
发帖数: 3403
3
来自主题: Statistics版 - 求 Ozone 的non-parametric estimate R code
哪位牛人做过starndfood 的Ozone 的non-parametric estimate, 下面是description
。 给个r code 或者整个paper 就更好了 呵呵
Use three different non-parametric regression methods to predict ozone
concentration. Additive models, regression trees and projection pursuit or
linear regression could be any of the three starting methods in your
analysis. Summarize your findings and present them, along with supporting
evidence, in your report which should be organized as stated above. Be sure
to evaluate the validity of your final mo... 阅读全帖
m****o
发帖数: 467
4
我一直都是用SAS LOGISTIC regression做binary outcome 的数据分析 但这里有个问
题就是无论是LOGISTIC, GENMOD, GLIMMIX, 还是 NLIN, NLMIED,HPNLMOD, 都需
要LINK FUNCTION, 譬如 LOGIT, PROBIT, LOGLOG, CLOGLOG。貌似SEMI-
PARAMETRIC的分析不需要知道DISTRIBUTION 这是不是就说不需要LINK FUNCTION?要用
啥软件做这样的数据分析,R的NP PACKAGE行不行?SEMI-PARAMETRIC REGRESSION里里
有个SINGLE INDEX MODEL能用不?还是有其他更好的方法?
非常非常非常感谢!!!
m****o
发帖数: 467
5
因为我们的数据的原因, 我头儿一直对PARAMETRIC里面的ERROR有部分的ASSUMPTION有
困扰 所以他就让我这个半调子做SEMIN-PARAMETRIC的RESEARCH :(
m*****o
发帖数: 17
6
Dear all,
I have a basic question about the parametric surface. I have a set of
unstructured 3D points acquired by a scanner. A coarse mesh was generated
based on the geometry of the subject that was scanned. Now I want to get a
parametric representation of the surface, but some global fitting is needed
since the data is too noisy.
From my understanding, the global fitting can be achieved by filtering along
u direction and v direction separately and sequentially. Please correct me
if I'm wrong h
G****u
发帖数: 51
7
来自主题: Medicine版 - 问个整牙作parametric xray的问题
准备整牙,问了一家牙医,说可以免费咨询,包括一次parametric xray. 我有两个问
题请问各位有经验的:
1。我刚做过一次full mount xray, 是不是一定有必要做这个para* xray, 如果仅仅
是咨询的话。
2。我准备拿了报告去多问几家,这家会不会因为是免费给我做的,就不给我报告?那
我去别家,还得做?
b*******n
发帖数: 5065
8
来自主题: Mathematics版 - how to parametrize solution of equations?
I know this.
the thing is how to parametrize x and y interm of another parameter?
Tried several times, probably algebraic mistakes,
couldn't get it.
I have the the answer from Professor.
will try it later when my brain works.
thx anyway.
m*******e
发帖数: 44
9
Hi, I am trying to make a survival analysis on some right censored data
using parametric survival model (proc lifereg in SAS). It seems to me that
the only modeling adequacy tests only focus on the which distribution fits
the data better. Is it appropriate to do modeling validation test by fitting
modeling on partial of data (ex. 70% of data) and then using the model
parameter estimates to calculate the estimated survival time using the rest
30% of data to check the residuals? But it is said if ... 阅读全帖
s***e
发帖数: 323
10
来自主题: Statistics版 - 关于non-parametric这门课
大家学过这门课吗?non parametric analysis, 有没有用呢?本人倾向于生统
m******u
发帖数: 277
11
来自主题: Statistics版 - Nonparametric vs parametric
Check the distribution of the data before you decide to choose parametric or
nonparametric methods. :)
c**********8
发帖数: 38
12
求统计 survival analysis, longitudinal analysis, non parametric, missing
data 审稿
J*X
发帖数: 1001
13
Link function, semi-parametric, they are talking about different things.
It depends on the purpose of your model. If your major purpose is to make
prediction, go with those tons of machine learning models like someone said
above.
s*****0
发帖数: 357
14
Essay写累了上来灌灌水,没想到脸红脖子粗的争了一场,多少有些意气了。忙了一天
,现在闲下心来好好说说这个话题。既然有网友抛砖引玉了,缄口不言也实在不够尊重
。另外版主塞了不少包子,也不能吃白食.
先说说常用的描述数据的几个概念.
1. random variation -- variability有两大类,一类是知道来源的,还有一类是
unexplained. 比如一部分variability是由treatment effect引起的,而剩下的大部分
variability却不知道缘故. 后者经常被归入random variation.
2. Mean -- 最常见的当然是arithmetic mean, 特殊情况下也会用geometric及
harmonic mean. 任何数据组都能计算mean, 但不是所有时候用mean都合适. 当碰到
extreme data values的时候(经常因为技术条件所限边缘值不太容易被精确测量),
median就会有很大的优越性, 因为median可以大幅降低个别extreme value的影响.
3. Median -- 概念不多提了, 优... 阅读全帖
K****n
发帖数: 5970
15
really difficult to conclude the difference between parametric vs non-
parametric
I think non-parametric methods have to memorize all the data in your
computer so it is memory-consuming, yet they are really flexible in
regression and classification, e.g. Gaussian process, support vector
machine, etc.
Maybe usually non-parametric techniques' assumptions are of "higher
level"? like they sometimes have "hyperparameters" modeling the
parameters... wait, but this applies to some parametric methods to
s*********e
发帖数: 1051
16
1) first, get a non-parametric solution
2) then use parametric function to approximate the non-parametric one, such
as piecewise linear, piecewise constant, or other parametric transformation.
an example is shown in support.sas.com/resources/papers/proceedings09/113-
2009.pdf
n****1
发帖数: 1136
17
不同意这个正交观点
由于immutable, 如果function不是first class, 那程序就不是图灵完备. 所以
immutabel和1st class function是必须在一起的
List只不过是一种特殊的数据结构, 它是monad的一种. lisp全用它, 只是因为结构简
单好理解,可以用来构建其他结构罢了. 要知道在haskell里, list不是primitive,而是
个libary实现. 你完全可以实现自己的list.
Pure Functional最强调的:
1. Immutability
2. Composibility
3. Polymorphism (both adhoc and parametric polymorphism)
Composibility主要是来源于特殊的数学结构,比如functor/arrow/monad, 每种结构都
有很强的限制性假设,这个和FP语言无关.
Haskell里面的adhoc polymorphism是由typeclass来实现的, parametric
polymorphism是parametric dataty... 阅读全帖
a*****e
发帖数: 1700
18
来自主题: Programming版 - oop还是跟fp是对立的
你这个理解有点片面。
首先,go(USACity la)和go(ChineseCity gz) 这种,至少在 Haskell 和 Scala 里完
全不是问题,因为有 typeclass 可以做 type-based dispatch,这叫做 ad-hoc
polymorphism。我相信你的原意是说 parametric polymorphism 和 OOP 有冲突,但这
不是 FP 和 OOP 有冲突的原因。而且 OOP 里面也可以毫无偏差地实现 parametric
polymorphism,所以针对 parametric polymorphism,FP 和 OOP 没有冲突。
FP 和 OOP 真正不同的地方在于:
在 FP 里面,type is closed,function is extensible (to handling more types).
在 OOP 里面,function is closed,type is extensible (to have more functions
)。
也就是说 OOP 是 extend objects,而 FP 是 exten... 阅读全帖
s*****0
发帖数: 357
19
来自主题: Biology版 - 请教一个简单的数据统计问题
这都什么乱七八糟的。要这么说所有的statistical test都得用non-parametric才行,
因为也只有non-parametric才没有
任何normality的假设。
什么时候mean都可以算出来,但一组严重不normal的数据算均数的一开始就错了,因为
均数没有什么实际意义,相反中
值才有意义,怎么可能还上t test? 做parametric的统计检验当然会有data
distribution的假设,这样的假设当然有生活中
的认同,比如在人群中取身高,有几个姚明几个mini-me?大部分人不还在中间,而且
逼近正太,凭什么说不能用
normality的假设?而之所以要大样本也是为了避免抽样误差而让它接近实际生活中的
分布。

the
generating
not
s*****0
发帖数: 357
20
来自主题: Biology版 - 请教一个简单的数据统计问题
笑话,t test对normality没有任何假设?别断章取义,你把DaShagen叫来,看看他会不会认同?
normality是一个parametric test最基本的假设,DaShagen的原意是当样本足够大的时候,t test逼近z test,对normality假设轻度或者中度的violation可以容忍,是指该test在大样本的时候还能给出相对可靠的结论,不等于说t
test对normality没有任何假设。如果严重偏离normality, sample mean和std趋近,还怎么t-test? 对于right skewed data还可以做对数变换,我怎么动不动建议用u-test?不是你说要用不带假设的test么?那只好non-parametric 了,parametric都带假设。
对于highly skewed data, 均数有什么意义?Come on, Mean--measure of central tendency, Variance/STD--measure of dispersion, 这都对normality分布的数据才有意义。举个极端的例子,samp
z*********8
发帖数: 1203
21
来自主题: Biology版 - 请教一个统计学的问题
如果只是比较2组的数据的话,你说的f test是anova里的多组数据适用把,当然2组的
话也不是不可以用。因为你的数据好像不能确定是不是normal distribution(因为样
本小)我倒是觉得应该就run个non-parametric test,什么wilcoxon rank sum test(
for non parametric non paired data), rank test, wilcoxon rank test(later
two for non parametric paired data)之类的。我说的不一定对啊,刚考完生统的人
路过。严重理论跟实践脱节啊!

adjustable
d**********a
发帖数: 197
22
我学了几门统计学的课,讲的都是chi-square是non-parametric。这还是第一次听说
chi-square 是parametric。您能不能举一个例子说明chi-square 是parametric?
http://www.fgse.nova.edu/edl/secure/stats/lesson7.htm
d********m
发帖数: 3662
23
来自主题: Biology版 - 生物版语录1
多说一句题外话,数理统计的水平高低我个人认为能不能做non parametric是个很重要
的指标。好多课班出生的统计phd谈到non parametric都是一知半解的水平。
比如parametric Bayesian谁都能做,高手和一般人的分水岭就是看谁能做
nonparametric bayes
s***e
发帖数: 830
24
你说的parametric是distribution的parametric吧?我觉得quantile还是设定了function的
parametrics。所以应该算semipara
m******y
发帖数: 266
25
Quantile和Parametric 或Non-parametric没什么必然联系。只不过把关注E(Y|X)的模
型,转为关注Q(Y|X)而已。譬如,把关注条件期望转到关注条件中位数。
一些Non-parametric的模型,用Quantile来分析要更好/容易interpret而已。譬如说A Chesher(2003)的Trianglar模型。
m***s
发帖数: 605
26
see
Rockafellar, R.T. and Uryasev, S., 2000, Optimization of conditional value-a
t-risk. J. Risk, 2, 21-41.
Rockafellar, R.T. and Uryasev, S., 2002, Conditional value-at-risk for gener
al loss distributions. J. Bank. Finance, 26(7) 1443-1471.
But I thought you were doing parametric CVaR. You have marginal and t-copula
. Everytime, you change the weights, your parametric CVaR should be differen
t from the non-parametric CVaR, no?
m***s
发帖数: 605
27
non-parametric means you dont have a parametrized distribution, except the e
mpirical distribution. You dont fit anything, just use the historical data.
parametric form, e.g. you fit the data with normal, and var=mu-2*sigma or cv
ar=mu-lambda*sigma. If it is normal distribution, this way the estimate is m
uch more efficient (smaller variance). However, you can not be sure this is
a normal distribution, you have two sources of errors: misspecification in m
odel and parameter uncertainty. You fit
J*****n
发帖数: 4859
28

理论上是对的。
不过在实际操作中,如果手头没有好的vol curve model,要求二阶导数,则是一个
illed pose problem。
如果有很好的vol curve model,则可以直接求导了。
前一个是non parametric,后一个是parametric。
我觉得第一种方法更加简单,但实际中,人们更加喜欢用parametric的model。
c**********e
发帖数: 2007
29
Use proc lifetime. It is the parametric approach.
proc reliability in SAS/QC is the same as proc lifetime
in SAS/STAT. Be careful for left censored case, one
of them requires left bound as 0 while the other requires
missing (use .).
For interval censored data, SAS only has parametric
approach. For other data, SAS has nonparametric, i.e.,
Kaplan-Meier (proc lifetest), and even more popular
semi-parametric approach. i.e., Cox regression (proc
phreg).
m******u
发帖数: 277
30
First, you need to know commonly used parametric, non-parametric and semi-
parametric methods. If you cannot remember, please go back to check your
notes.
Second, know some SAS procedures will be helpful, such as PROC LIFETEST,
PROC PHREG.
If you did a project before, know how to make a K-M curve and provide Log-
rank test is also very basic.
Hope that helps.
t*****a
发帖数: 459
31
来自主题: Statistics版 - Regression model 不用 test normality?
那些normality test往往结论不一致,而且每一种都不是业界公认的标准。有时候可以
用某个test看一眼,如果p<0.01就比较警惕,如果p=0.05左右但是看着数据分布和正太
差不远也还是可以当做正太的。有一些东西如果不是正太就要按non-parametric的方法
来处理,但是往往数据和正太差不远的时候non-parametric和parametric的结果也差不
多,所以不需要太纠结。
c****t
发帖数: 19049
32
来自主题: DataSciences版 - 求助:Bayesian入门
gelman的bda是大号经典没错但是出了名的难读难懂。等你从别的地方全学会了回头拿
这当reference可以。没基础的话看看jeff gill的bayesian methods吧
其实找工作刷题才是王道(不只是leetcode),进工业界干活不用懂这么多。多讨论面试
题更有用。统计版不让讨论面试题也是我开此版的主要原因之一。
另外mcmc是从理论物理来的。跟统计一根毛的关系都没有。真想学懂直接看yann lecun
有关energy based models的东东也许能明白的更快一些。我一向认为灌统计水的大谈
特谈bayesian,扯神马frequenists vs. bayesian probability,神马prior,
postorior,就是为了掩盖mcmc根本不是统计创造发明出来的事实。一般人从神马prior,
posteriror啊,bayesian probability啊学起,等你学到mcmc时早迷糊了。也就不会
多问了
mcmc是跟传统的maximum likelihood完全不同的体系。maximum likelihood说简单点就
是做优化。优化的思路就是求... 阅读全帖
c****t
发帖数: 19049
33
来自主题: DataSciences版 - 求助:Bayesian入门
gelman的bda是大号经典没错但是出了名的难读难懂。等你从别的地方全学会了回头拿
这当reference可以。没基础的话看看jeff gill的bayesian methods吧
其实找工作刷题才是王道(不只是leetcode),进工业界干活不用懂这么多。多讨论面试
题更有用。统计版不让讨论面试题也是我开此版的主要原因之一。
另外mcmc是从理论物理来的。跟统计一根毛的关系都没有。真想学懂直接看yann lecun
有关energy based models的东东也许能明白的更快一些。我一向认为灌统计水的大谈
特谈bayesian,扯神马frequenists vs. bayesian probability,神马prior,
postorior,就是为了掩盖mcmc根本不是统计创造发明出来的事实。一般人从神马prior,
posteriror啊,bayesian probability啊学起,等你学到mcmc时早迷糊了。也就不会
多问了
mcmc是跟传统的maximum likelihood完全不同的体系。maximum likelihood说简单点就
是做优化。优化的思路就是求... 阅读全帖
Y********d
发帖数: 1478
34
同意你对functional form的批评,但是parametric model比non-parametric model 好
表述,成本就是potential mis-specification。
z******n
发帖数: 8851
35
注:不是我写的,这是两年前我从别的网站上扒下来存的,分享给大伙,请不要转。。。
如何自制消音伴奏 by 东海
原唱MP3找不到的情况比较少,歌曲伴奏找不到却是常有的事情,尤其是一些通俗老歌
,要么没有伴奏,要么是以前VCD格式下粗糙的单声道伴奏,或者LD盘粗重的主旋律捣
乱。怎么办?自己试试消音。具体的消音原理这里不提了,大家GOOGLE一下就可以找到
,我只说我自己是如何制作消音伴奏的。前提,PC上安装了CE2.1(2.0)加上至少
Ultrafunk fx插件。BBE和WAVES我在消音时没有用到。
消音伴奏我常用的方法分两种,一种是CE自己带的,在Effects->Amplitude->Channel
Mixer,选vocal cut,通过调整New Left Channel和New Right Channel的百分比来控制
原声的保留程度。原唱制作得比较精良的,左右声道伴奏混音又不多的,可以用100%消
,否则伴奏损失惨重。那时需要消到大约90%处(具体要听出来的效果)。另一种是
DirectX->Untrafunk FX->Phase->Presets,Sontius:fx-... 阅读全帖
d****n
发帖数: 1637
36
//please skip if you think it is too simple
download link:
http://ben.klemens.org/pdfs/gsl_stats.pdf
Preface xi
Chapter 1. Statistics in the modern day 1
PART I COMPUTING 15
Chapter 2. C 17
2.1 Lines 18
2.2 Variables and their declarations 28
2.3 Functions 34
2.4 The debugger 43
2.5 Compiling and running 48
2.6 Pointers 53
2.7 Arrays and other pointer tricks 59
2.8 Strings 65
2.9 ¸ Errors 69
Chapter 3. Databases 74
3.1 Basic queries 76
3.2 ¸ Doing more with queries 80
3.3 Joins and sub... 阅读全帖
w*x
发帖数: 518
37
来自主题: Programming版 - 开源软件的机遇来了
1. 同意,我也是WPS粉,觉得很好用!但是问题不是这个软件本身,而是老板都用MS
Office. 举个例子,他修订过的文档,用的是Word 2013 + Mendeley插入引用文档;变
成WPS或者LibrOffice以后,Mendeley插件的格式变了,双栏变单栏的现象屡见不鲜。
文档一次两次我还可以手动整理,反复来回改10次的文本我就崩溃了……
所以根本问题不在哪个软件好,而是在,公司/学校的环境下,别人用什么,有点儿逼
着我用什么……
不过,谢谢推荐,我现在平时自己写一般的文档就用Linux,只是需要老板修改的东西
还是放到了MS下面写,这样兼容:)
再PS……我特别喜欢latex和beamer, 虽然老板不用……
2. Linux下面的CAD真的很多吗?我搜了一个晚上,觉得现在二维软件不少,三维建模
中可用的也就是Blender和FreeCAD——但是这个Blender不能用来机械制造,因为
raster的数据格式精度不够,机械设计必须要Parametric的;Parametric的我看到说最
好的就是FreeCAD,但是现在assembly模块还没有做出来,没法装配,所以... 阅读全帖
a*****e
发帖数: 1700
38
来自主题: Programming版 - oop还是跟fp是对立的
纠正一下你的概念,parametric polymorphism 是指将 type 作为参数,通常理解为
forall 就可以了。
type class 是 ad-hoc polymorphism,是在 parametric 的基础上加上类型类(
typeclass)的限制,简单理解可以是把 typeclass 当作是 java class,类型的
instance 定义当作是 java sub-class 定义。都说了,和 java class 实现差别不大
,如果你认为差别很大,请举个具体例子。
D**g
发帖数: 739
39
来自主题: Biology版 - 请教一个简单的数据统计问题
第一,你得确认试验数据符合正态分布,如果每组样本量很小,或者有文献说response
value不是正态的,应该用non-parametric方法或者把原始数据做transformation.最
常见的是取对数,然后用ANOVA.不然,应该用ANOVA的non-parametric version:
Kruskal Wallis test
第二,ANOVA或者K-W test 如果p-value > 0.05, POST HOC pairwise test 就可以免
了。因为前面一个p>0.05的意思就是:考虑进multiple comparison的因素并调整TYPE
I 错误(没有区别却错误地认为有区别的概率)以后,没有任何一对比较会是显著的。
有很多方法调整multiple comparison,但前面的p保证了无论你用什么方法,没有一种
会给你一个显著的比较结果。
第三,如果p-value <0.05, 就值得做pairwise的比较。最简单的是用0.05/所有可能的
比较总数作为显著性CUT OFF值。如果你前面用的K-W test, 这里应该用Wilcoxon-Mann
-
d*******a
发帖数: 518
40
来自主题: Biology版 - 请教一个简单的数据统计问题
t-test 的assumption里面,按照重要性递减是
independent >> equal variance > normality
as long as normality is not very much violated, e.g. heavily skewed, then t-
test is well approximated.
More skewed a sample, more sample size is needed.

会不会认同?
时候,t test逼近z test,对normality假设轻度或者中度的violation可以容忍,是指
该test在大样本的时候还能给出相对可靠的结论,不等于说t
还怎么t-test? 对于right skewed data还可以做对数变换,我怎么动不动建议用u-
test?不是你说要用不带假设的test么?那只好non-parametric 了,parametric都带
假设。
tendency, Variance/STD--measure of dispersion, 这都对normality分布的数据才有
意义。举个
s*****0
发帖数: 357
41
来自主题: Biology版 - 请教一个简单的数据统计问题
行了,别死鸭子嘴硬了,就把你那句话“t test 不假设 underlying distribution is
normal."记着跟Dashagen复述一下,看看能不能共鸣。
还有学统计别一叶障目,光明白一个t test就来大谈假设不假设。parametric
statistic都是基于distribution assumption,没有了这个assumption,还能叫
parametric test?至于后来发现很多test对轻度的non-nomarlity以及unequal
variance有一定程度的容忍,那是test的robustness,跟statstic原本需要符合的应用
条件并不排斥,不能因为test robust就掘弃normality assumption了。
还有自己的发言自己有点信心,不用捎上无辜的shagen同学做垫背,我跟他关于统计的
交流很多,知道他的深浅。说他不会认同你的看法不为无由。明天他回这个版,你不妨
跟他好好谈谈。要说他的理论应该很强,刚毕业什么都热呼着,要说他的应用还尚浅,
原因还是因为他刚毕业,也许以后会很强。可以问问他本人,我有没有资格这
s*****0
发帖数: 357
42
如果处理的是independent group, parametric test原则上要求每个组的observation接近正太分布, 而且有个equal variance假设,即各组的stdev也要相近. 如果原始数据不满足这些条件, 可以考虑data transformation. 理论上log transformation是最佳选择,因为也只有log的特性,才能将estimation无论是mean还是stdev有意义的transform回来.但log transformation不是万能良药, 有些情况下不适用,有些情况下transform了也未必一定能解决问题 (课后题: positive skewed和 negative skewed哪个适用log transformation?).这时候non-parametric就粉墨登场了.
如果处理的是paired group而非independent group, 每组observation本身并不需要符合normality,但有另外一种特殊的normality要求, 猜猜看?
从来没想到会在Student's t test上耗费如
p*****m
发帖数: 7030
43
没有 呵呵 我觉得现在压根就没有什么robust的方法硬性的告诉你应该用parametric o
r non-parametric,肉眼看自己的raw data应该是最方便的选择

whiteney
s*****0
发帖数: 357
44
说正题以前,先胡扯几句,算是给已经转了统计或者正在转统计的朋友们提个醒。我这
是杂谈贴,不是劝退。偶尔隔壁统计版逛逛,如今正在向生物版靠拢,成为劝退的大本
营。以前是SAS大本营,原本已经很悲哀了,现在有赶超我版的苗头。归根到底就一个
问题,就是现在的行情统计好不好找工作。我要去隔壁说统计很多availability,估计
立刻会被砖头拍死,为什么?因为大部分在版的job seeker都是fresh,又没有经验又
要身份支持,哪怕有一千个机会, 这么一stratify,也剩不了几个,而且广大的老印兄
弟还虎视眈眈。
其时学统计的时候必须要弄清楚一个问题,应用统计的关键在于应用,大部分转统计的
人都不会去搞methodology念PhD,而是期望靠统计找份工作。但当你工作后就会明白,
统计只是一个工具,工作的经验有一部分讲究的是你对统计工具的娴熟,但更看重的是
你在行业里累积的经验。比如在药厂里搞生统,当你写SAP的时候会去理解一个
therapeutic area,在银行里建模,你会去理解各种各样的风险模型信用模型。你以后
改resume跳槽,真正值得突出的是这些经验,而会什么mult... 阅读全帖
t******s
发帖数: 55
45
来自主题: Biology版 - 如何做meta analysis?
如果A集中显著,B集中不显著,那就再费点脑子,massage一下数据(
晕,碰运气呢,听说生物系的人不是要学一门统计的么
Generally speaking, there are two ways to perform meta-analysis,by combining
effect sizes (parametric method) or combining significance levels (non-parametric
method). For each method, the statistic for meta-analysis was selected based
on the null. For example, if the null is that no genes are differentially
expressed in all studies vs all genes are DE genes, then the maximum p-value
statistic can be used to combine p-values.
Anyway, y
f*****y
发帖数: 464
46
来自主题: Biology版 - qPCR结果的统计分析
本人统计学得粗浅,关于qPCR分析想请教大牛们:
1.如果5组treatment数据,每组4个samples. 是选择直接做non-parametric如kruskal-
Wallis test好,还是先确定是normal distribution然后做one-way ANOVA更容易被
reviewer接受?ANOVA的p-value似乎总是更好看一些。
2.给这些数据做post-hoc test,到底有什么讲究?Duncan, LSD, Tukey等这些是不是哪
个好看就选哪个?另外non-parametric test的post-hoc用SAS怎么做呢?
2.本人想做一个gene expression time-course, 5个时间点,每个时间点只有4个
sample。我计划就是先做个ANOVA,然后做个LSD做post-hoc,根据post-hoc来说明表达高
峰在那个时间。这样合理吗?
提前谢谢指点。
n******7
发帖数: 12463
47
来自主题: Biology版 - 请教一个P值稳定性的问题
想了一会儿,你说的例子应该是的,不过CI有两个值,跟pv+fold-change 可以替换也不奇怪
各种test都会用到 parametric 和 non-parametric 都有
最近主要做enrichment的分析,用Fisher exact test
一般就报告一下pvalue和relative enrichment
但是就像主贴说的,当sample比较少的时候,pv很不稳定。这时候就需要一个比较大的
RE来保证观察到enrichment是有意义的。往往需要一个pv的cutoff和一个RE的cutoff来
保证这一点。
我看到一些其他方案。比如DAVID算GO enrichment的时候,把实际有某个GO注释的基因
数减一,这样算出的Pvalue是个保守的估计
l***y
发帖数: 4671
48
说要用chi-square的,先把统计模型写出来,明确统计变量到底是谁,再把chi-square
的assumption列出来。先把问题想清楚,不要乱套公式。
明知道chi-square是parametric的还出这种主意,要么就是你不知道什么叫做
parametric,要么就是故意用错误的假设检验来混p-values。
o*****p
发帖数: 2977
49
你这数据肯定应该是显著的。Two-sample Kolmogorov-Smirnov test 因为是non-
parametric,不考虑 scale,所以你数据点 1 上的显著差异在 pValue 上不能体现出
来。chi-square 则不然。
你要是懂这些话 (或者懂Kolmogorov-Smirnov test 是怎么做的,为什么是non-
parametric),就知道选择chi square 不是 “掩耳盗铃。取最有利于自己假设的结果
”,而是完全正当的。

p
o*****p
发帖数: 2977
50

对不起,我前面的说法是错的。(说chi-squ是parametric, 说KS 是non-parametric
所以不够powerful)
我模拟了一下你的数据,发现用KS test应该是很显著的。
做法应该是这样,不是用你的百分比,而是类似前面有人提议,把每个细胞的foci数
作为一个数据,这样你就有两组,每组200个数据,用这两组数据做ks test,结果应该
是显著的。
1 2 3 4 5 6 7 8 9 下页 末页 (共9页)