由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - missing data imputation
相关主题
question about multiple imputation of not normally distributed variable帮朋友post一个SAS问题,求高人指点。多谢各位了!
大家平时怎么处理missing data?请教做过Multiple Imputation 的牛牛们
工作中的一个correlation analysis的问题。missing values imputation
"Missing data" "intent-to-treat" "repeated measure"面试时关于如何处理missing data的回答
longitudinal的data,missing data 一般都怎么处理?真心请教: data cleaning
[合集] 如果我有很多missing data>50%In MI procesure, propensity score only handles monotone missing data?
对于Mixed Linear Model, 如何处理missing covariates?关于power analysis的应用(healthcare industry)
missing data questionswhat is factor, what is covariant in SPSS
相关话题的讨论汇总
话题: imputation话题: missing话题: race话题: data话题: deck
进入Statistics版参与讨论
1 (共1页)
z**********i
发帖数: 12276
1
医院level的race DATA,比如,white, 85%, no-white, 15%.
2004, race, 74% missing. 比如, 200个医院, only 52个医院有RACE的信息,其他148个医
院没有.
2005, race, 50% missing
2006, race, 14% missing
2007-2009, race, no missing
2004-2006的DATA是否可用,常用什么imputation method?
多谢回复!!
z**********i
发帖数: 12276
2
原来读过2片missing data的文章,实在是只知道皮毛.

【在 z**********i 的大作中提到】
: 医院level的race DATA,比如,white, 85%, no-white, 15%.
: 2004, race, 74% missing. 比如, 200个医院, only 52个医院有RACE的信息,其他148个医
: 院没有.
: 2005, race, 50% missing
: 2006, race, 14% missing
: 2007-2009, race, no missing
: 2004-2006的DATA是否可用,常用什么imputation method?
: 多谢回复!!

m******u
发帖数: 277
3
LOCF
propensity score
predictive mean matching
^_^
d******9
发帖数: 134
4
lz这些data是做什么用的呢?
我最近做的一个project,用来match patients的若干covariates中有些也有missing
data. 我的advisor说用mean imputation既可,我有几个covariates有大约25%的
missing,他说这样的比例不能用imputation了。具体的threshold或者其他详细的
guideline我也不清楚,等其他人来解释吧。
z**********i
发帖数: 12276
5
想做点disparity的分析。
race在最初2年,很多missing,后来,好了很多.
有2篇文章介绍,geocoding和surname来填补missing,可能以后会试试。
basic imputation methods: case complete,locf,mean.
后来,有hot deck imputation, multiple imputation.
我也没有经验,具体在实际中该用什么,不太清楚。

【在 d******9 的大作中提到】
: lz这些data是做什么用的呢?
: 我最近做的一个project,用来match patients的若干covariates中有些也有missing
: data. 我的advisor说用mean imputation既可,我有几个covariates有大约25%的
: missing,他说这样的比例不能用imputation了。具体的threshold或者其他详细的
: guideline我也不清楚,等其他人来解释吧。

z**********i
发帖数: 12276
6
多谢回复!

【在 m******u 的大作中提到】
: LOCF
: propensity score
: predictive mean matching
: ^_^

z**********i
发帖数: 12276
7
http://support.sas.com/documentation/cdl/en/statug/63033/HTML/d
race 是nominal,是不是该用Discriminant Function Method?
而不是propensity score?
完全是门外汉。

【在 m******u 的大作中提到】
: LOCF
: propensity score
: predictive mean matching
: ^_^

c********d
发帖数: 253
8
Propensity score will create large bias when data is not monotone missing.So
I don't recommend that approach. A lot of methods can be used in your case
if you only have one missing variable, such as hot-deck, predictive mean
matching using a logistic model. You can also use multivariate probit model
for your case since race is nominal. By using multivariate probit model, it'
s easy to develop MCMC algorithm to do multiple imputation.
z**********i
发帖数: 12276
9
多谢回复!
我看到有的用hot deck,hot deck multiple imputation.感觉,他们是不同的。
没坐果的,就是莫不着头脑。

So
case
model
it'

【在 c********d 的大作中提到】
: Propensity score will create large bias when data is not monotone missing.So
: I don't recommend that approach. A lot of methods can be used in your case
: if you only have one missing variable, such as hot-deck, predictive mean
: matching using a logistic model. You can also use multivariate probit model
: for your case since race is nominal. By using multivariate probit model, it'
: s easy to develop MCMC algorithm to do multiple imputation.

c********d
发帖数: 253
10
hot deck是multiple imputation的一种,当然你也可以用hot deck做single
imputation,不过不推荐。
z**********i
发帖数: 12276
11
记得哪个地方比较hot deck 和 multiple imputation?
有的地方说hot deck multiple imputation.
把我搞糊涂拉.
多谢回复!

【在 c********d 的大作中提到】
: hot deck是multiple imputation的一种,当然你也可以用hot deck做single
: imputation,不过不推荐。

1 (共1页)
进入Statistics版参与讨论
相关主题
what is factor, what is covariant in SPSSlongitudinal的data,missing data 一般都怎么处理?
问大家一个propensity score matching 的问题[合集] 如果我有很多missing data>50%
How to deal with the NULL value?对于Mixed Linear Model, 如何处理missing covariates?
请教怎么用PCA capture pairwise covariance (with missing vamissing data questions
question about multiple imputation of not normally distributed variable帮朋友post一个SAS问题,求高人指点。多谢各位了!
大家平时怎么处理missing data?请教做过Multiple Imputation 的牛牛们
工作中的一个correlation analysis的问题。missing values imputation
"Missing data" "intent-to-treat" "repeated measure"面试时关于如何处理missing data的回答
相关话题的讨论汇总
话题: imputation话题: missing话题: race话题: data话题: deck