g***i 发帖数: 1972 | 1 project要求对一个样本做sampling weight和unrespond weight。
我的问题是关于unrespond weight
instruction里面要求用marrital status, mother's education, mother's age 之类
的变量来衡量unrespond weight
这个样本的取样strata是race,就分为白人和黑人两种。一共分8次取了8个小样本,联
合起来总共有1600多个observation。
我的想法是对每一个batch做unrespond weight,因为每一次取样的时候的response可
能都会不同。
基本上是做一个logistic regression,model应该是左边是finish(有没有完成调查)
,右边是各种控制变量。
我的问题是,要不要把strata的变量race也放到右边去呢。
我理解的是能够估计出unresponse probability,然后1/p就是unrespond weight,我
的理解对马?
不过有人告诉我用surveylogistic和surveyfreq来做,我不是很明白这个意思。
请高手指教 | d******o 发帖数: 59 | 2 先把名词用对:
是nonresponse weighting吧。
那个unresponse probability,应该是response propensity.
如果instruction没有提到race,你算response propensity不需要加入race.
如果你只是要reponse propensity,你不需要用特别的survey procdure,就用普通的
logistic就好。
你的nonresponse weights就是1/response propensity.
我不明白的是,你这是什么意思
“这个样本的取样strata是race,就分为白人和黑人两种。一共分8次取了8个小样本,
联合起来总共有1600多个observation。
我的想法是对每一个batch做unrespond weight,因为每一次取样的时候的response可
能都会不同。”
你要针对每个batch,作一次模型,然后有8个不同的response propensity的模型吗 |
|