e*****8 发帖数: 30 | 1 请教:一个sample为200人的调查问卷,现在要分析问卷中的一个问题,即一个
variable, 如果当另一个variable取某个特定的值,就不要该作答人的信息,请问应
该用什么具体的code: if then? 还是用set 建立一个新的data set ? 或者类似
filter的语句? 多谢! |
P****D 发帖数: 11146 | 2 你说的“不要该作答人的信息”到底是什么意思?是下面两个例子中哪一种?
假如说有一个针对女性的问卷,其中一个问题是“你生育过吗?”,下一个问题是“如
果生育过,第一次生育是什么时候?”可能有未育女子看错第二个问题,而胡乱写下一
个日期。如果当“你生育过吗?”variable为否的时候,需要将生育时间variable置为
missing(这是data cleaning中非常基本的一步)。如果你需要的是这种,那么if-
then正合适。
假如有一个男女受试者都有的问卷,现在你想分析所有男受试者的年龄。如果当性别
variable为女的时候,你就不需要该受试者的年龄信息。如果你需要的是这种,那么用
where statement合适。 |
e*****8 发帖数: 30 | 3 我的情况是这样的,一个问题(variable)是:你是否随便做答调查问卷? 0 表示不
是,1表示是。当这个variable 取1 的时候,就表示这个作答人胡乱做的,提供的信息
不准确,当分析其他variable的时候就不考虑这个人的信息,相当于不要这个
observation.
现在是在data cleaning 阶段阿,应该是你说的第一种情况?但这样的话是不是就人为
的增加了missing number数量? 又一想你说的第二种情况也好像符合阿?
非常感谢参与讨论!!
【在 P****D 的大作中提到】 : 你说的“不要该作答人的信息”到底是什么意思?是下面两个例子中哪一种? : 假如说有一个针对女性的问卷,其中一个问题是“你生育过吗?”,下一个问题是“如 : 果生育过,第一次生育是什么时候?”可能有未育女子看错第二个问题,而胡乱写下一 : 个日期。如果当“你生育过吗?”variable为否的时候,需要将生育时间variable置为 : missing(这是data cleaning中非常基本的一步)。如果你需要的是这种,那么if- : then正合适。 : 假如有一个男女受试者都有的问卷,现在你想分析所有男受试者的年龄。如果当性别 : variable为女的时候,你就不需要该受试者的年龄信息。如果你需要的是这种,那么用 : where statement合适。
|
P****D 发帖数: 11146 | 4 居然有这么奇葩的问题……你们设计问卷的人是怎样的一朵人儿啊!
你的这种情况,要是我的话,就把所有variable=0的放到一个data set里,后续的任何
分析都只用这个data;所有variable=1的放到一个data set里,只作存档之用。至于没
回答这个问题的……你看着办吧。 |
g*********r 发帖数: 2847 | 5 I have done something similar by rolling them over into one variable with 3
possible values: -1(not reliable), 0(no) and 1(Yes) |