E**********e 发帖数: 1736 | 1 【 以下文字转载自 Statistics 讨论区 】
发信人: ExpressoLove (MoneyForNothing), 信区: Statistics
标 题: PCA 可以用在mixture of continuous 和categorical variables
发信站: BBS 未名空间站 (Sun May 17 18:03:19 2015, 美东)
据我了解, pca用在continous variables 比较合理。categorical one怎计算
covariance matrix啊? |
E**********e 发帖数: 1736 | 2 没有人回答吗? machine learning 不是必学的内容吗?
【在 E**********e 的大作中提到】 : 【 以下文字转载自 Statistics 讨论区 】 : 发信人: ExpressoLove (MoneyForNothing), 信区: Statistics : 标 题: PCA 可以用在mixture of continuous 和categorical variables : 发信站: BBS 未名空间站 (Sun May 17 18:03:19 2015, 美东) : 据我了解, pca用在continous variables 比较合理。categorical one怎计算 : covariance matrix啊?
|
s*********a 发帖数: 2623 | 3 categorical 是covariance 咯?是不是应该用anova?如果你又有continuous 也有
categorical的话在SAS下用GLM咯?
你PCA是用在MATLAB里的?
我也不是很懂。不对的话大家多多打击 |
E*********g 发帖数: 185 | 4 我看如果categorical variable量化之后有意义的话,勉强也能用。
【在 E**********e 的大作中提到】 : 没有人回答吗? machine learning 不是必学的内容吗?
|
E**********e 发帖数: 1736 | 5 说到categorical variable, 一般已经是numerical categorical了(1,2,3,。。。
)。 textbook 好像很少讲到mixture的continuous 和 categorical variables。 事
实是很多时候modeling的时候, 都是mixture。 这种情况用pca来降维或者找出
significant的variabels是不是就有问题。
当然也许可以试correspendse analysis, 就是把continous variable group, 然后
用contigency table来找出关联。但是也很少说用了选significant variabels。
问这个问题是因为面试是碰到这个问题。 所以pca来选variables的话,好像不是那么
可信。 lasso也许是个更好方法。
【在 E*********g 的大作中提到】 : 我看如果categorical variable量化之后有意义的话,勉强也能用。
|
b******x 发帖数: 826 | 6 covariance is the solution of PCA, not the motivation of PCA
the motivation is a low-rank matrix factorization
when the approximation error is measured in squared errors we get back PCA
other approximation error can be used for categorical variables
【在 E**********e 的大作中提到】 : 说到categorical variable, 一般已经是numerical categorical了(1,2,3,。。。 : )。 textbook 好像很少讲到mixture的continuous 和 categorical variables。 事 : 实是很多时候modeling的时候, 都是mixture。 这种情况用pca来降维或者找出 : significant的variabels是不是就有问题。 : 当然也许可以试correspendse analysis, 就是把continous variable group, 然后 : 用contigency table来找出关联。但是也很少说用了选significant variabels。 : 问这个问题是因为面试是碰到这个问题。 所以pca来选variables的话,好像不是那么 : 可信。 lasso也许是个更好方法。
|
i**********n 发帖数: 217 | 7 肯定可以用, 怎么定义difference between categorical variables,怎么interpret
results,要看具体问题了
【在 E**********e 的大作中提到】 : 说到categorical variable, 一般已经是numerical categorical了(1,2,3,。。。 : )。 textbook 好像很少讲到mixture的continuous 和 categorical variables。 事 : 实是很多时候modeling的时候, 都是mixture。 这种情况用pca来降维或者找出 : significant的variabels是不是就有问题。 : 当然也许可以试correspendse analysis, 就是把continous variable group, 然后 : 用contigency table来找出关联。但是也很少说用了选significant variabels。 : 问这个问题是因为面试是碰到这个问题。 所以pca来选variables的话,好像不是那么 : 可信。 lasso也许是个更好方法。
|
E**********e 发帖数: 1736 | 8 我的问题是用pca 来选signifiant variabales。 好像还没看到pca可以适合
categorial variables的。 昨天问了老师,答案也是negative, 倒是提了
correspondse analysis。 不过不是用来variables selections的。
比如一个binary variable(0,1), 难道可以用PCA来算它的variance的大小, 从而
确定看在total variance占的比例大小决定保留还是剔除。
我的一个想法是把categorial 和continouous 分开, 分开分析从而确定significant
varialbes
interpret
【在 i**********n 的大作中提到】 : 肯定可以用, 怎么定义difference between categorical variables,怎么interpret : results,要看具体问题了
|
e********9 发帖数: 444 | |