由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - PCA 可以用在mixture of continuous 和categorical variables (转载)
相关主题
有没有大牛来classifiy一下 PCA用法吗?求教linear regression的一道面试题
怎么处理categorical variable有很多个level的请教一个用R做cox regression的问题
问个R的问题我现在有一个15个variable的回归模型。 有什么系统性的方法去
Project :advertersiment click prediction紧急求救: SMOTE-NC 处理categorical data for unbalanced class!!!
请问这样的数据应该用什么样的模型适合。这样的数据怎么处理
求助 信息提取 (转载)[Data Science Project Case]Future Income predicting
feature selection的方法求教怎么online update model
大家对于有很多value的categorical feature都怎么处理?转发一个RECRUITER给的工作机会
相关话题的讨论汇总
话题: pca话题: variables话题: mixture话题: continuous
进入DataSciences版参与讨论
1 (共1页)
E**********e
发帖数: 1736
1
【 以下文字转载自 Statistics 讨论区 】
发信人: ExpressoLove (MoneyForNothing), 信区: Statistics
标 题: PCA 可以用在mixture of continuous 和categorical variables
发信站: BBS 未名空间站 (Sun May 17 18:03:19 2015, 美东)
据我了解, pca用在continous variables 比较合理。categorical one怎计算
covariance matrix啊?
E**********e
发帖数: 1736
2
没有人回答吗? machine learning 不是必学的内容吗?

【在 E**********e 的大作中提到】
: 【 以下文字转载自 Statistics 讨论区 】
: 发信人: ExpressoLove (MoneyForNothing), 信区: Statistics
: 标 题: PCA 可以用在mixture of continuous 和categorical variables
: 发信站: BBS 未名空间站 (Sun May 17 18:03:19 2015, 美东)
: 据我了解, pca用在continous variables 比较合理。categorical one怎计算
: covariance matrix啊?

s*********a
发帖数: 2623
3
categorical 是covariance 咯?是不是应该用anova?如果你又有continuous 也有
categorical的话在SAS下用GLM咯?
你PCA是用在MATLAB里的?
我也不是很懂。不对的话大家多多打击
E*********g
发帖数: 185
4
我看如果categorical variable量化之后有意义的话,勉强也能用。

【在 E**********e 的大作中提到】
: 没有人回答吗? machine learning 不是必学的内容吗?
E**********e
发帖数: 1736
5
说到categorical variable, 一般已经是numerical categorical了(1,2,3,。。。
)。 textbook 好像很少讲到mixture的continuous 和 categorical variables。 事
实是很多时候modeling的时候, 都是mixture。 这种情况用pca来降维或者找出
significant的variabels是不是就有问题。
当然也许可以试correspendse analysis, 就是把continous variable group, 然后
用contigency table来找出关联。但是也很少说用了选significant variabels。
问这个问题是因为面试是碰到这个问题。 所以pca来选variables的话,好像不是那么
可信。 lasso也许是个更好方法。

【在 E*********g 的大作中提到】
: 我看如果categorical variable量化之后有意义的话,勉强也能用。
b******x
发帖数: 826
6
covariance is the solution of PCA, not the motivation of PCA
the motivation is a low-rank matrix factorization
when the approximation error is measured in squared errors we get back PCA
other approximation error can be used for categorical variables

【在 E**********e 的大作中提到】
: 说到categorical variable, 一般已经是numerical categorical了(1,2,3,。。。
: )。 textbook 好像很少讲到mixture的continuous 和 categorical variables。 事
: 实是很多时候modeling的时候, 都是mixture。 这种情况用pca来降维或者找出
: significant的variabels是不是就有问题。
: 当然也许可以试correspendse analysis, 就是把continous variable group, 然后
: 用contigency table来找出关联。但是也很少说用了选significant variabels。
: 问这个问题是因为面试是碰到这个问题。 所以pca来选variables的话,好像不是那么
: 可信。 lasso也许是个更好方法。

i**********n
发帖数: 217
7
肯定可以用, 怎么定义difference between categorical variables,怎么interpret
results,要看具体问题了

【在 E**********e 的大作中提到】
: 说到categorical variable, 一般已经是numerical categorical了(1,2,3,。。。
: )。 textbook 好像很少讲到mixture的continuous 和 categorical variables。 事
: 实是很多时候modeling的时候, 都是mixture。 这种情况用pca来降维或者找出
: significant的variabels是不是就有问题。
: 当然也许可以试correspendse analysis, 就是把continous variable group, 然后
: 用contigency table来找出关联。但是也很少说用了选significant variabels。
: 问这个问题是因为面试是碰到这个问题。 所以pca来选variables的话,好像不是那么
: 可信。 lasso也许是个更好方法。

E**********e
发帖数: 1736
8
我的问题是用pca 来选signifiant variabales。 好像还没看到pca可以适合
categorial variables的。 昨天问了老师,答案也是negative, 倒是提了
correspondse analysis。 不过不是用来variables selections的。
比如一个binary variable(0,1), 难道可以用PCA来算它的variance的大小, 从而
确定看在total variance占的比例大小决定保留还是剔除。
我的一个想法是把categorial 和continouous 分开, 分开分析从而确定significant
varialbes

interpret

【在 i**********n 的大作中提到】
: 肯定可以用, 怎么定义difference between categorical variables,怎么interpret
: results,要看具体问题了

e********9
发帖数: 444
9
这里有讨论,也给了几个link
楼主介意给大家总结一下吗?谢谢!:)
http://stats.stackexchange.com/questions/5774/can-principal-com
1 (共1页)
进入DataSciences版参与讨论
相关主题
转发一个RECRUITER给的工作机会请问这样的数据应该用什么样的模型适合。
计算 confidence interval 和 prediction interval的一般方法求助 信息提取 (转载)
大家电话面试都怎么准备的啊feature selection的方法求教
Another opening needs immediate fill-in (转载)大家对于有很多value的categorical feature都怎么处理?
有没有大牛来classifiy一下 PCA用法吗?求教linear regression的一道面试题
怎么处理categorical variable有很多个level的请教一个用R做cox regression的问题
问个R的问题我现在有一个15个variable的回归模型。 有什么系统性的方法去
Project :advertersiment click prediction紧急求救: SMOTE-NC 处理categorical data for unbalanced class!!!
相关话题的讨论汇总
话题: pca话题: variables话题: mixture话题: continuous