j*****n 发帖数: 1545 | 1 有一个向量是1200维的,有10个data。 怎么做PCA啊? 维数我觉得太高了。
看见有个人是这样做的, 本来是x*x',他用的是x'*x,这样的自相关矩阵只有10×10
维的,用这个去做 PCA, 得到的10*1的eigen_vector再用x去乘,又得到一个1200×1的
玩意。
这样有道理吗?eigenvalue最多就10个,很奇怪。 |
r****y 发帖数: 1437 | 2 PCA can be done to either dimension.
In your case, because you only have 10 data points, so
all trash for eigen values lower than the 10th one.
In another word, only 10-dimension is need to span your space
1200 is nothing. It seems you have not get the essence of PCA.
10
【在 j*****n 的大作中提到】 : 有一个向量是1200维的,有10个data。 怎么做PCA啊? 维数我觉得太高了。 : 看见有个人是这样做的, 本来是x*x',他用的是x'*x,这样的自相关矩阵只有10×10 : 维的,用这个去做 PCA, 得到的10*1的eigen_vector再用x去乘,又得到一个1200×1的 : 玩意。 : 这样有道理吗?eigenvalue最多就10个,很奇怪。
|
j*****n 发帖数: 1545 | 3 昨天研究了一下PCA.
10维并不能把不在这10个data里面的一个1200维的data表达出来啊。
eigenvector 应该是1200维的,两种方法的主要的10个eigenvalue是一样的.rank是10
,但是那个10维的eigenvector要通过某种变换(乘一个什么)得到正确的1200的
eigenvector.
我现在的问题是 我有一个1200维的数据 要投影到这个PCA上面去。如果只用10个
eigenvalue的话,投影之后再重建和原是数据差别太大。 如果用1200维的eigenvalue
就能投影之后正确的重建。 就是维数太高了。 |
r****y 发帖数: 1437 | 4 hehe, you still have not got it right.
10
eigenvalue
【在 j*****n 的大作中提到】 : 昨天研究了一下PCA. : 10维并不能把不在这10个data里面的一个1200维的data表达出来啊。 : eigenvector 应该是1200维的,两种方法的主要的10个eigenvalue是一样的.rank是10 : ,但是那个10维的eigenvector要通过某种变换(乘一个什么)得到正确的1200的 : eigenvector. : 我现在的问题是 我有一个1200维的数据 要投影到这个PCA上面去。如果只用10个 : eigenvalue的话,投影之后再重建和原是数据差别太大。 如果用1200维的eigenvalue : 就能投影之后正确的重建。 就是维数太高了。
|
c********g 发帖数: 530 | 5 try try the SVD of X,
plug the SVD of X into XX' and X'X, and make some comparison.
10
【在 j*****n 的大作中提到】 : 有一个向量是1200维的,有10个data。 怎么做PCA啊? 维数我觉得太高了。 : 看见有个人是这样做的, 本来是x*x',他用的是x'*x,这样的自相关矩阵只有10×10 : 维的,用这个去做 PCA, 得到的10*1的eigen_vector再用x去乘,又得到一个1200×1的 : 玩意。 : 这样有道理吗?eigenvalue最多就10个,很奇怪。
|
c***r 发帖数: 63 | 6 sample size too small
at most 10 vectors suffice to span the sample space
10
eigenvalue
【在 j*****n 的大作中提到】 : 昨天研究了一下PCA. : 10维并不能把不在这10个data里面的一个1200维的data表达出来啊。 : eigenvector 应该是1200维的,两种方法的主要的10个eigenvalue是一样的.rank是10 : ,但是那个10维的eigenvector要通过某种变换(乘一个什么)得到正确的1200的 : eigenvector. : 我现在的问题是 我有一个1200维的数据 要投影到这个PCA上面去。如果只用10个 : eigenvalue的话,投影之后再重建和原是数据差别太大。 如果用1200维的eigenvalue : 就能投影之后正确的重建。 就是维数太高了。
|