码迷,mamicode.com
首页 > 其他好文 > 详细

Kiggle:Digit Recognizer

时间:2017-08-02 10:05:02      阅读:128      评论:0      收藏:0      [点我收藏+]

标签:组成   数据转换   表示   取数据   nbsp   .com   pix   过程   target   

题目链接:Kiggle:Digit Recognizer

Each image is 28 pixels in height and 28 pixels in width, for a total of 784 pixels in total. 

  给的是28像素的高和宽,所以总共有784像素,在处理的过程中,先用PCA进行降维,对数据进行主要的特征分量;然后通过KNN(K-邻近算法)进行对测试数据的预测分类。

  对于PCA算法:主成分分析,是通过线性变质将原始数据转换程一组各维度无关的表示,可以用于提取数据的主要特征分量,用于高维数据的降维。

  步骤:

    1.将原始数据按行组成n行m列的矩阵X

    2.将X的每一行进行零均值化,即减去每一行的均值

    3.求出协方差矩阵

    4.求出协方差矩阵的特征值以及对应的特征向量

    5.将特征向量按对应特征值的大小从上到下按行排序,排列成矩阵,取前K行组成矩阵P

    6.Y=PX,即为降维到K维的数据

Kiggle:Digit Recognizer

标签:组成   数据转换   表示   取数据   nbsp   .com   pix   过程   target   

原文地址:http://www.cnblogs.com/chenyang920/p/7271901.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!