码迷,mamicode.com
首页 > 其他好文 > 详细

无监督学习——降维

时间:2018-11-04 12:40:23      阅读:183      评论:0      收藏:0      [点我收藏+]

标签:占用   height   技术分享   的区别   指标   数据   之间   降维   联系   

为什么要降维?

  • 维数少可以使算法有更快的计算速度,减少机器内存占用等
  • 多个特征携带的“信息”有相同或类似的情况(冗余)
  • 用于数据可视化

如何降维?

简单的例子,对于二位数据

技术分享图片

可以找到一条线

技术分享图片

将所有的数据映射到这条线上

技术分享图片

然后用映射后的一维数据去代表二位数据

技术分享图片

三维降维到二维的例子,假设数据如下

技术分享图片

这时,表征一个数据要用三维向量(x1, x2, x3)。如果找到一个平面

技术分享图片

并将所有的数据投影到这个平面

技术分享图片

这样数据就变为二维,原来的数据就可以用二维数据(z1, z2)代替

技术分享图片

技术分享图片

 


数据可视化例子

现有如下数据(不同国家的50个不同指标(GDP, Per capita GDP 等))

技术分享图片

但是这些数据不能直观的感受它们之间的区别与联系,如果将数据降维到二维,并用这二维数据去表征50维数据

技术分享图片

可以将这二维数据画出来,虽然说不出这二维数据(z1, z2)分别代表什么意思,但是,将他们画出来后可以比较直观的看到谁和谁是相似的(距离近),谁和谁是差别较大的。

技术分享图片

 

无监督学习——降维

标签:占用   height   技术分享   的区别   指标   数据   之间   降维   联系   

原文地址:https://www.cnblogs.com/qkloveslife/p/9903333.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!