码迷,mamicode.com
首页 > 其他好文 > 详细

12_PCA之探究用户对物品类别的喜好细分降维

时间:2019-10-24 12:01:53      阅读:143      评论:0      收藏:0      [点我收藏+]

标签:rtm   合并   col   idt   art   过程   nts   背景   red   

案例:

  探究:用户对物品类别的喜好细分降维。

技术图片技术图片

 技术图片

 

 背景:把用户分成几个类别,分类的依据是用户购买了哪些物品。

   先看商品products.csv数据,有product_id,product_name,aisle_id,department_id

   接着看订单order_products.csv,有order_id,product_id,add_to_cart_order,reordered

   再看orders.csv,有order_id,user_id 

   最后看aisles.csv,有aisle_id,aisle

         技术图片

分析:从分类的依据用户和物品,说明这张表中要有user_id和product_id,可以根据它们相同的字段来进行合并,最后合并成一个表,表里面含有用户和物品。

   合并表需要用到pandas中的merge,

 

推荐使用jupyter编译:

这里测试代码的时候出现了Memory Error的问题,此时数据600MB左右,却爆出了内存不足的异常,是因为python编译器默认对于超过2GB数据会提示这个异常,可以通过去python官网上下载64位python解释器来解决这个问题,注意是64位!!!下载过程很简单,登录官网,看不懂英文可以使用QQ或者谷歌浏览器的翻译功能。

技术图片

 

 技术图片

 

 技术图片

 

 技术图片

 

 注:上面的n_components=0.9表示,取源特征的90%,通常n_components取值0.9~0.95,也可以取整数表示选择多少个特征值,但是不推荐使用整数。

 

  

 

12_PCA之探究用户对物品类别的喜好细分降维

标签:rtm   合并   col   idt   art   过程   nts   背景   red   

原文地址:https://www.cnblogs.com/cwj2019/p/11728449.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!