码迷,mamicode.com
首页 > 其他好文 > 详细

18.Pandas实战,对电影数据进行分析

时间:2020-08-01 21:29:14      阅读:83      评论:0      收藏:0      [点我收藏+]

标签:sep   用户表   mic   tin   导致   eid   http   分表   suse   

第一步:读取三个表数据(用户表、评分表、电影表)
mnames=[‘MovieID‘,‘Title‘,‘Genres‘]
user_data = pd.read_table(r".\datas\movielens-1m\users.dat", sep=‘::‘, header=None, names=unames)

movie_data = pd.read_table(r".\datas\movielens-1m\movies.dat", sep=‘::‘, header=None, names=mnames)

Rnames=[‘UserID‘,‘MovieID‘,‘Rating‘,‘Timestamp‘]
rating_data = pd.read_table(r".\datas\movielens-1m\ratings.dat", sep=‘::‘, header=None, names=Rnames)

第二步:将三张表合并

根据共同的UserID进行合并,合并类型为outer,完成三张表的合并

user_rating=pd.merge(user_data,rating_data,left_on=‘UserID‘,right_on=‘UserID‘,how=‘outer‘)

根据共同的MovieID进行合并,合并类型为outer,完成第三张表合并

data=pd.merge(user_rating,movie_data,left_on=‘MovieID‘,right_on=‘MovieID‘,how=‘outer‘)

第三步:完成各项需求
技术图片

技术图片

技术图片
找到因性别,导致评价差异最大的电影。

18.Pandas实战,对电影数据进行分析

标签:sep   用户表   mic   tin   导致   eid   http   分表   suse   

原文地址:https://www.cnblogs.com/hisweety/p/13415850.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!