spark之通过sparksql中的SQL语句实现电影点评系统用户行为分析

时间：2020-06-29 00:44:59 阅读：129 评论：0 收藏：0 [点我收藏+]

标签：movies 时间戳 div span tin cup 职业 user 系统用户

用户文件users.dat的格式描述如下：

1. userid::gender::age::occupation::zip-code
2. 用户id、性别、年龄、职业、邮政编码

评级文件ratings.dat的格式描述如下：

1. userid::movieid::rating::timestamp
2. 用户id、电影id、评分数据、时间戳

电影文件movies.dat的格式描述如下：

1. movieid::title::genres
2. 电影id、电影名、电影类型

1、首先使用RDD方式读取数据

1、val usersRDD = sc.textfile(dataPath+"users.dat")
2、val moviesRDD = sc.textfile(dataPath+"movies.dat")
3、val occupationsRDD = sc.textfile(dataPath+"occupations.dat")
4、val ratingsRDD = sc.textfile(dataPath+"ratings.dat")

spark之通过sparksql中的SQL语句实现电影点评系统用户行为分析

标签：movies 时间戳 div span tin cup 职业 user 系统用户

原文地址：https://www.cnblogs.com/xiao02fang/p/13205663.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行