标签:本地 article hive 用户行为分析 意义 淘宝 open 关系型数据库 分析
一、选题与意义
1.Hadoop平台应用
2.Kaggle分析数据项目
选择1.Hadoop平台应用,
理由:比较有兴趣
二、实践方案
步骤零:实验环境准备 | 查看实验指南 |
步骤一:本地数据集上传到数据仓库Hive | 查看实验指南 |
步骤二:Hive数据分析 | 查看实验指南 |
步骤三:将数据从Hive导入到MySQL | 查看实验指南 |
步骤四:利用Spark预测回头客 | 查看实验指南(Scala版) 查看实验指南(Python版) |
步骤五:利用ECharts进行数据可视化分析 | 查看实验指南 |
三、实践任务分解
四、实践计划
按任务分解撰写计划表,每天按计划表开展工作。
第天根据实际情况更新计划表,有必要时调整。
1.
大数据平台安装软件:
链接:https://pan.baidu.com/s/1lZM6BkZ6XoRE3uwepsQ_5A
提取码:ao1m
虚拟机镜像文件:
链接:https://pan.baidu.com/s/1e0qak_9Uymn_R1HmSu5ZLw
提取码:q0lt
标签:本地 article hive 用户行为分析 意义 淘宝 open 关系型数据库 分析
原文地址:https://www.cnblogs.com/201706120196y/p/13182468.html