标签:数据 课程 时间 hadoop 数据集 分布 kaggle 机器 jpg
一、选题与意义
1.Hadoop平台应用
2.Kaggle分析数据项目
简要说明理由与意义。
二、实践方案
三、实践任务分解
根据所选的题目,明确实验步骤,分解任务到每天。
四、实践计划
按任务分解撰写计划表,每天按计划表开展工作。
第天根据实际情况更新计划表,有必要时调整。
1、选题:淘宝双11数据分析与预测
我选Hadoop平台应用-淘宝双11数据分析与预测
因为自己机器学习的基础不是很牢固,所以不敢贸然选第二题,再加上从没接触过kaggle,时间比较紧。所以就选了自己较为熟悉的hadoop平台应用
2、实践方案:在自己电脑上搭建伪分布式Hadoop平台,安装相关的软件,对数据集进行处理和分析,以及进行可视化和行为预测
3、实践任务分解:(如下图)
4、实践计划
按任务分解撰写计划表,每天按计划表开展工作。
根据实际情况更新计划表,有必要时调整。
标签:数据 课程 时间 hadoop 数据集 分布 kaggle 机器 jpg
原文地址:https://www.cnblogs.com/veccchan/p/13184279.html