标签:使用 下载 user 模型 个人 文档 应用技术 大数 计划表
一、选题与意义
1.Hadoop平台应用
2.Kaggle分析数据项目
简要说明理由与意义。
本人电脑硬件相对落后,对运行虚拟机以及处理大量数据方面并不友好,因此我选择第二项kaggle分析数据项目:泰坦尼克号的生存预测。
二、实践方案
简要说明理由。
下载准备好数据集,使用训练数据集对模型行进行训练,再用训练好的模型对测试集进行预测。
三、实践任务分解
根据所选的题目,明确实验步骤,分解任务到每天。
6.23:确定选题、下载数据
6.24:数据预处理
6.25~28:模型构建、训练、测试
6.29~30:模型应用
7.1:写文档
7.2:答辩
四、实践计划
按任务分解撰写计划表,每天按计划表开展工作。
第天根据实际情况更新计划表,有必要时调整。
1.
网站用户购物行为分析
官网:http://dblab.xmu.edu.cn/post/7499/
淘宝双11数据分析与预测
官网:http://dblab.xmu.edu.cn/post/8116/
电信用户行为分析
http://dblab.xmu.edu.cn/post/useranalysis/
大数据平台安装软件:
链接:https://pan.baidu.com/s/1lZM6BkZ6XoRE3uwepsQ_5A
提取码:ao1m
虚拟机镜像文件:
链接:https://pan.baidu.com/s/1e0qak_9Uymn_R1HmSu5ZLw
提取码:q0lt
2.
https://www.kaggle.com/competitions
说明:
个人项目,不要求组队,确实需要组队的说明理由。
边操作边记录;
每天完成当天文档;
最后综合成课程实践报告。
标签:使用 下载 user 模型 个人 文档 应用技术 大数 计划表
原文地址:https://www.cnblogs.com/rushB/p/13184314.html