0 setup 配置文件 import pandas as pd pd.plotting.register_matplotlib_converters() import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns ...
分类:
其他好文 时间:
2020-05-16 12:12:08
阅读次数:
63
中国五城市六年pm2.5大数据可视化 一,典型课题研究 中国五城市六年的pm2.5的值与那些因素有关,与PM2.5的变化 二,数据 1,数据源:https://www.kaggle.com/uciml/pm25-data-for-five-chinese-cities 2,数据集介绍 Context ...
分类:
其他好文 时间:
2020-05-14 01:07:54
阅读次数:
243
文章目录 4. Pipelines 管道5. Cross-Validation 交叉验证上一篇:【Kaggle】Intermediate Machine Learning(缺失值+文字特征处理) 4. Pipelines 管道 该模块可以把数据前处理+建模整合起来 好处: 更清晰的代码:在预处理的每 ...
分类:
系统相关 时间:
2020-05-13 23:37:13
阅读次数:
108
exercise1 首先下载.csv文件的数据集,该数据集是基于如下背景: In this notebook, we'll work with a dataset of historical FIFA rankings for six countries: Argentina (ARG), Braz ...
分类:
其他好文 时间:
2020-05-10 21:24:49
阅读次数:
88
随机森林算法学习最近在做kaggle的时候,发现随机森林这个算法在分类问题上效果十分的好,大多数情况下效果远要比svm,log回归,knn等算法效果好。因此想琢磨琢磨这个算法的原理。 要学随机森林,首先先简单介绍一下集成学习方法和决策树算法。下文仅对该两种方法做简单介绍(具体学习推荐看统计学习方法的 ...
分类:
编程语言 时间:
2020-04-30 11:36:53
阅读次数:
113
采用lightGBM模型 准备数据与训练 calendar.csv数据集导入。 该数据数聚包含物品的售卖时间与物品类型 date: The date in a “y-m-d” format. wm_yr_wk: The id of the week the date belongs to. week ...
分类:
其他好文 时间:
2020-04-27 13:19:07
阅读次数:
143
M5比赛 M5竞赛是M竞赛中最新的一次,将于2020年3月2日至6月30日举行。它与前四届竞赛有五个重要方面的差异,其中一些是M4竞赛的讨论者提出的。 它使用沃尔玛慷慨提供的分层销售数据,从商品级别开始,再汇总到美国三个地理区域(加利福尼亚州,德克萨斯州和威斯康星州)的部门,产品类别和商店。 除时间 ...
分类:
其他好文 时间:
2020-04-26 17:13:32
阅读次数:
490
比赛介绍 这是M5预测挑战赛的两个互补比赛之一。你能尽可能准确地估计沃尔玛在美国销售的各种产品的单位销售额吗?如果你对估计同一系列已实现值的不确定性分布感兴趣,一定要查看它的竞争对手 一家商店一年内每月能卖多少露营用具?对于外行来说,在这个水平上计算销售额似乎和预测天气一样困难。这两种预测都依赖科学 ...
分类:
其他好文 时间:
2020-04-26 16:59:39
阅读次数:
155
数据集网站收集(持续更新) 1.Kaggle: "https://www.kaggle.com/" 可以按关键字搜索数据集 自带讨论区 有热心群众分享自己的Kernel,可供参考(热心群众们自己对数据的分析代码) 2.天池: "https://tianchi.aliyun.com/competiti ...
分类:
Web程序 时间:
2020-04-14 00:31:38
阅读次数:
89
Kaggle入门: https://zhuanlan.zhihu.com/p/80182734 精读论文: 精读深度学习论文(23) MTCNN https://zhuanlan.zhihu.com/p/38520597 人脸识别入门: https://www.zhihu.com/question/ ...
分类:
其他好文 时间:
2020-04-13 11:57:08
阅读次数:
71