《机器学习及实践--从零开始通往Kaggle竞赛之路》 《机器学习及实践--从零开始通往Kaggle竞赛之路》 在开始说之前一个很重要的Tip:电脑至少要求是64位的,这是我的痛。 断断续续花了个把月的时间把这本书过了一遍。这是一本非常适合基于python入门的机器学习入门的书籍,全书通俗易懂且有代 ...
分类:
其他好文 时间:
2017-04-18 10:11:01
阅读次数:
450
《Python 机器学习及实践–从零开始通往kaggle竞赛之路》很基础 主要介绍了Scikit-learn,顺带介绍了pandas、numpy、matplotlib、scipy。 本书代码基于python2.x。不过大部分可以通过修改print()来适应python3.5.x。 提供的代码默认使用 ...
分类:
编程语言 时间:
2017-04-18 10:10:44
阅读次数:
1459
机器学习 1 linear regression 作业(二) 这个线性回归的作业需要上传到https://inclass.kaggle.com/c/ml2016-pm2-5-prediction 上面,这是一个kaggle比赛的网站。第一次接触听说这个东西,恰好在京东上有一本刚出来的关于这个的书《P ...
分类:
其他好文 时间:
2017-04-18 10:08:53
阅读次数:
304
机器学习二 逻辑回归作业 作业在这,http://speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2016/Lecture/hw2.pdf 是区分spam的。 57维特征,2分类问题。采用逻辑回归方法。但是上述数据集在kaggle中没法下载,于是只能用替代的方法了,下 ...
分类:
其他好文 时间:
2017-04-18 10:06:56
阅读次数:
260
曲线拟合多重共线性虚拟变量"导致的多重共线性在机器学习中的影响大吗?老师我在网上下的 kaggle 的数据解压失败了 老师重点讲解一下随机森林和SVM还有adaboost tensorflow 陈杰链接:http://pan.baidu.com/s/1i4PNJlr 密码:fz7e 简述一下多重共线 ...
分类:
编程语言 时间:
2017-04-10 23:30:46
阅读次数:
948
今天在kaggle上看到一个很好的数据集,想亲自进行处理,但是在将.csv格式文件转化为数据矩阵时就出现了问题,我在谷歌上查了下,发现了个很好用的东西和大家分享。那就是Numpy包里的genfromtxt。它可以很轻松的实现上述功能。 此函数的完整形式为: 今天先介绍几个一定会用到的属性: 1.fn ...
分类:
编程语言 时间:
2017-03-25 21:45:24
阅读次数:
187
项目介绍 项目地址:https://www.kaggle.com/fivethirtyeight/2016-election-polls 包含了2015年11月至2016年11月期间对于2016美国大选的选票数据,共27列。 项目目的:分析每个月的民意调查统计趋势。 涉及知识点: 高阶函数filte ...
分类:
编程语言 时间:
2017-03-12 23:30:45
阅读次数:
706
0,介绍 通过前面的特征分析,我们已经得到的想要的训练集和测试集,这样我们就可以利用这些训练集训练模型,并通过模型对测试集进行预测。我们得到的训练集和测试集结构如下所示。 1,几种基本模型 这里用的是sklearn库和xgboost,结果如下所示,需要注意的是为了防止过拟合,在这里我们对训练集进行划 ...
分类:
其他好文 时间:
2017-03-10 21:01:32
阅读次数:
1112
1.数据城堡 -- 猜你喜欢 2.数据城堡 -- 微额借款用户人品预测大赛 3.阿里天池 -- 需求预测与分仓规划 4.kaggle -- 14年CTR预测(GBDT+LR/FM) 5.魔镜 -- 风控 ...
分类:
其他好文 时间:
2017-02-20 17:31:45
阅读次数:
248