集成学习 集成学习通过构建并结合多个学习器来完成学习任务。 集成学习的思路是通过合并多个模型来提升机器学习性能,这种方法相较于当个单个模型通常能够获得更好的预测结果。这也是集成学习在众多高水平的比赛如奈飞比赛,KDD和Kaggle,被首先推荐使用的原因。 分类 用于减少方差的bagging 用于减少 ...
分类:
其他好文 时间:
2019-11-16 12:16:46
阅读次数:
70
概念:机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测。 数据集的构成 : 1、Kaggle:大数据竞赛平台、数据真实、数据量大 2、UCI:收录了360个数据集、覆盖了科学生活经济等多个领域、 3、scikit-learn:数据量小、方便学习 ...
分类:
其他好文 时间:
2019-11-11 21:21:28
阅读次数:
81
最近准备做项目,需要在kaggle上下载数据集,但注册时遇到了无法显示验证图片信息的问题,我也是通过百度最终找到解决方法,所以就准备记录下来啦;下面是解决步骤: step1:下载Google访问助手 附链接:https://www.lanzous.com/GoogleDownUrl step2:解压 ...
分类:
其他好文 时间:
2019-11-03 12:23:55
阅读次数:
603
深度学习严重依赖训练数据量的大小,前面(https://www.cnblogs.com/zhengbiqing/p/11070783.html)只随机抽取猫狗图片各1000、500、200分别作为训练、验证、测试集,即使采用了数据增强,精度只达到83%。 采用kaggle 猫狗数据集全部25000张 ...
分类:
其他好文 时间:
2019-10-31 00:26:23
阅读次数:
145
对于Kaggle手机验证码无效问题,作者之前也遇到过同样的问题,问题在于需要梯子,关于梯子怎么弄请自行百度。下面就简要说明一下梯子准备好以后的具体步骤。 在验证码验证界面,进行验证时候,要进行人机验证,如果你没有人机验证的点击验证,说明你还没有弄好梯子,所以继续加油!人机验证以后,就可以输入你要接受 ...
分类:
移动开发 时间:
2019-10-14 10:49:10
阅读次数:
158
最近学习了一下ResNet50模型,用其跑了个Kaggle比赛,并仔细阅读了其Keras实现。在比赛中,我修改了一下源码,加入了正则项,激活函数改为elu, 日后的应用中也可以直接copy 使用之。 ResNet50 的结构图网上已经很多了,例如这篇博文:https://blog.csdn.net/ ...
分类:
Web程序 时间:
2019-10-08 23:51:56
阅读次数:
264
最近做Kaggle的图像分类比赛:RSNA Intracranial Hemorrhage Detection (https://www.kaggle.com/c/rsna-intracranial-hemorrhage-detection/overview)以及阅读Yolov3 源码的时候接触到深 ...
分类:
其他好文 时间:
2019-10-04 09:20:58
阅读次数:
453
Kaggle数据集:https://www.kaggle.com/datasets 亚马逊数据集:https://registry.opendata.aws/ UCI机器学习库:https://archive.ics.uci.edu/ml/datasets.html 谷歌的数据集搜索引擎:https ...
分类:
其他好文 时间:
2019-10-02 21:10:05
阅读次数:
105
最近周围的小伙伴们都在玩kaggle上进行的IEEE-CIS,作为经常“地震”的时序题,关于如何选取验证集的讨论自然也不少。究竟如何选择一个靠谱的线下验证集?关于这个问题,我也思考过很多,现在将一些见解与大家分享,抛砖引玉。 首先,我们要知道选择验证集的意义是什么。在做表格题时,经常参加比赛的人可能 ...
分类:
其他好文 时间:
2019-09-27 22:57:17
阅读次数:
91
https://blog.csdn.net/zpxcod007/article/details/80118580 制作A卡,申请评分卡 数据集:15万个样本,特征 主要预处理手段:缺失值,异常值,样本不平衡的处理,划分数据集,做分箱处理(离散化),将样本的每个特征都映射到WOE空间 之后建模,这里采 ...
分类:
其他好文 时间:
2019-09-11 11:29:33
阅读次数:
216