1. 前言 & 160; & 160; & 160;本次代码是实现对自己的数据进行训练集、验证集和测试集划分,以及将三个集合制作成 .TFrecords 文件的实际操作,其中原始图片是 Kaggle 经典的猫狗大战的训练集中各抽出100章图片组合成的。 & 160; & 160; & 160;其中总 ...
分类:
其他好文 时间:
2018-05-18 14:25:37
阅读次数:
500
原kaggle比赛地址:https://www.kaggle.com/c/titanic 原kernel地址:A Data Science Framework: To Achieve 99% Accuracy 首先我们绘制出皮尔森系相关度的热力图,关于皮尔森系数可以翻阅资料,是一个很简洁的判断相关度 ...
分类:
其他好文 时间:
2018-05-10 17:17:22
阅读次数:
264
注:该部分参考kaggle房价模型的大神Pedro Marcelino提供的kernel 在我们拿到数据后,应该预先分析一下数据。 1、总览数据 通过以上可以对数据有大体的了解,会发现既有数值型数据,也有类别型数据。注意区别。 2、对特定列进行分析 and 偏度(skewness)也称为偏态、偏态系 ...
分类:
其他好文 时间:
2018-05-09 01:16:46
阅读次数:
249
通常,在Data Science中,预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用 "sklearn文档" 中的一些东西来说明,主要把各个标准化方法的应用场景以及优缺点总结概括,以来充当笔记。 首先,我要引用我自己的文章[Feature Preprocessing on Kaggle ] ...
分类:
其他好文 时间:
2018-05-01 23:57:12
阅读次数:
713
原kaggle比赛地址:https://www.kaggle.com/c/titanic 原kernel地址:A Data Science Framework: To Achieve 99% Accuracy 问题处理之前要知道的事: 数据科学框架(A Data Science Framework) ...
分类:
其他好文 时间:
2018-04-30 14:30:30
阅读次数:
204
使用python3 学习了线性回归的api 分别使用逻辑斯蒂回归 和 随机参数估计回归 对良恶性肿瘤进行预测 我把数据集下载到了本地,可以来我的git下载源代码和数据集:https://github.com/linyi0604/kaggle ...
分类:
编程语言 时间:
2018-04-29 11:57:55
阅读次数:
482
使用python语言 学习k近邻分类器的api 欢迎来到我的git查看源代码: https://github.com/linyi0604/kaggle ...
分类:
编程语言 时间:
2018-04-29 11:48:05
阅读次数:
250
使用python3 学习朴素贝叶斯分类api 设计到字符串提取特征向量 欢迎来到我的git下载源代码: https://github.com/linyi0604/kaggle ...
分类:
编程语言 时间:
2018-04-29 11:47:26
阅读次数:
224
使用python3 学习sklearn中支持向量机api的使用 可以来到我的git下载源代码:https://github.com/linyi0604/kaggle ...
分类:
编程语言 时间:
2018-04-29 11:45:15
阅读次数:
246
代码全部从Kaggle整理过来,仅做了一点点修改: 我在源码的基础上加了交叉验证提高了一点点分数。。。 ...
分类:
其他好文 时间:
2018-04-28 16:51:56
阅读次数:
197