这里,我们介绍的是一个猫狗图像识别的一个任务。数据可以从kaggle网站上下载。其中包含了25000张毛和狗的图像(每个类别各12500张)。在小样本中进行尝试我们下面先尝试在一个小数据上进行训练,首先创建三个子集:每个类别各1000个样本的训练集、每个类别各500个样本的验证集和每个类别各500个 ...
分类:
其他好文 时间:
2019-02-21 16:09:57
阅读次数:
197
Evernote Export 比赛题目介绍 facebook想要准确的知道用户登录的地点,从而可以为用户提供更准确的服务 为了比赛,facebook创建了一个虚拟世界地图,地图面积为100km2,其中包含了超过1000000个地点 通过给定的坐标,以及坐标准确性,判断用户登录地点 训练集和测试集是 ...
分类:
其他好文 时间:
2019-02-20 11:30:18
阅读次数:
374
Toping Kagglers:Bestfitting,目前世界排名第一 Kaggle团队 |2018年5月7日 我们在排行榜上排名第一 - 这是两年前令人惊讶地加入该平台的竞争对手。Shubin Dai,他的朋友们更喜欢Kaggle或宾果游戏,他是一位住在中国长沙的数据科学家和工程经理。他目前领导 ...
分类:
其他好文 时间:
2019-02-20 10:02:12
阅读次数:
178
参与方式:https://github.com/apachecn/hbase doc zh/blob/master/CONTRIBUTING.md 整体进度:https://github.com/apachecn/hbase doc zh/issues/1 项目仓库:https://github.c ...
分类:
其他好文 时间:
2019-02-15 10:22:26
阅读次数:
208
上周一个叫 Abhishek Thakur 的数据科学家,在他的 Linkedin 发表了一篇文章 Approaching (Almost) Any Machine Learning Problem,介绍他建立的一个自动的机器学习框架,几乎可以解决任何机器学习问题,项目很快也会发布出来。 这篇文章迅 ...
分类:
其他好文 时间:
2019-01-19 18:46:39
阅读次数:
278
A Data Science Framework: To Achieve 99% Accuracy https://www.kaggle.com/ldfreeman3/a-data-science-framework-to-achieve-99-accuracy/notebook 额,总共花了2天时 ...
分类:
系统相关 时间:
2019-01-18 20:37:46
阅读次数:
268
以kaggle上的House Prices: Advanced Regression Techniques为例讲述线性回归 1、回归模型 (1)一般线性回归:Linear Regression without regularization (2)岭回归:Linear Regression with ...
分类:
其他好文 时间:
2019-01-13 21:14:38
阅读次数:
170
使用python进行数据处理的实例(数据为某公司HR部门关于员工信息的部分摘录,kaggle上面的一次赛题) https://www.kaggle.com/c/kfru dbm hr analytics 该实例是根据其他所给属性预测员工是否会离职,代码实现如下所示 来源:https://blog.c ...
分类:
编程语言 时间:
2019-01-06 17:58:26
阅读次数:
172
在很长的一段时间里,我们表现出缺乏创造力,所做出的工作被认为是山寨、借鉴,这一点是不可否认,但随着自身的积累,厚积薄发,完成了从借鉴到创造的突破。创造力是我们工作的基本要素之一,这点在各行各业都显得很重要,在机器学习领域也无所例外。 创建特征也需要创造力,因此本文在这里列出了我日常生活中的一些想法, ...
分类:
其他好文 时间:
2019-01-05 21:33:47
阅读次数:
195
1.信用卡欺诈预测案例 这是一道kaggle上的题目。 我们都知道信用卡,能够透支一大笔钱来供自己消费,正因为这一点,不法分子就利用信用卡进一特... ...
分类:
编程语言 时间:
2018-12-31 20:20:51
阅读次数:
243