Recently Kaggle hosted a competition on the CIFAR-10 dataset. The CIFAR-10 dataset consists of 60k 32x32 colour images in 10 classes. This dataset was ...
分类:
Web程序 时间:
2016-03-30 19:21:59
阅读次数:
433
今天把从Kaggle上下载下来的csv数据导入mysql,想做个统计分析,怎奈csv文件有些大。所以仅仅能用mysql 命令导入,现mark下,以备以后不时之需: 1. 导入: 基本的语法: load data [low_priority] [local] infile 'file_name txt
分类:
数据库 时间:
2016-03-01 22:16:46
阅读次数:
293
#学习 R 的方法知识和耐心,是成为强者的唯一方法。- 通过阅读来学习。包括了阅读经典的教材、代码、论文、学习公开课。- 通过牛人来学习。包括同行的聚会、讨论、大牛的博客、微博、twitter、RSS。- 通过练习来学习。包括代码练习题、参加kaggle比赛、解决实际工作中的难题。- 通过分享来学习...
分类:
编程语言 时间:
2015-11-03 12:26:25
阅读次数:
219
关于集成学习基础的简单描述什么是集成学习?集成建模是优化模型表现的一条重要途径。通常来说,将集成学习方法运用在你所构建的诸多模型之上是十分值得的,而同道中人们也一次又一次地证明着这一点。他们在诸如Kaggle之类的数据建模竞赛中往往会不约而同地采用集成学习,并且从中受益。集成学习其实是一个很宽泛的概...
分类:
其他好文 时间:
2015-08-20 22:09:35
阅读次数:
190
Kaggle入门——使用scikit-learn解决DigitRecognition问题@author: wepon@blog:http://blog.csdn.net/u0121626131、scikit-learn简单介绍scikit-learn是一个基于NumPy、SciPy、Matplotl...
分类:
其他好文 时间:
2015-08-17 11:57:53
阅读次数:
185
Titanic是kaggle上的一道just for fun的题,没有奖金,但是数据整洁,拿来练手最好不过。本文以 Titanic 的数据,使用较为简单的决策树,介绍处理数据大致过程、步骤注意,本文的目的,在于帮助你入门数据挖掘,熟悉处理数据步骤、流程决策树模型是一种简单易用的非参数分类器。它不需要对数据有任何的先验假设,计算速度较快,结果容易解释,而且稳健性强,对噪声数据和缺失数据不敏感。下面示范...
分类:
其他好文 时间:
2015-07-28 21:10:29
阅读次数:
163
软件版本:Hadoop2.6,MyEclipse10.0 , Maven 3.3.2源码下载地址:https://github.com/fansy1990/knn 。1. KNN算法思路:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本...
分类:
编程语言 时间:
2015-07-28 13:07:39
阅读次数:
220
最近做了不少的kaggle机器学习竞赛,总结除了一个经验:做好了feature enginering可以进到前百分之20,如果要进到前百分之10,那么就需要Ensemble method的支持了,所以最近专门深入了解了以下组合的各种方法。通过学习发现组合方法真的是屡试不爽,在竞赛的后期,黔驴技穷,走投无路之时,不妨试试组合方法,会让人豁然开朗,
组合历史提交答案
这是最简单的一种组合方法,只需...
分类:
系统相关 时间:
2015-07-26 14:17:37
阅读次数:
187
今天把从Kaggle上下载下来的csv数据导入mysql,想做个统计分析,怎奈csv文件有些大,所以只能用mysql 命令导入,现mark下,以备以后不时之需:1. 导入:基本语法:
load data [low_priority] [local] infile 'file_name txt' [replace | ignore]
into table tbl_name
[character set...
分类:
数据库 时间:
2015-07-15 09:31:50
阅读次数:
195
Kaggle Competition Past SolutionsWe learn more from code, and from great code. Not necessarily always the 1st ranking solution, because we also learn ...
分类:
其他好文 时间:
2015-07-11 21:19:21
阅读次数:
316