码迷,mamicode.com
首页 > 其他好文 > 详细

scikit-learn内置数据集

时间:2018-11-08 23:21:21      阅读:429      评论:0      收藏:0      [点我收藏+]

标签:dig   版本   样本   人工   alt   二分   bubuko   size   learn   

scikit-learn 现在最新稳定版本为0.20.0

提供了以下几个数据集

技术分享图片

其中数据路径都在sklearn包下的datasets/data目录下

下面我分别介绍每个数据集

iris

iris是个多类别数据集,每个类别下有50个样本,特征4维,且都是实数类型, 适用于分类模型

技术分享图片

boston

预测boston房价, 都是实数特征,总共13维, 适用于回归模型

技术分享图片

 

digits

数据由8*8的图片组成,共64维特征,0-9共10个类别,适用于分类模型

技术分享图片

 

toy

toy数据6*2, 共2维特征, 两类, 适用于简单的二分类

技术分享图片

 

clf_small

clf共14维特征,0,1两类别,适用于简单二分类模型

技术分享图片

 

reg_small

共14维特征, 适用于简单回归模型

技术分享图片

 

multilabel

人工制造的30*10维的多标签数据

技术分享图片

 

sparse-pos

技术分享图片

 

sparse-neg

技术分享图片

 

sparse-mix

zeros

scikit-learn内置数据集

标签:dig   版本   样本   人工   alt   二分   bubuko   size   learn   

原文地址:https://www.cnblogs.com/energy1010/p/9932420.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!