码迷,mamicode.com
首页 > 其他好文 > 详细

13_数据的划分和介绍之sklearn数据集

时间:2019-10-25 20:19:08      阅读:133      评论:0      收藏:0      [点我收藏+]

标签:新闻   离散   png   desc   mode   信息   下载   测试   load   

1.

 

 案例1:鸢尾花(分类数据集,数据离散)

# 鸢尾花
from sklearn.datasets import load_iris

li = load_iris()
# 获取特征值
print(li.data)
# 获取目标值
print(li.target)
# 获取描述
print(li.DESCR)

获取描述信息:鸢尾花的属性,类别(属于那种鸢尾花)

技术图片

 

鸢尾花的训练值和测试集

# 鸢尾花
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
li = load_iris()
# # 获取特征值
# print(li.data)
# # 获取目标值
# print(li.target)
# # 获取描述
# print(li.DESCR)
# # 数据集进行分割

# 注意返回值,训练集train x_train,y_train    测试集 test   x_test,y_test
x_train , x_test, y_train , y_test  = train_test_split(li.data,li.target,test_size=0.25)

print("训练集的特征值和目标值",x_train,y_train)
print("测试集的特征值和目标值",y_test,y_test)

 

 案例2:新闻组类别(分类数据集,数据离散)

from sklearn.datasets import fetch_20newsgroups
news = fetch_20newsgroups(subset=‘all‘)
print(news.data)
print(news.target)

注:fetch_20newsgroups,会从网上下载大约14MB的数据集

 

案例3:波士顿房价(回归数据集,数据连续)

from sklearn.datasets import load_boston

lb = load_boston()
print("获取特征值")
print(lb.data)
print("获取目标值") print(lb.target)
print("获取描述信息")
print(lb.DESCR)

 

技术图片

 

13_数据的划分和介绍之sklearn数据集

标签:新闻   离散   png   desc   mode   信息   下载   测试   load   

原文地址:https://www.cnblogs.com/cwj2019/p/11731266.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!