码迷,mamicode.com
首页 > 其他好文 > 详细

第四十五篇 入门机器学习——数据加载和简单的数据探索

时间:2018-07-16 13:57:37      阅读:179      评论:0      收藏:0      [点我收藏+]

标签:图片   探索   技术分享   访问   筛选条件   数据集   表示   http   数据保存   

 

 

No.1. 导入相关类库,并加载鸢尾花数据集

技术分享图片

 

No.2. 这个鸢尾花数据集类似于一个字典,可以查看都有哪些键

技术分享图片

 

No.3. ‘DESCR‘这个键对应的值为鸢尾花数据集的文档,简单对其进行查看

技术分享图片

从文档中我们可以了解到,这个数据集共保存了150个鸢尾花样本;每个样本包含4个特征:萼片长度、萼片宽度、花瓣长度、花瓣宽度;共分为三类鸢尾花:Iris-Setosa、Iris-Versicolour和Iris-Virginica等等信息

 

No.4. 通过‘data‘这个键,可以访问150个样本的数据

技术分享图片

很明显,这些数据保存在一个矩阵中,我们可以检查这个矩阵的形状

技术分享图片

150行4列,表示150个样本,每个样本有4个特征

 

No.6. 每个样本所属的鸢尾花类别,通过索引的方式保存在一个向量中,可以通过‘target‘这个键进行访问

技术分享图片

 

No.7. 相应的,每个索引所指代的鸢尾花名称保存在另一个向量中,可以通过‘target_names‘这个键进行访问

技术分享图片

 

No.8. 我们可以尝试选取鸢尾花的前两个特征绘制散点图

技术分享图片

 

No.9. 添加筛选条件,对不同种类的鸢尾花添加不同样式

技术分享图片

 

No.10. 我们再试着绘制鸢尾花的另外两个特征的散点图

技术分享图片

 

第四十五篇 入门机器学习——数据加载和简单的数据探索

标签:图片   探索   技术分享   访问   筛选条件   数据集   表示   http   数据保存   

原文地址:https://www.cnblogs.com/xuezou/p/9316976.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!