python库sklearn中的一些函数（更新ing...）

时间：2018-12-25 13:15:04 阅读：203 评论：0 收藏：0 [点我收藏+]

sklearn是python的重要机器学习库，其中封装了大量的机器学习算法，如：分类、回归、降维以及聚类；还包含了监督学习、非监督学习、数据变换三大模块。sklearn拥有完善的文档，使得它具有了上手容易的优势；它内置了大量的数据集，节省了获取和整理数据集的时间。因而，使其成为了广泛应用的重要的机器学习库。

学习连接：http://www.cnblogs.com/lianyingteng/p/7811126.html

下面是自己用到的一些函数：

1. train_test_split

　　这个函数是用来将总的数据集划分为训练集和测试集的

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=4)

参数：

　　1. X - 特征集

　　2. y - 标签集

　　3. 0-1之前表示的测试集占比，整数的话表示测试集样本数

　　4. 随机数种子，为1的话表示每次产生随机数一样

2. to_categorical(y, num_classes=None, dtype=‘float32‘)

　　将整形标签转为onehot

Y_train = np_utils.to_categorical(y_train, nb_classes)
Y_test = np_utils.to_categorical(y_test, nb_classes)

　　参数：

　　1. int数组

　　2. 标签类别总数

python库sklearn中的一些函数（更新ing...）

标签：type tar http href 函数时间优势 www. div

原文地址：https://www.cnblogs.com/yqs-0705/p/10173177.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行