机器学习中的参数：随机种子（random_state）

时间：2020-03-31 01:25:49 阅读：523 评论：0 收藏：0 [点我收藏+]

random_state是一个随机种子，是在任意带有随机性的类或函数里作为参数来控制随机模式。当random_state取某一个值时，也就确定了一种规则。

random_state可以用于很多函数，我比较熟悉的是用于以下三个地方：1、训练集测试集的划分 2、构建决策树 3、构建随机森林

1、划分训练集和测试集的类train_test_split

　　随机数种子控制每次划分训练集和测试集的模式，其取值不变时划分得到的结果一模一样，其值改变时，划分得到的结果不同。若不设置此参数，则函数会自动选择一种随机模式，得到的结果也就不同。

2、构建决策树的函数

clf = tree.DecisionTreeClassifier(criterion="entropy",random_state=30,splitter="random")

　　其取值不变时，用相同的训练集建树得到的结果一模一样，对测试集的预测结果也是一样的；

　　其值改变时，得到的结果不同；

　　若不设置此参数，则函数会自动选择一种随机模式，每次得到的结果也就不同。

3、构建随机森林

clf = RandomForestClassifier(random_state=0)

　　其取值不变时，用相同的训练集建森林得到的结果一模一样，对测试集的预测结果也是一样的；

　　其值改变时，建森林得到的结果不同；

　　若不设置此参数，则函数会自动选择一种随机模式，每次得到的结果也就不同。

总结：在需要设置random_state的地方给其赋一个值，当多次运行此段代码能够得到完全一样的结果，别人运行此代码也可以复现你的过程。若不设置此参数则会随机选择一个种子，执行结果也会因此而不同了。虽然可以对random_state进行调参，但是调参后在训练集上表现好的模型未必在陌生训练集上表现好，所以一般会随便选取一个random_state的值作为参数。

原文：https://www.cnblogs.com/simpleDi/p/9986198.html

机器学习中的参数：随机种子（random_state）

标签：决策树训练模式 tree 选择 log 构建 test stat

原文地址：https://www.cnblogs.com/wisir/p/12602460.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行