标签:state from 维数 orm sele 元素 span 特征 存在
线性回归(又名普通最小二乘法)
import mglearn from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split # X.shape->(60,1) # y.shape->(60,) # X是一个二维数组,包含60个元素,每个元素是一个一维数组,每个数组里包含4个元素;y是一个一维数组,包含60个元素 X, y = mglearn.datasets.make_wave(n_samples=60) #将数据分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42) #构建模型 lr = LinearRegression().fit(X_train, y_train) #斜率w,保存在coef_,是一个numpy数组 print("lr.coef_: {}".format(lr.coef_)) #截距b,保存在intercept_,是一个浮点数 print("lr.intercept_: {}".format(lr.intercept_)) #训练集性能 print("Training set score: {:.2f}".format(lr.score(X_train, y_train))) #测试集性能 print("Test set score: {:.2f}".format(lr.score(X_test, y_test)))
输出:
lr.coef_: [ 0.39390555] lr.intercept_: -0.031804343026759746 Training set score: 0.67 Test set score: 0.66
斜率0.4,截距-0.03,训练精度0.67,测试精度0.66。训练精度过低,只有一个特征,模型过于简单,欠拟合
标签:state from 维数 orm sele 元素 span 特征 存在
原文地址:https://www.cnblogs.com/longzhankunlun/p/12495096.html