Day2 简单线性回归模型
导入库
matplotlib 绘图库 pyplot 常用的强大的绘图模块
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
读数据 拆因果
dataset = pd.read_csv('studentscores.csv')
X = dataset.iloc[ : , : 1].values
Y = dataset.iloc[ : , 1].values
将数据拆成 训练集 和 测试集
from sklearn.model_selection import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=1/4, random_state=0)
使用线性回归模型来训练
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor = regressor.fit(X_train, Y_train)
可视化↓↓↓
scatter是根据x,y值画点
plt.scatter(X_train, Y_train, color='red', label='train data')
plt.scatter(X_test, Y_test, color='green', label='test data')
plot是画线 predict预言或预测
这条线是根据 X_train(因 自变量 学习时间) 和 regressor.predict(X_train)(果 因变量 分数 这里是预测分数)
plt.plot(X_train, regressor.predict(X_train), color='blue')
plt.show()
补一张截图
红点训练集 绿点测试集 蓝线训练预测拟合
网友评论