美文网首页
新2019计划:机器学习100天—简单线性回归【2】

新2019计划:机器学习100天—简单线性回归【2】

作者: 克里斯托弗的梦想 | 来源:发表于2019-03-05 21:52 被阅读0次

    本篇章主要是利用sklean建立一个简单的线性回归模型,然后利用matplotlib.pyplot 对结果进行图像化,里面知识点有对数据进行训练集、测试集划分,LR模型建立,可视化展示。
    模型数据如下:


    模型数据
    import pandas as pd
    import numpy as np
    import matplotlib.pyplot as plt
    # 导入相关数据
    dataset = pd.read_csv("../datasets/studentscores.csv")
    
    X = dataset.iloc[ : , : 1].values
    Y = dataset.iloc[ : , 1].values
    
    # 导入sklean库的cross_validation类来对数据进行训练集、测试集划分
    from sklearn.model_selection import train_test_split
    # 拆分数据,0.25份作为测试集
    
    X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=1/4, random_state=0)
    
    # 建立模型
    from sklearn.linear_model import LinearRegression
    # 使用训练集对模型进行训练
    regressor = LinearRegression()
    regressor = regressor.fit(X_train, Y_train)
    
    # 预测结果
    Y_pred = regressor.predict(X_test)
    
    # 训练集可视化
    # 散点图
    plt.scatter(X_train, Y_train, color = 'red')
    # 线图
    plt.plot(X_train, regressor.predict(X_train), 'bo-')
    plt.show
    
    # 测试集可视化
    #散点图
    plt.scatter(X_test , Y_test, color = 'red')
    #线图
    plt.plot(X_test ,Y_pred, 'bo-')
    plt.show()
    
    训练集可视化图片 测试集可视化图片

    相关文章

      网友评论

          本文标题:新2019计划:机器学习100天—简单线性回归【2】

          本文链接:https://www.haomeiwen.com/subject/busauqtx.html