美文网首页
12黑色星期五回归模型预测

12黑色星期五回归模型预测

作者: Jachin111 | 来源:发表于2023-05-12 21:16 被阅读0次

导入库

import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
import seaborn as sns
import matplotlib.patches as mpatches
import matplotlib

plt.rcParams["font.sans-serif"]=["SimHei"]  #设置子体
plt.rcParams["axes.unicode_minus"] = False  #正常显示负号

import plotly.graph_objects as go
import plotly.express as px
from plotly.subplots import make_subplots
from plotly.offline import init_notebook_mode, iplot

plt.style.use("ggplot")
sns.set(context="notebook", 
        style="darkgrid",
        palette="colorblind", 
        font="sans-serif", 
        font_scale=1, 
        rc=None)

matplotlib.rcParams["figure.figsize"] = [8, 8]
matplotlib.rcParams.update({"font.size":15})
matplotlib.rcParams["font.family"] = "sans-serif"

from sklearn.impute import KNNImputer
from sklearn.model_selection import train_test_split

# 忽略notebook中的警告
import warnings
warnings.filterwarnings("ignore")

数据基本信息

df1 = pd.read_csv("train.csv")
df1.head()
image.png
df1.shape
image.png
columns = df1.columns
columns
image.png
df1.dtypes
image.png
# 不同字段类型的占比
df1.dtypes.value_counts().plot.pie(explode=[0.1, 0.1, 0.1], autopct="%1.2f%%", shadow=True)
plt.title("type of our data")

plt.show()
image.png
# 字段基本信息
df1.info()
image.png
# 缺失值情况
df1.isnull().sum()
image.png

统计与可视化分析

# 性别分析
df2 = df1["Gender"].value_counts().reset_index()
df2
image.png
# 不同性别下的数量分布统计
colors = ["red", "blue"]

sns.countplot("Gender", data=df1, palette=colors)
plt.title("Gender Count")

plt.show()
image.png
# 不同性别下的数量占比统计
size = df1["Gender"].value_counts()

labels = ["Male", "Female"]
colors = ["#C4061D", "green"]
explode = [0, 0.1]

plt.rcParams["figure.figsize"] = (10, 10)
plt.pie(size,
       colors=colors,
       labels=labels,
       shadow=True,
       explode=explode,
       autopct="%.2f%%")

plt.title("Gender Percent", fontsize=20)
plt.axis("off")
plt.legend()
plt.show()
image.png

来源:尤而小屋

相关文章

  • 常见的时间序列算法

    MA模型:移动平均 AR模型:自回归,线性预测 ARMA模型:在自回归的基础上,增加阶级,高阶预测 GARCH模型...

  • Task1 - 3

    Task 1 线性回归 模型 线性回归用于回归预测,即预测一个连续的数值。一个n元线性回归模型 其中 是要模型学习...

  • 均方误差(MSE)与交叉熵(CEE)的区别

    mse用于线性回归,适用于预测数值,即回归问题模型;cee用于逻辑回归,适用于预测概率,即分类问题模型

  • 2018-12-02 机器学习打卡 朴素贝叶斯

    12课 朴素贝叶斯分类器——从贝叶斯定理到分类模型 分类模型 VS 回归模型 最根本的不同:前者是预测一个标签(类...

  • 数据科学34 |机器学习-回归预测和分类树预测

    使用回归模型预测 与许多机器学习算法相比,使用回归模型进行预测更易实现,更易解释,但在非线性方面拟合不佳。因此,通...

  • Linear Regression (线性回归)

    概述 线性回归是机器学习的一种回归模型,同时也是统计学中的回归模型。回归模型主要被用来预测真实值,相反分类问题主要...

  • Test Jianshu

    基于随机森林回归预测的风机预警模型开发

  • 回归专题-1 | 线线性回归基础

    回归专题-1 | 线线性回归基础 导读 ① 线性回归(又称线性模型),通过一个或者多个预测变量(X)来预测定量结局...

  • 初级算法梳理(二)任务2打卡

    逻辑回归与线性回归都属于广义线性回归模型,其区别与联系从以下几个方面比较: 分类与回归:回归模型就是预测一个连续变...

  • 三种回归模型对朝阳区房价预测的效果对比

    一:前言 利用上次爬取的朝阳区房价数据,通过简单线性回归模型、决策树回归模型、xgboost回归模型来进行房价预测...

网友评论

      本文标题:12黑色星期五回归模型预测

      本文链接:https://www.haomeiwen.com/subject/rxtkddtx.html