Python数据分析与机器学习9-Seaborn之多变量分析

作者: 只是甲 | 来源:发表于2022-07-11 10:04 被阅读0次

Python数据分析与机器学习9-Seaborn之多变量分析
机器学习实战-数据探索(变量变换、生成)
机器学习实战-数据探索(异常值处理)
python数据分析第三方库有哪些?这些不能忘！
无标题文章
无标题文章
6决策树应用
阿里云助理工程师（ACA）考证
机器学习实战
8月新书 | 本月新书抢鲜看

一. 多变量分析概述

观测两个变量之间的分布关系最好用散点图

代码1:

import numpy as np
import pandas as pd
from scipy import stats, integrate
import matplotlib.pyplot as plt
import seaborn as sns

sns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))

x = np.random.gamma(6, size=200)

mean, cov = [0, 1], [(1, .5), (.5, 1)]
data = np.random.multivariate_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=["x", "y"])

sns.jointplot(x="x", y="y", data=df)

plt.show()

测试记录1:

image.png

代码2:

import numpy as np
import pandas as pd
from scipy import stats, integrate
import matplotlib.pyplot as plt
import seaborn as sns

sns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))

x = np.random.gamma(6, size=200)

mean, cov = [0, 1], [(1, .5), (.5, 1)]
x, y = np.random.multivariate_normal(mean, cov, 1000).T
with sns.axes_style("white"):
    sns.jointplot(x=x, y=y, kind="hex", color="k")

plt.show()

测试记录2:

image.png

二. 多变量分析实例

2.1 数据集概述

我们这边使用鸢尾花数据集:

数据集包含150个样本（数据集的行）
数据集包含4个属性（数据集的列）：Sepal Length，Sepal Width，Petal Length，Petal Width：‘feature_names’
利用numpy.ndarray存储这150x4的数据：‘data’
分类标签取自array[‘Setosa’，‘Versicolour’，‘Virginica’]：‘target_names’
Setosa，Versicolour，Virginica是数据集所包含的3中品种的鸢尾花
这3个分类标签（即150x1数据）用np.ndarray存储：‘target’

总之，这个数据存储了150x4的特征数据和150x1的分类标签，其中特征数据又放在‘data’里，分类标签放在‘target’里

2.2 实例

代码:

import matplotlib.pyplot as plt
import seaborn as sns

iris = sns.load_dataset("iris")
sns.pairplot(iris)

plt.show()

print ("test")

测试记录:
鸢尾花数据集总共有4个变量，4*4=16，所以直接生成了16个图
如果是柱形代表自身与自身

image.png

参考：

https://study.163.com/course/introduction.htm?courseId=1003590004#/courseDetail?tab=1

网友评论

本文标题：Python数据分析与机器学习9-Seaborn之多变量分析

本文链接：https://www.haomeiwen.com/subject/lllsbrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Python数据分析与机器学习9-Seaborn之多变量分析

一. 多变量分析概述

二. 多变量分析实例

2.1 数据集概述

2.2 实例

参考：

相关文章

Python数据分析与机器学习9-Seaborn之多变量分析

机器学习实战-数据探索(变量变换、生成)

机器学习实战-数据探索(异常值处理)

python数据分析第三方库有哪些?这些不能忘！

无标题文章

无标题文章

6决策树应用

阿里云助理工程师（ACA）考证

机器学习实战

8月新书 | 本月新书抢鲜看

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读