美文网首页
相关性分析-数据的特征

相关性分析-数据的特征

作者: 花生学生信 | 来源:发表于2023-12-24 14:46 被阅读0次

相关性分析是一种统计分析方法,用于确定两个或多个变量之间的关系强度和方向。它可以帮助我们理解变量之间的相互作用,并评估它们之间的线性关系。
进行相关性分析时,需要考虑数据类型、数据分布、数据缺失、异常值、样本量以及相关性类型等数据特征,以确保分析结果的准确性和可靠性。

相关分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个因素的的相关密切程度,相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。
相关性分析可以应用于各种领域,如经济学、市场营销、医学和社会科学等。通过进行相关性分析,人们可以确定两个变量之间是否存在关联,进而帮助做出决策和预测未来的趋势。
判断数据是否具有相关关系,最直观的方法就是绘制散点图

要判断多个数据的之间的关系,散点图的绘制就会显得比较繁琐,这时候要选择绘制散点矩阵


相关系数

相关系数衡量了两个变量的统一程度,范围是-1~1,‘1’代表完全正相关,‘-1’代表完全负相关。
比较常用的是Pearson‘皮尔逊’相关系数、Spearman‘斯皮尔曼’相关系数。
在R中,相关性分析的R包:
install.packages("corrplot")
下面用具体的例子来了解相关性的概念:

测试数据是 ggplot2 包中自带的 diamond 数据,每一行为一种钻石,每一列为钻石不同的属性,如 carat (克拉), cut (切工), color (色泽), clarity (透明度) 等。
首先绘制散点图,横轴是克拉数,纵轴是价格 (正相关)

dat=diamonds
qplot(carat,price,data=dat)

绘制散点图,对 x,y 值取 log,可以看出钻石的克拉数和价格是呈现正相关的。

qplot(log(carat),log(price),data=dat)
#颜色、大小、性状和其他属性的设置 
qplot(carat,price,data=dat,colour=color) 
# 后期应用 ggplot() 函数后,可以更加自由的绘制各种组合图形
qplot(carat,price,data=dat,geom=c("point","smooth"))# 添加了一条拟合曲线

相关文章

  • 数据挖掘 特征工程知识点总结

    Part1 特征选择 思路:每个特征方差分析、特征之间相关性分析、特征与目标输出之间相关性分析。 1)设置一个方差...

  • 03:6大监督学习模型:毒蘑菇分类

    数据EDA 可视化分析 特征工程 特征相关性 主成分分析PCA 模型1:逻辑回归 模型2:高斯朴素贝叶斯 模型3:...

  • 相关性分析,不能只看系数结果!

    在分析业务数据时,常通过相关性分析寻找与关键特征相关的变量,或者用相关性系数验证两组业务逻辑上应该强相关的变量。相...

  • GET 数据分析技巧

    本文从数据特征的分布分析、对比分析、统计分析、贡献度分析(帕累托分析)和相关性分析五大方面,识别数据分析的一些重要...

  • 相关性及PCA分析

    简要介绍相关性及PCA分析 1、 相关性分析 本次使用数据如下所示: 加载数据 相关性分析 结果如下 2、PCA分...

  • 相关性分析的TIPS

    相关性分析 tips:相关性分析不要局限在数值型数据和数值型数据之间(散点图),还有其他的相关性可供分析: 1.数...

  • 数据特征分析

    进入第四章的学习,数据特征分析。主要学习了分布分析,对比分析,统计分析,帕斯托分析,正态性检验以及相关性分析,主要...

  • 读书笔记-sklearn笔记

    本文是该系列读书笔记的第二章数据预处理部分 获取数据 数据的初步分析,数据探索 地理分布 数据特征的相关性 创建新...

  • 空间组数据和单细胞数据的相关性分析(Seurat)2022-05

    相似关键词 单细胞数据集相关性分析 空间组与单细胞数据集相关性分析 空间组数据集相关性分析 适用背景 近年来,单细...

  • 异常处理

    异常值检测特征分为类别特征和数字特征 数字特征 相关性分析、查看特征的偏度和峰度、数字特征相互之间的关系可视化、多...

网友评论

      本文标题:相关性分析-数据的特征

      本文链接:https://www.haomeiwen.com/subject/crafndtx.html