美文网首页SPSSAU数据分析入门教学
数据分析知识图谱- part3

数据分析知识图谱- part3

作者: spssau | 来源:发表于2019-09-26 10:50 被阅读0次

    11.多选题研究

    多选题分析可分为四种类型包括:多选题、单选-多选、多选-单选、多选-多选。

    多选题分析是针对单个多选题的分析方法,可分析多选题各项的选择比例情况

    单选-多选是针对X为单选,Y为多选的情况使用的方法,可分析单选和多选题的关系。

    多选-单选是针对X为多选,Y为单选的情况使用的方法。

    多选-多选是针对X为多选,Y为多选的情况使用的方法。

    12.聚类分析

    聚类分析以多个研究标题作为基准,对样本对象进行分类。

     

    如果是按样本聚类,则使用SPSSAU的进阶方法模块中的“聚类”功能,系统会自动识别出应该使用K-means聚类算法还是K-prototype聚类算法。

    如果是按变量(标题)聚类,此时应该使用分层聚类,并且结合聚类树状图进行综合判定分析。

    13.权重研究

    权重研究是用于分析各因素或指标在综合体系中的重要程度,最终构建出权重体系。权重研究有多种方法包括:因子分析、熵值法、AHP层次分析法、TOPSIS、模糊综合评价、灰色关联等。

    因子分析因子分析可将多个题项浓缩成几个概括性指标(因子),然后对新生成的各概括性指标计算权重。

    熵值法熵值法是利用熵值携带的信息计算每个指标的权重,通常可配合因子分析或主成分分析得到一级权重,利用熵值法计算二级权重。

    AHP层次分析法AHP层次分析法是一种主观加客观赋值的计算权重的方法。先通过专家打分构造判断矩阵,然后量化计算每个指标的权重。

    TOPSIS法TOPSIS权重法是一种评价多个样本综合排名的方法,用于比较样本的排名。

    模糊综合评价模糊综合评价是通过各指标的评价和权重对评价对象得出一个综合性评价。

    灰色关联灰色关联是一种评价多个指标综合排名的方法,用于判断指标排名。

    14.非参数检验

    非参数检验用于研究定类数据与定量数据之间的关系情况。如果数据不满足正态性或方差不齐,可用非参数检验。

    单样本Wilcoxon检验用于检验数据是否与某数字有明显的区别。

    如果X的组别为两组,则使用MannWhitney统计量,如果组别超过两组,则应该使用Kruskal-Wallis统计量结果,在SPSSAU中均属于通用方法的非参数检验

    如果是配对数据,则使用配对样本Wilcoxon检验

    如果要研究多个关联样本的差异情况,可以用多样本Friedman检验

    如果是研究定类数据与定量(等级)数据之间的差异性,还可以使用Ridit分析

    15.数据分布

    判断数据分布是选择正确分析方法的重要前提。

    正态性:很多分析方法的使用前提都是要求数据服从正态性,比如线性回归分析、相关分析、方差分析等,可通过正态图P-P/Q-Q图正态性检验查看数据正态性。

    随机性:游程检验是一种非参数性统计假设的检验方法,可用于分析数据是否为随机。

    方差齐性:方差齐检验用于分析不同定类数据组别对定量数据时的波动情况是否一致,即方差齐性。方差齐是方差分析的前提,如果不满足则不能使用方差分析。

    Poisson分布:如果要判断数据是否满足Poisson分布,可通过Poisson检验判断或者通过特征进行判断是否基本符合Poisson分布(三个特征即:平稳性、独立性和普通性)

    卡方拟合优度检验:卡方拟合优度检验是一种非参数检验方法,其用于研究实际比例情况,是否与预期比例表现一致,但只针对于类别数据。

    单样本T检验:单样本T检验用于分析定量数据是否与某个数字有着显著的差异性。

    更多干货内容可登录SPSSAU官网查看

    相关文章

      网友评论

        本文标题:数据分析知识图谱- part3

        本文链接:https://www.haomeiwen.com/subject/kinductx.html