JTK_CYCLE算法的计算原理基于非参数统计方法,主要利用Kendall's tau相关系数来检测时间序列数据中的周期性模式。以下是其核心计算原理:
-
假设检验:
算法的核心是检验时间序列数据是否符合预定义的周期性模式。原假设是数据没有周期性,备择假设是数据具有特定的周期性模式。 -
参考模型:
算法使用余弦函数作为参考模型来表示理想的周期性模式。通过改变周期和相位,可以生成一系列参考模型。 -
Kendall's tau相关:
对于每个参考模型,算法计算数据与模型之间的Kendall's tau相关系数。Kendall's tau是一种非参数相关度量,衡量两个序列的单调关系。 -
Mann-Whitney U统计量:
Kendall's tau可以转换为等价的Mann-Whitney U统计量。这种转换允许更高效的计算。 -
精确分布计算:
算法使用Harding方法计算Mann-Whitney U统计量的精确空分布,这比使用渐近分布更准确,特别是对于小样本。 -
多重检验:
由于算法测试多个周期和相位组合,它使用Bonferroni校正来调整p值,控制家族误差率。 -
最优参数选择:
算法选择具有最小校正p值的周期和相位组合作为最佳拟合。 -
振幅和相位估计:
基于最佳拟合模型,算法估计周期性模式的振幅和相位。 -
高效计算:
算法使用了一些计算技巧来提高效率,如Shewchuk算法进行高精度数值计算,以及预计算某些值以加速重复分析。
这种方法的主要优势在于:
- 非参数性质使其适用于各种数据分布
- 能够处理不均匀采样和缺失数据
- 提供精确的统计显著性评估
- 能够同时检测多个可能的周期
总的来说,JTK_CYCLE通过系统地比较数据与一系列参考模型,并利用强大的统计方法,有效地识别和量化时间序列数据中的周期性模式。
网友评论