美文网首页
时序聚类

时序聚类

作者: venuslf | 来源:发表于2019-09-30 16:30 被阅读0次

方法使用参见官方文档:
https://tslearn.readthedocs.io/en/latest/gen_modules/tslearn.clustering.html#module-tslearn.clustering

from tslearn.clustering import GlobalAlignmentKernelKMeans, TimeSeriesKMeans, KShape
from tslearn.metrics import sigma_gak
from tslearn.preprocessing import to_time_series_dataset
from tslearn.generators import random_walks

def cluster_method(x, method, max_iter, n_cluster=3, seed=100):
    if method == 'KShape':
        x = TimeSeriesScalerMeanVariance(mu=0., std=1.).fit_transform(x)  #数据标准化
        model = KShape(n_clusters=n_cluster, max_iter=max_iter, n_init=1, random_state=seed).fit(x)
    elif method == 'KMeans_euclidean':
        model = TimeSeriesKMeans(n_clusters=n_cluster, metric="euclidean", max_iter=max_iter,
                      random_state=seed).fit(x)
    elif method == 'KMeans_dtw':
        model = TimeSeriesKMeans(n_clusters=n_cluster, metric="dtw", max_iter=max_iter, 
                                 max_iter_barycenter=100,random_state=seed).fit(x)
    elif method == 'KMeans_softdtw':
        model = TimeSeriesKMeans(n_clusters=n_cluster, metric="softdtw", max_iter=max_iter, 
                                 max_iter_barycenter=100,metric_params={"gamma": .5}, random_state=seed).fit(x)
    elif method == 'KernelKMeans':
        model = GlobalAlignmentKernelKMeans(n_clusters=n_cluster,
                                     sigma=sigma_gak(input_data),
                                     n_init=20,
                                     verbose=False,
                                     random_state=seed).fit(x)        
    return model

def input_data_process(method):
    if method in ('KMeans_euclidean','KShape'):  # 要求时序等长
        x = random_walks(n_ts=50, sz=32, d=1)
    else:  # 其他方法序列可不等长
        x = to_time_series_dataset([[1, 2, 3, 4],[1, 2, 3],[2, 5, 6, 7, 8, 9]])  # to_time_series_dataset可将list转换成时序聚类模型需要的输入格式
    return x

if __name__ == '__main__':
    method = 'KMeans_euclidean'
    input_data = input_data_process(method=method)
    model = cluster_method(x=input_data, method=method, n_cluster=2, max_iter=100, seed=100)
    pred = model.predict(input_data)
    pred

相关文章

  • 时序聚类

    方法使用参见官方文档:https://tslearn.readthedocs.io/en/latest/gen_m...

  • 论文阅读_时序聚类K-Shape

    K-Shape 高效且准确的时间序列的聚类方法 基本信息 论文题目:k-Shape: Efficient and ...

  • 单细胞转录数据分析之Scanpy

    Scanpy 是一个基于 Python 分析单细胞数据的软件包,内容包括预处理,可视化,聚类,拟时序分析和差异表达...

  • 聚类:原型聚类、层次聚类、密度聚类

    首先介绍三种类型的聚类方法: 原型聚类:假设聚类结构能够通过一组原型求解。通常算法先对原型进行初始化,然后进行迭代...

  • UML总结

    uml概述 uml形式 类图 时序图 类图是展示软件项目中,类与类关系的逻辑图。时序图展示的是软件的方法调用流程。...

  • Clustering

    本文结构安排 经典聚类算法:线性聚类 Kmeans 经典聚类算法:非线性聚类 DBSCAN、谱聚类 新兴聚类算法:...

  • 数据分析方法,寻找规律的第一步,聚类分析法!第1辑

    聚类——寻找规律的第一步 聚类的基本逻辑 聚类的因子和主成分 聚类的步骤 有序聚类与时间序列聚类 什么是聚类?聚类...

  • uml

    看懂UML类图和时序图

  • 谱聚类算法总结

    聚类三种方法:k-means聚类、密度聚类、层次聚类和谱聚类Spectrum Clustering 简述 谱聚类是...

  • 【R语言 第2篇】K-means聚类分析流程

    聚类算法是没用因变量的。聚类算法有层次聚类、基于划分的聚类、两步聚类法、基于密度的聚类。 聚类方法的逻辑 客户细分...

网友评论

      本文标题:时序聚类

      本文链接:https://www.haomeiwen.com/subject/pqyructx.html