Advertisement

基于DTW的时间序列符号聚类算法

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本研究提出了一种新的时间序列分析方法,结合了动态时间规整(DTW)与符号聚类技术,旨在提高复杂数据集中的模式识别和分类效率。 本段落提出了一种基于DTW的符号化时间序列聚类算法,用于对降维后得到的不等长符号时间序列进行聚类分析。该算法首先通过降维处理提取出时间序列的关键点,并对其进行符号化;然后利用DTW方法计算相似度;最后采用Normal矩阵和FCM方法进行聚类分析。实验结果表明,在关键点提取之后对符号化时间序列应用DTW方法,可以显著提高聚类的准确率。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • DTW
    优质
    本研究提出了一种新的时间序列分析方法,结合了动态时间规整(DTW)与符号聚类技术,旨在提高复杂数据集中的模式识别和分类效率。 本段落提出了一种基于DTW的符号化时间序列聚类算法,用于对降维后得到的不等长符号时间序列进行聚类分析。该算法首先通过降维处理提取出时间序列的关键点,并对其进行符号化;然后利用DTW方法计算相似度;最后采用Normal矩阵和FCM方法进行聚类分析。实验结果表明,在关键点提取之后对符号化时间序列应用DTW方法,可以显著提高聚类的准确率。
  • DTWMatlab代码-STF_DTW:用震源函数DTW
    优质
    本项目提供了一套基于Matlab的动态时间规整(DTW)算法代码,专门针对地震学中的震源时间函数(STF)进行相似性分析和聚类研究。 DTWMatlab代码STF_DTW用于震源时间函数的DTW聚类。这些代码旨在复制J.Yin、Z.Li和MADenolle提交给AGUAdvances的手稿“震源时间函数聚类揭示地震动力学模式”中的结果和数字。预印本可以获取以供参考。 为了再现结果,可以直接在Matlab中运行Main_run_SCARDEC.m和Main_run_Simulation.m脚本。参数设置及详细信息可以在两个脚本的注释中找到。
  • DTW-Kernel:利用DTW内核
    优质
    简介:本文提出了一种基于动态时间规整(DTW)的时间序列分类内核——DTW-Kernel。该方法能够有效捕捉时间序列数据间的非线性相似度,为模式识别和机器学习任务提供有力工具。 在该项目中提出了一种新的基于DTW(动态时间规整)的分类方法,用于处理Kinect深度传感器获取的骨骼关节位置变长多维时间序列数据。该方法的核心在于我们设计的一种新核函数,它通过计算两个时间序列之间的DTW对齐路径生成的面积来实现。 为了提取特征向量,从每个动作类别中随机选取一个作为参考样本,并在测试样本与参考样本之间应用所提出的核函数进行比较分析。3D动作识别的一个主要挑战在于不同执行者完成同一动作时速度和风格上的差异性;此外,时间序列数据中的噪声及帧丢失也会增加任务的复杂度。 实验结果表明,此方法能够有效应对上述问题,并展现出良好的性能表现。项目使用步骤包括:下载所需的数据集并将其放置在一个名为“Dataset”的文件夹中;安装必要的软件包(通过运行命令pip install -r requirements.txt);将所有相关文件置于同一目录下,并执行对应数据集的.py脚本进行测试或应用。
  • 四种控制图分
    优质
    本研究提出了一种运用四种不同聚类算法对时间序列控制图进行分类的方法,旨在提高生产过程监控与故障诊断的准确性。 针对控制图时间序列数据集的聚类任务,采用了基于划分的(K-Means)、基于层次的(AGNES)、基于密度的(DBSCAN)以及基于图的(spectral clustering)四种不同的聚类方法,并最终将结果进行了可视化展示。整个项目使用Jupyter Notebook编写,代码和所需的数据集均打包在一起以方便运行和测试。
  • LS-Cluster: 大规模多元
    优质
    LS-Cluster是一种专为处理大规模、多维度时间序列数据设计的高效能聚类算法,适用于发现具有相似趋势的数据集。 LS-Cluster是一种用于大规模多变量时间序列聚类的方法。
  • DTWCLUST: 一个针对R软件包及其对DTW改进
    优质
    DTWCLUST是一款用于时间序列数据聚类分析的R语言软件包。它不仅实现了多种聚类算法,还特别优化了动态时间规整(DTW)技术,提升了相似性度量的准确性和效率。 时间序列聚类以及动态时间规整(DTW)距离的优化包含多种策略的时间序列聚类方法及针对动态时间规整(DTW)距离及其对应下限的一系列改进措施。不仅包括传统聚类算法的应用,还包括最新的技术如k-Shape和TADPole聚类等。该软件包支持自定义的距离度量和质心定义的扩展性功能。 许多在此软件包中实现的算法特别针对DTW进行了优化设计。然而,主要的聚类工具非常灵活,既可以直接处理时间序列数据,也可以通过应用适当的转换后在新的空间进行聚类分析。该软件包还包括了若干种不同于DTW的距离计算方法作为备选方案。 此软件包内含多种实现方式: - 分区、层次和模糊聚类 - 基于形状距离的时间序列k形聚类 - 时间序列的形状提取 - TADPole聚类,这是DTW的一个优化版本 - Keogh和Lemire提出的DTW下限方法 - 全局对齐内核(GAK)距离计算方式 - DTW重心平均值及软DTW(包括距离和质心) 此外,还有一些针对多变量时间序列的实现。
  • 改进K均值——针对数据新型平滑子空
    优质
    本文提出了一种基于时间序列K均值算法改进的方法,旨在为时间序列数据提供更有效的平滑子空间聚类解决方案。 现有的聚类算法在提取用于时间序列数据平滑子空间方面表现较弱。本段落提出了一种新的k均值类型平滑子空间聚类算法——时间序列k均值(TSkmeans),旨在改善对时间序列数据的聚类效果。提出的TSkmeans算法能够有效利用时间序列数据集中的固有子空间信息,从而提升聚类性能。具体而言,该方法通过加权的时间戳来定义平滑子空间,这些加权时间戳反映了它们在区分不同聚类对象时的重要性。 我们的主要贡献包括设计了一个新的目标函数以指导对时间序列数据的聚类过程,并开发了一套新颖的更新规则以便于针对特定子空间进行迭代搜索。实验结果基于综合数据集及五个实际应用的数据集,显示了TSkmeans算法在准确性、F值、Rand指数和正常互信息等指标上的优越表现。
  • 改进K均值——针对数据新型平滑子空
    优质
    本研究提出了一种改进的时间序列K均值算法,旨在为时间序列数据开发一种高效的平滑子空间聚类技术,增强了数据分析和模式识别能力。 现有的聚类算法在从时间序列数据中提取平滑子空间方面表现不佳。本段落提出了一种新的k均值类型平滑子空间聚类算法——时间序列k均值(TSkmeans),用于对时间序列数据进行更有效的聚类。该提出的TSkmeans算法能够利用时间序列数据集的固有子空间信息来提升聚类性能。 具体而言,平滑子空间通过加权的时间戳表示,这些权重反映了对应时间点在区分不同类别中的重要性。我们工作的主要贡献在于设计了一个新的目标函数以指导时间序列数据的聚类,并开发了新颖的更新规则来进行针对平滑子空间的迭代搜索优化。 实验结果基于一个综合数据集和五个实际数据集进行验证,表明TSkmeans算法在准确性、Fscore、RandIndex以及正常互信息等通用性能指标上都表现出色。
  • 优质
    这段简介可以描述为:“时间序列分类算法的程序包”是一款集成了多种时间序列数据分类方法的软件工具箱。它提供了对各类时间序列分析模型的支持,并且方便用户进行特征提取、模式匹配和预测建模等工作,以帮助研究人员快速实现复杂的时间序列数据分析任务。 本段落介绍了主流的时间序列分类算法以及与shapelet相关的算法,并基于文章《The Great Time Series Classification Bake Off: An Experimental Evaluation of Recently Proposed Algorithms》中的程序包进行了实验评估。
  • PySAX:Python中数据SAX(合近似)实现
    优质
    PySAX是用于Python的时间序列分析工具包,它实现了SAX算法,将复杂的时间序列转换为符号表示,便于模式识别与异常检测。 重新实施派萨克斯时间序列数据的SAX(符号聚合近似)的Python版本是为了将时间序列数据转换为符号表示形式,在这种情况下,距离/相似度可以被视为在符号空间中的下限值。该符号表示可视为对时间序列的一种低维度(聚合)简化。 原版SAX方法假设了若干前提条件:局部高斯分布、固定频率以及实数值信号等。我们希望探索适用于更多类型数据的可能性,并寻求类似将单词转换为向量的方法来获得时间序列片段的向量表示,类似于Google的word2vec技术。 为了实现这一目标,我们需要一个快速且并行化的SAX算法版本。在此过程中,我们将使用Sequitur作为上下文无关语法提取器用于挖掘从SAX数据中得出的规则,并进一步利用这些规则进行异常值检测与主题识别等任务。目前我们已为Python开发了一个基于C++实现的包装器来加速这一过程,这仅是临时解决方案以提高效率。 通过以上改进和扩展,我们可以更灵活地处理各种时间序列数据并发掘其潜在价值。