基于SAX方法的时间序列分类问题的多阶段改进研究
【出 处】:
【作 者】:
宋伟
[1] ;
张帆
[2] ;
叶阳东
[1] ;
韩鹏
[3] ;
范明
[1]
【摘 要】
分类问题是数据挖掘中的基本问题之一,时间序列的特征表示及相似性度量是时间序列数据挖掘中分类、聚类及模式发现等任务的基础。SAX方法是一种典型的时间序列符号化表示方法,在采用该方法的基础上对时间序列进行分类,不仅可以有效地降维、降噪,而且具有简单、直观等特点,但是该方法有可能造成信息损失并影响到分类结果的准确性。为了弥补信息损失对分类结果的影响,采用了集成学习中大多数投票方法来弥补BOP表示后的信息损失,从而提高整个分类器的效率。针对一些样本在BOP表示中都损失了相似的重要信息,以至于大多数投票无法进一步提高分类效率的问题,进一步提出了结合集成学习中AdaBoost算法,通过对训练样本权重的调整,从而达到以提高分类器性能来弥补信息损失的效果。实验结果表明,将BOP方法与集成学习相结合的方法框架,不仅能很好地处理SAX符号化表示中的信息损失问题,而且与已有方法相比,在分类准确度方面也有显著的提高。
相关热词搜索: 时间序列 SAX 分类 集成学习 多阶段 time series SAX classification ensemble learning multi-phased
上一篇:协同过滤技术的改进研究
下一篇:一种改进的心电图QRS波群检测算法