资讯详情

多级小波分解网络:可解释的时间序列分析

文章信息

本周阅读的论文是题目《Multilevel Wavelet Decomposition Network for Interpretable Time Series Analysis》2018年发表的一篇文章发表在2018年《Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining》涉及时间序列数据预测的文章。

摘要

近年来,时间序列在几乎所有的学术和工业领域都出现了前所未有的崛起。在时间序列分析中引入了各种类型的深度神经网络模型,但仍缺乏对重要频率信息的有效建模。基于此,本文提出了一种基于小波的神经网络结构,称为多级小波分解网络( multilevel Wavelet Decomposition network, mWDN ),建立时间序列分析的频率感知深度学习模型。mWDN该模型保留了多级离散波分解在连续学习中的优势,并可以在深度神经网络框架下调整所有参数。在mWDN在此基础上,进一步提出了时间序列分类和预测两种深度学习模式:残差分类( Residual Classification Flow, RCF )多频长短时记忆( multi-frequency Long Short-Term Memory, mLSTM )。这两种模型频率不同mWDN分解的全部或部分子序列作为输入,通过反向传播算法全球学习所有参数,基于小波的频率分析可以无缝嵌入深度学习框架。在40个UCR基于数据集和真实用户数据集的大量实验表明,mWDN时间序列模型性能良好。文章提出的一种特殊的基础mWDN模型的重要性分析方法,该方法成功地识别出了对时间序列分析至关重要的时间序列元素和mWDN层。这其实说明了mWDN可解释性优势可视为对可解释性深度学习的深入探索。

介绍

近年来,随着深度学习领域的快速发展,不同类型的深度神经网络模型应用于时间序列处理和分析,在现实生活中取得了令人满意的效果,如循环神经网络(RNN),使用记忆节点来捕捉序列节点的相关性,但大多数模型不使用时间序列的频率信息。

小波分解是在时域和频域中描绘时间序列特征的常用方法。它可以作为深度模型建模前的数据预处理的特征提取工具。虽然这种松散的耦合方法可能会提高原始神经网络模型的预测性能,但没有采用独立的参数推理过程进行全局优化。如何将小波分解整合到深度学习模型中仍然具有挑战性。

本文提出了一种基于小波分解的神经网络模型,称为多级小波分解网络(mWDN),为时间序列分析构建了频率感知的深度学习模型。与标准的多级离散小波分解模型(MDWD)相似,mWDN模型可以将一个时间序列分解为一组频率由高到低的子序列,这是模型获得频率因子的关键。但是参数是固定的MDWD模型不同,mWDN为了适应不同的学习任务,可以学习所有参数。也就是说,mWDN该模型不仅可以利用小波分解来分析时间序列,还可以利用深度神经网络的学习能力学习参数。

基于mWDN,时间序列分类设计了两种文章(TSC)预测时间序列(TSF)深度学习模型,即Residual Classification Flow(RCF)和multi-frequency Long Short-Term Memory(mLSTM)。其中TSC关键问题是尽可能从时间序列数据中提取代表性特征,因此RCF模型采用mWDN以不同层次的分解结果为输入,利用残差学习方法和分类器堆栈来挖掘隐藏在子序列中的特征。至于TSF关键在于根据不同频率下的隐藏趋势推断时间序列数据的未来状态。因此,mLSTM模型将是所有的mWDN分解的高频子序列数据分别放入独立LSTM并将模型中的一切LSTM最终预测模型的输出。值得注意的是RCF和mLSTM模型的所有参数,包括mWDN采用端对端反向传播算法训练参数。这样,基于小波的频率分析就可以无缝地嵌入到深度学习模型中。

模型

  1. Multi-level Discrete Wavelet Decomposition

多级离散小波分解(如图1所示)是一种基于小波变换的离散信号分析方法,分解时间序列,将时间序列分为低频和高频子序列,从而提取多级时间-频率特征。

以时间序列2bd47baa5b2a8ca5aea1669248d7f34f.png例如,第一层的低频和高频序列分别以和表示。在第一层i 1层,MDWD采用低频滤波器和高频滤波器卷积上层的低频序列,如下所示:

其中,表示第一层中低频子序列的第n个元素,并设置为输入序列。第一层的低频和高频子序列是由中间变量序列和二分之一的下采样获得的。

子序列是时间序列数据X的第一层分解结果。特别是,该序列满意度:1)原始序列可由子序列完全重建X;2)不同层级的序列具有不同的时间和频率分辨率。随着层级的增加,频率分辨率不断增加,而时间分辨率,特别是低频子序列的时间分辨率不断减小。

图1 mWDN模型框架

2. Multi-level Wavelet Decomposition Network

图一为mWDN模型的框架图。如图所示,mWDN模型按以下两个公式分层分解时间序列数据:

表示sigmoid激活函数,以及可训练的偏差矩阵,最初是接近零的随机值。可以看出,公式(2)中的方程与公式(1)中的方程非常相似。由中间变量和通过平均池化采样获得的低频和高频序列分别表示时间序列X。

为实现公式(1)的卷积操作,我们设置了初始权重矩阵,如下:

显然,和,P是大小。满足和随机值在权重矩阵中。文章用于模型Daubechies 4 滤波器系数如下:

从公式(2)到公式(3),文章使用深度神经网络框架实现类似MDWD模型。尽管权重矩阵初始化为MDWD模型的滤波器系数,但仍然可以根据真实数据的扰动对矩阵进行训练。

3. Residual Classification Flow

TRC任务主要是预测和分类未知类别标签的时间序列。关键是从时间序列数据中提取明显的特征。mWDN可应用于模型分解获得的自然时间频率特征XTSC。本文提出了这一部分Residual Classification Flow(RCF)网络去挖掘mWDN在TSC任务中的潜在应用。

图2 RCF模型框架

RCF如图2所示,模型框架包含许多独立的分类器。RCF第一层模型通过前向神经网络mWDN生成的子序列与连接在一起:

它可以表示为多层感知机、卷积神经网络或其他类型的神经网络,并代表训练参数。RCF该模型采用残差网络结构连接到所有分类器:

表示softmax分类器表示时间序列的类别标签one-hot编码预测值。RCF各级模型mWDN进化了分解结果。因为在不同mWDN层次分解结果有不同的时间和频率分辨率,因此RCF模型可以充分捕捉不同时间和频率分辨率的输入时间序列。换句话说,RCF采用多视图学习方法实现高性能时间序列分类。

此外,还提出了深度残差网络来解决使用更深层次的网络结构可能导致训练困难的问题。RCF也继承了这一优势。在公式(6)中,基于第一级分类器和第一级分类器i-决定1级分类器。因此,用户可以添加残差分类器,直到模型的分类性能不再提高。

4. Multi-frequency Long Short-Term Memory

文章提出了基础mWDN多频长短记忆神经网络解决方案TSF问题。mLSTM模型的设计是基于对时间序列中隐藏节点的时间相关性和频率的认知。例如,大规模的时间相关性,如长期趋势通常处于低频,而小规模的时间相关性,如短期干扰和事件,通常处于高频。因此,文章把复杂性放在一边TSF问题分为许多子问题来预测mWDN分解的子序列会使问题相对简单,因为子序列的频率组成更简单。

给出一个长度无限的时间序列,在这个序列上给出一个从过去到现在的T,大小为T的滑动窗口如下:

使用mWDN分解X以获取第一级低频和高频序列数据如下:

如图3所示,mLSTM模型使用子序列的最后一层分解结果

作为N 1个独立的LSTM输入子网络。每个子网络。LSTM每个子序列的未来状态都在网络预测中。最后,每个子通过一个完全连接的神经网络进行LSTM最终预测结果将网络的预测值整合在一起。

图3 mLSTM框架

实验

在这一部分,文章评估是基于mWDN解决了模型TSC和TSF性能问题。

(1)Task 1: Time Series Classification

标签: sub微型d连接器mwdm2l

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台