一、问题
1.同一列数据是同一时间点的采样数据吗? 2.时间序列可以制成预测模型,特别是在一些需要安全的项目中,项目预测是否比直接分类合格或不合格更好。
二、数据
旋转机械故障诊断公共数据集汇总添加链接描述此链接是常用的故障数据集
数据量少:数据量少,最好用机器学习的方法进行预测分类。但考虑到产品投入使用后,会有源源不断的数据出现,所以倾向于用深度学习的方法进行算法的实现。基于数据量少的情况,最好使用层数比较少的网络进行训练,避免过拟合 数据量大:数据量大。基于原始数据较少的模型可能不适用于现有数据。对于可以找到的现有数据,最好自己构建没有完全完善时间序列的模型 10000数据培训和100万数据培训的结果可能完全相反。少量的数据培训是有限的实际数据量大的项目不能投资于数据量少的模型 数据增强:对于图片,数据增强可以进行图像翻转、亮度调整、图像噪声、方形图平衡等,但如何进行时间序列数据增强是一个需要考虑的问题。 这里提出了一些尚未实现的想法。前提是时间序列的相同列值不相关。1、可以添加一些噪音来查看效果。2、可以将前2000个数据转移到后面。3、已知不合格的时间序列波动,平移不同位置的数据,创建新的数据
三、模型
方案1:使用一维卷积神经网络处理时间序列数据
1D CNN 它可以很好地应用于传感器数据的时间序列分析(如陀螺仪或加速度计数据);它也可以用来分析具有固定长度周期的信号数据(如音频信号)。此外,它还可以应用于自然语言处理的任务(因为单词的接近度可能并不总是训练模式的好指标,所以 LSTM 网络在 NLP 应用程序更有前途)。
方案2:基于特征提取和多层传感器的轴承故障检测
使用手动特征进行训练,如时域:平均值;方均根值,又称有效值(表示振动能强度);最大值/方均根值(表示上述周期性振动增强);2-10阶中心矩。和频域:FFT提取特征的频谱。
方案3:LSTM处理时间序列数据
长时间记忆网络(long short term memory network)循环神经网络作为循环神经网络的,克服了梯度消失等循环神经网络的许多缺点,并逐渐取代了经典的循环神经网络
方案4:模型构建基于残留网络
input:(6000,2) 60*1 conv,32,/2 output:(1971,2,32) … 可加padding(0)有利于更好地创建模型
四、初步预测(使用一维卷积神经网络处理时间序列数据)
从数据中得出结论,识别和NLP最近发展迅速,但在时间序列的处理上,还是没有大的突破,本方案采用DC竞赛轴承故障检测开源Baseline(基于Keras1D卷积 val_acc:0.9780)[竞赛链接](https://www.pkbigdata.com/common/cmpt//轴承故障检测训练赛_竞赛信息.html)
获取数据集
这是一个轨枕在一段时间内的振动信号数值及其故障类别。请注意,振动信号值表明时间序列的同列取值不相关,甚至可以认为每一个id时序数也不同,因此必须提取时序数据的特征。 这是一个多分类问题,特征是时间序列数据,同一列数据不一定是同一时间点的采样数据,因此原始数据不能成为特征,考虑从原始数据挖掘统计特征作为分类模型的特征数据。
数据集:链接:https://pan.baidu.com/s/1y-u4_cYxQd6ZbCR_Dn__dg 提取码:19b9
数据集
训练集有792条记录,每条记录有6002列,第一列为轴承id,最后一列为故障类别(label),中间的6000列为振动信号时序数据。 测试集类似于训练集,但没有最后一列label,分类结果需要通过算法获得。 结果集是测试集id加上对应label即可。
模型训练
参考此博客:https://blog.csdn.net/weixin_41275726/article/details/102837769