(论文速读)一种用于智能机械故障诊断的去噪扩散概率模型数据增强方法
论文题目Denoising diffusion probabilistic model-enabled data augmentation method for intelligent machine fault diagnosis一种用于智能机械故障诊断的去噪扩散概率模型数据增强方法期刊EAAI 2025摘要轴承故障是旋转机械故障的主要原因之一。然而由于故障数据的复杂性在真实的工业环境中收集足够的故障数据被证明是具有挑战性的。由于这一限制目前的大多数方法无法在数据有限的情况下准确识别故障类型从而阻碍了及时的维护工作。针对这一问题本文提出了一种基于扩散模型数据增强的轴承故障诊断方法。在数据采集后利用连续小波变换将各种一维振动数据转换成二维时间序列图。随后将这些特征图划分为故障样本集。然后利用扩散模型对训练样本进行扩充。然后将这些扩充后的样本送入卷积神经网络进行故障诊断并与原始数据集的诊断精度进行比较。对比分析表明基于扩散模型的数据增强技术在小样本训练数据集下提高了故障诊断的准确率。最后利用帕德伯恩方位数据集验证了该方法的有效性并与其他数据增强技术进行了对比。结果表明基于扩散模型的数据增强方法在训练精度和稳定性方面都优于其他方法特别是在小样本情况下。已根据论文实现代码具体可见博客基于 DDPM 的轴承故障诊断数据增强代码运行指南-CSDN博客基于 DDPM 的轴承故障诊断数据增强代码运行指南https://blog.csdn.net/LJ1147517021/article/details/162005529?fromshareblogdetailsharetypeblogdetailsharerId162005529sharereferPCsharesourceLJ1147517021sharefromfrom_link用扩散模型打破小样本困境DDPM在轴承故障诊断中的数据增强实践一、背景旋转机械故障诊断为什么难旋转机械如电机、风机、泵在现代工业中无处不在而轴承作为其核心零部件一旦出现内圈、外圈或滚动体损伤轻则导致停产损失重则引发安全事故。因此轴承故障的智能诊断一直是工程界和学术界的重要课题。近年来深度学习——尤其是卷积神经网络CNN——在故障诊断领域展现出强大的特征提取能力。然而深度学习本质上是一个数据饥渴的过程。在真实工业场景中轴承故障数据的获取面临三重困境故障本身稀少生产线上故障是小概率事件正常状态数据远多于故障数据造成严重的类别不平衡采集成本高昂人为制造故障、进行加速疲劳测试的代价极高一维信号难以直接生成振动传感器采集的原始数据是一维时序信号传统生成模型如GAN在生成高质量一维时序数据时表现不佳。这些困境导致的直接后果是在小样本条件下训练的深度学习模型极易过拟合诊断准确率大幅下滑。那么如何在数据匮乏的条件下让模型仍能准确识别轴承故障这正是本文要解决的核心问题。二、已有方法的局限在数据增强领域常见的应对策略包括2.1 添加高斯噪声最简单的方法——在原始样本上叠加随机高斯噪声人为制造新样本。优点实现简单一定程度上提升模型鲁棒性防止过拟合。缺点引入的噪声是随机的并不对应真实的故障物理变化规律过度加噪还会模糊细微的故障特征导致模型泛化能力反而变差。2.2 生成对抗网络GAN / DCGAN以DCGAN为代表的生成对抗网络通过生成器与判别器的博弈来学习数据分布生成逼真样本。优点生成的样本具有一定的真实性和多样性。缺点GAN的训练过程不稳定存在模式崩塌mode collapse风险在小样本场景下判别器因数据不足而难以提供有效梯度训练更加困难实验数据表明DCGAN在Paderborn数据集上Data1增加80张生成样本后准确率反而从84.7%下降至82.5%说明训练稳定性存在明显问题。三、本文的解决思路CWT DDPM CNN本文提出了一套完整的故障诊断流程核心思想可以概括为先把一维信号变成二维图再用扩散模型生成更多图最后用CNN来分类。【此处配图论文图1 —— DDPM数据增强的整体流程图】整个方法分为三个关键模块3.1 连续小波变换CWT从一维信号到二维图像振动信号本质上是一维时序数据直接用于DDPM生成效果不佳。论文选择连续小波变换Continuous Wavelet Transform, CWT将其转化为二维时频图。这一转换的优势在于多尺度分析CWT能同时在时域和频域捕捉信号特征揭示不同频段上的故障成分可视化直观二维图像中故障特征以纹理、色块等形式呈现适合CNN提取空间特征绕开一维生成难题将问题转化为图像生成充分发挥DDPM在图像领域的成熟优势。【此处配图论文图3 —— 振动数据经CWT变换后的二维时频图示例】3.2 去噪扩散概率模型DDPM高质量图像生成DDPM由Ho等人于2020年提出是当前图像生成领域最具竞争力的生成模型之一。其核心思想是通过两个互逆的过程来学习数据分布前向过程加噪从原始干净图像出发逐步向其中添加高斯噪声经过 T 步后图像退化为接近纯高斯噪声。这一过程是固定的马尔可夫链不含可训练参数任意时刻 t 的含噪图像可以直接由原始图像计算得到【此处配图论文图2 —— DDPM前向加噪与反向去噪过程示意图】反向过程去噪生成训练阶段模型学习逆转加噪过程——从噪声开始逐步预测并去除噪声最终恢复出高质量图像。反向转移分布由神经网络参数化损失函数训练目标是让网络预测的噪声尽量接近真实添加的噪声损失函数化简为推理样本生成生成新样本时从随机高斯噪声出发迭代执行去噪步骤本文中DDPM采用3000个epoch训练时间步T1000。3.3 U-NetDDPM中的噪声预测网络DDPM中负责预测噪声的神经网络采用U-Net结构。U-Net因其编解码对称结构和跳跃连接skip connections在图像处理任务中表现卓越编码器下采样使用4-5个池化层逐步降低分辨率从底层纹理特征逐步抽象至高层语义特征解码器上采样逐步恢复分辨率跳跃连接将编码器各层特征图直接融合到对应的解码器层保留高分辨率细节避免信息瓶颈这正是VAE系列模型生成图像模糊的根本原因。【此处配图论文图5 —— 包含像素空间、潜在空间、Denoising U-Net和跳跃连接的DDPM完整结构图】生成的新样本与原始样本在同一故障类别下具有相似的时频特征但在细节上存在一定差异有效扩充了样本的多样性。【此处配图论文图4 —— 原始Paderborn数据集样本图a与DDPM生成样本图b的对比】3.4 2D-CNN故障分类网络增强后的二维时频图输入二维卷积神经网络2D-CNN进行故障分类。该网络结构如下输入层二维小波图像隐藏层3个卷积层分别含16、6、1组卷积核 3个池化层 2个全连接层64神经元 → 11或4神经元激活函数ReLU卷积层、Softmax输出层优化器Adam学习率0.001损失函数交叉熵损失批大小64【此处配图论文图6 —— CNN结构示意图】四、实验验证论文在两个公开数据集上进行了系统验证CWRU数据集Case Western Reserve University和Paderborn数据集实验平台为PyTorchGPU为GeForce GTX 1080 Ti / 3060。4.1 CWRU数据集实验数据集简介CWRU轴承数据集是故障诊断领域最广泛使用的基准数据集之一。振动信号由驱动端SKF620512kHz/48kHz和风扇端SKF620312kHz加速度计采集电机转速1730-1797 RPM涵盖4种健康状态正常、外圈故障、内圈故障、滚动体故障故障直径分7 mil、14 mil、21 mil三种共10类状态。实验设置每类健康状态选取100张CWT变换图像作为训练集2500张作为验证集和测试集2D-CNN以batch size200训练300个epoch。增强设置以100张训练图为输入DDPM生成500张合成图像与原训练集合并构成新训练集。实验结果【此处配表论文表1 —— CWRU数据集原始数据与DDPM增强后的测试精度对比】原始数据测试精度仅为74.0%经DDPM数据增强后提升至87.6%提升幅度高达13.6个百分点。【此处配图论文图7 —— CWRU数据集的混淆矩阵对比原始 vs. 500张生成数据】从混淆矩阵可以明显看出增强前多个类别存在严重的误分类如Ball_007、Ball_014等相互混淆增强后各类别的识别精度均显著提升对角线元素更加集中。4.2 Paderborn数据集实验数据集简介Paderborn数据集由德国帕德博恩大学于2016年发布专为电机驱动系统中的轴承损伤监测而设计。测试台由电机、转矩测量轴、轴承测试模块、飞轮和负载电机组成振动信号采样频率64kHz机械参数采样频率4kHz。数据集包含12个人工损伤轴承7个外圈损伤、5个内圈损伤14个加速寿命测试损伤轴承5个外圈、6个内圈、2个复合损伤6个健康轴承实验设置选取6203深沟球轴承节圆直径28.55mm在转速900 RPM、加载扭矩0.7N·m、径向力1000N条件下的数据考察4种健康状态健康、内圈损伤、外圈损伤、混合损伤。构建两个各含40张CWT图像的训练集Data 1和Data 2400张图像作为验证集和测试集。【此处配图论文图8 —— Paderborn轴承测试台实物图】基准精度【此处配图论文图9 —— Paderborn数据集原始数据混淆矩阵Data1: 0.798Data2: 0.738】Data 1原始精度79.8%Data 2原始精度73.8%可见小样本每类仅10张条件下性能本就受限。4.3 三种增强方法横向对比论文在Paderborn数据集上系统对比了三种数据增强方案方法一高斯噪声增强向原始40张图像添加均值为0、方差为0.01的高斯噪声分别生成40张和80张噪声图像并加入训练集。【此处配表论文表2 —— Paderborn数据集高斯噪声增强结果】【此处配图论文图10 —— Paderborn数据集高斯噪声增强混淆矩阵Data1和Data240和80张】Data 1精度从79.8%分别提升至84.2%和85.2%Data 2从73.8%提升至80.3%和82.0%。方法二DCGAN增强DCGAN生成器和判别器均采用5层反卷积/卷积结构特征图尺寸64训练10000个epochAdam优化器学习率0.0005。【此处配表论文表3 —— DCGAN生成器结构】【此处配表论文表4 —— DCGAN判别器结构】【此处配表论文表5 —— Paderborn数据集DCGAN增强结果】【此处配图论文图11 —— Paderborn数据集DCGAN增强混淆矩阵Data1和Data240和80张】Data 1精度分别为84.7%和82.5%注意80张反而比40张下降了2.2%训练不稳定的问题暴露无遗Data 2分别为81.4%和83.1%。方法三DDPM增强输入同样为40张训练图DDPM分别生成40张和80张新图像。【此处配表论文表6 —— Paderborn数据集DDPM增强结果】【此处配图论文图12 —— Paderborn数据集DDPM增强混淆矩阵Data1和Data240和80张】Data 1精度分别提升至89.6%和92.3%Data 2分别达到84.2%和86.3%且随着生成样本数量增加性能持续稳定提升未出现性能下滑。三方法综合对比【此处配表论文表7 —— 三种方法在Data 1上的对比】【此处配表论文表8 —— 三种方法在Data 2上的对比】【此处配图论文图13 —— 三种增强方法在Paderborn数据集上的柱状图对比】从综合对比来看DDPM在所有场景下均取得最高精度且具备以下突出优势训练稳定性最强随生成数量增加精度单调提升无下降现象生成质量最高产出的时频图在视觉特征上与真实故障样本高度一致小样本场景优势明显在每类仅10张原始图像的极端条件下依然能显著提升诊断性能。五、方法优势与局限性分析优势总结维度DDPM的表现训练稳定性无模式崩塌精度随样本数单调提升样本质量生成图像与真实样本高度相似见图4对比模式覆盖能生成多样化样本防止过拟合噪声鲁棒性内置去噪机制对含噪数据有天然适应性小样本适配极少训练样本40张下仍能有效工作局限性论文作者也坦诚指出了当前方法的不足不能直接处理一维信号DDPM难以高质量生成一维时序数据必须先经CWT转换为二维图像增加了流程复杂度计算资源消耗大DDPM训练需要3000个epoch、1000个时间步相比GAN训练周期更长推理速度较慢生成速度较慢每次从噪声到图像需要迭代T步实时性不如直接方法。六、未来展望论文指出未来在故障诊断数据增强领域值得探索的方向包括物理模型与机器学习融合将轴承动力学方程等先验知识注入生成模型使合成数据更符合物理规律迁移学习与跨域适应在不同机器、不同工况之间共享生成模型提升泛化能力强化学习动态增强利用强化学习自适应调整数据增强策略针对当前诊断难点定向生成样本可解释AI通过注意力可视化等手段验证生成样本的合理性提升增强数据的可信度少样本学习与半监督学习进一步减少对大量标注数据的依赖Few-Shot Learning、Semi-Supervised Learning、Anomaly Detection、Transfer Learning。七、总结本文围绕小样本条件下轴承故障诊断精度不足这一核心问题提出了一套基于CWT DDPM 2D-CNN的完整解决方案。方法的精妙之处在于不直接在一维信号上做增强而是借助CWT将问题转化为图像生成充分发挥DDPM在图像生成领域的成熟优势。实验证明相较于高斯噪声和DCGANDDPM生成的时频图质量更高、多样性更好、训练更稳定最终带来了更显著的诊断精度提升。对于长期困扰工业界的故障数据难以获取难题扩散模型提供了一种极具潜力的新路径——让机器在见过很少故障的情况下依然能学会识别各种故障。