告别端到端依赖:合肥高维数据“中间过程监督“技术让水印提取更灵活、更收敛
基于深度学习的图像水印提取算法目前主流方案普遍采用端到端的训练模式——水印的嵌入和提取由两个深度模型联合训练损失函数为提取水印信息与原始水印信息的一致性、以及加水印前后图像一致性的加权和。嵌入模块接收无水印图像和水印信息输出含水印图像噪声模块对含水印图像进行加噪操作提取模块则从加噪后的图像中解码出水印信息。然而这一看似完备的框架在实际应用中却面临多重困境。困境一嵌入端受限。端到端框架要求嵌入端也必须采用深度学习模型但实际场景中嵌入端往往对处理速度和图片分辨率有较高要求深度学习算法难以满足只能采用传统嵌入算法。一旦嵌入端脱离深度学习框架端到端的联合训练便无法进行。困境二模型难收敛。当嵌入算法采用传统卷积神经网络Encoder结构时算法本身较为复杂直接训练提取模型从图像中恢复水印信息极易导致模型无法收敛严重制约水印提取的准确性。困境三噪声受制约。端到端框架要求梯度在嵌入、噪声、提取三个模块中同时传播噪声层必须满足可微分条件限制了强噪声增强手段的引入影响模型鲁棒性的进一步提升。核心创新将“一步到位”的难题拆解为“两步可解”的子任务针对上述技术瓶颈合肥高维数据技术有限公司与中国科学技术大学联合研发的“中间过程监督的深度学习图像水印提取方法及系统”专利号ZL 202410513952.7提出了一种全新的解决方案。该专利已获得国家发明专利授权。该技术的核心创新在于重新定义了水印提取任务的训练范式——不再让模型直接从输入图像生成水印信息而是通过“水印特征图”这一中间产物对模型训练过程进行引导和监督。具体而言该方法将原本“一步到位”的水印提取任务拆解为两个相对容易的子任务恢复水印特征图和恢复水印信息。水印提取模型采用“两层Encoder卷积神经网络层夹一层Decode卷积神经网络层”的三段式结构。系统首先根据含水印图像与无水印图像进行残差计算和局域线性变化提取完整水印特征图再对该特征图进行多重降采样获得不同分辨率的降采样水印特征图。随后模型先从低分辨率的特征图入手再逐步恢复水印特征图的细节。这一设计使得模型每个模块的训练目标都变得更加明确——传统训练方法难以收敛的任务在此框架下模型训练得以有效收敛。