随着深度学习的不断发展,越来越多的学者致力于研究基于深度学习的图像隐写分析,并涌现出大量深度隐写分析网络。然而,性能较好的几个深度隐写分析网络常具有几百万甚至更大的参数量,从而导致所需内存空间较大。
本文设计了一种参数量少于40万的轻量级深度隐写分析网络,并命名为LWENet。我们从三种不同的视角来减少参数量并提升网络检测性能。其一,预处理部分采用Spatial Rich Model(SRM)高通滤波器叠加轻量且有效的瓶颈残差块,在少量增加参数量的基础上提升了隐写信号的信噪比,这有助于提升最终的网络性能。其二,在特征提取部分的后端采用深度可分离卷积以减少参数量并改善网络末端特征图间的通道关系。最后,为了保持LWENet的轻量特性,只选择了一层全连接层(FC,Fully Connected)层作为分类器,同时,为了进一步提升检测性能,在FC层的前端使用多角度全局池化替代传统的全局平均池化来丰富分类特征。大量的实验证明我们的网络相比于目前最先进的深度隐写分析网络具有更优的性能。
如图1所示,LWENet主要由预处理部分、特征提取部分、分类器组成。预处理部分由30个SRM高通滤波器和6层BRB(图1-Block A)组成,用以提取具有高信噪比的隐写信号。在特征提取部分中,前6层采用普通卷积(对应图1-BlockB和BlockC)提取特征,使用平均池化进行特征降维来减少参数;第7层(网络末端)采用DWSConv(对应图1-BlockD)提取特征,使用MGP进行特征降维并获得多角度特征。分类器由一层FC层和Softmax组成,用于预测输入图像属于载体或载密图像的概率。
图1 本文所提网络LWENet的整体框架图。网络使用了四种类型的卷积块,其中Block A为BRB,Block B为普通卷积块,这两个块的结构为BN-ReLu-Conv;Block C为普通卷积块,Block D为DWSConv块,它们的结构为Conv-BN-ReLu。其中,ReLu代表ReLu激活函数。“a×a Conv, b”代表该卷积层的卷积核尺寸为 a×a、输出通道数为b.
为了证明LWENet的优越的检测性能,我们对比了LWENet与几个经典的隐写分析网络(Yedroudj-Net[10],SRNet[12],CovpoolNet[13],Zhu-Net[15])在每一种隐写算法(WOW、S-UNIWARD、HILL)的不同嵌入率下的检测性能以及ROC值。(注:CovpoolNet的代码来源于其原文[13]中所提供的网址。)
由表III可以清晰地看出,在每一种隐写算法下,无论设置哪一种嵌入率,LWENet的检测准确率和AUC值均超过了其他的三种隐写分析网络。例如,在嵌入率为0.4 bpp 的WOW算法下,LWENet的检测正确率达到了92.59%,比Yedroudj-Net高了4.65%,比Zhu-Net高了3.73%,比CovpoolNet高了1.36%,比SRNet高了1.37%。相比于这些网络,LWENet获得了一个比较大的性能提升。另外,SRNet在低嵌入率下训练时,需要使用高嵌入率的已经训练好的模型进行初始化,而LWENet无论在哪一个嵌入率下都可以直接进行训练,无需进行特殊的初始化,故我们可得出结论:LWENet相比于SRNet具有更好的通用性。表3、的比较数据也都充分证明本文提出的网络LWENet的有效性。
此外,在HILL0.3bpp和S-UNIWARD0.4bpp下(即W-Net[16]中所列的两种情况),LWENet与[16]进行了比较。表IV验证所提出的方法明显优于[16]两例。
为了探索预处理部分中BRB数量对网络性能的影响,我们将其分别设置为0,1,2,3,4,5,6,7,8. 由表V可以看出,随着BRB数量的增加,网络的检测准确率先增高后降低。当BRB的数量取值为6时,LWENet达到了最佳性能。当BRB的数量为0时,即只使用SRM高通滤波器作为LWENet的预处理部分,网络的性能最低,这充分说明了在预处理中使用BRB能有效提升LWENet的检测性能。由于预处理部分的通道数量只有30个,所以每增加一个BRB并不会使整个网络的参数量大幅增加,这样既保证了网络的性能,又节约其参数量。
总结
在这篇文章中,我们提出了一种轻量、有效的隐写分析网络LWENet。首先通过将BRB和SRM高通滤波器一起引入预处理层,有效提升了隐写信号的信噪比。然后将通道尺度归一化的L1-norm,L2-norm操作引入隐写分析网络,和GAP一起组成MGP,在少量增加分类器参数量的基础上丰富送入分类器的特征,有效提升网络的性能。最后将DWSConv应用在网络的最后一层卷积层,大幅度降低网络的参数量,改善网络末端对特征图相关性的建模。大量的实验证明,LWENet在保持轻量化的同时检测性也大幅提升。
论文信息
相关论文已被IEEE Signal Processing letters录用并发表,作者为福建工程学院的翁韶伟,陈梦飞、孙世耀及北京印刷学院的于丽芳。
Shaowei Weng; Mengfei Chen; Lifang Yu; Shiyao Sun. Lightweight and effective deep image steganalysis network,IEEE Signal Processing letters, 29: 1888-1892, 2022.
部分参考文献
[10] M. Yedroudj, F. Comby, and M. Chaumont, “Yedroudj-net: An efficient CNN for spatial steganalysis,”in 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2018, pp. 2092–2096.
[12] M. Boroumand, M. Chen, and J. Fridrich, “Deep residual network for steganalysis of digital images,” IEEE Transactions on Information Forensics and Security, vol. 14, no. 5, pp. 1181–1193, 2019.
[13] X. Q. Deng, B. L. Chen, W. Q. Luo, and D. Luo, “Fast and effective global covariance pooling network for image steganalysis,” in Proceedings of the ACM Workshop on Information Hiding and Multimedia Security, 2019, p. 230–234.
[15] R. Zhang, F. Zhu, J. Y. Liu, and G. S. Liu, “Depth-wise separable convolutions and multi-level pooling for an efficient spatial CNN -based steganalysis,” IEEE Transactions on Information Forensics and Security, vol. 15, pp. 1138–1150, 2020.
[16] Q. Wang, M. Q. Zhang, J. Li, and Y. J. Kong, “Lightweight end-to-end image steganalysis based on convolutional neural network,” Journal of Electronic Imaging, vol. 30, no. 6, p. 063005, 2021.
特别声明:以上文献资料内容(包括在内的视频、图片或音频)均引自自媒体平台“隐者联盟”,仅供学习研讨,不可用作商业或其他非法用途。
Notice: The content above (including the videos, pictures and audios if any) is cited from “Yin Zhe Lian Meng”, which is only employed to study and cannot be used for commercial and other illegal purposes.