RingConn携突破性智能戒指亮相CES 2024,火爆全场 | 俊泰“量肤而治”皮肤基因检测,从基因出发制定针对性医美方案 | Swisse PLUS正式进驻天猫旗舰店,引领精英圈层新春健康奢养新风尚 | 天翼云亮相TC608年度工作总结会暨算力服务工作组成果发布会,斩获多项大奖与认证! | 数学爱好者田成功 发现数性周期律并计算出2^ 222222222-X大数因子达到国际领先水平 | 首届大湾区国际体育商业峰会定于二月在中国澳门举行 | 江苏文峰集团旗下企业积极参与“2024校园公益服务行” 活动 | “数据要素×”风起,企业如何加速数智转型,开辟增长新空间? | 工业4.0时代:润滑产业的数智化发展 | 再度登榜!星云开物荣获“2023广州高科技高成长20强” |
 
当前位置: 新闻>滚动>

基于深度神经网络的图像防伪与版权保护关键技术取得新进展

发布时间:2024-01-25 12:54:59  |  来源:中国网科学  |  作者:史月飞  |  责任编辑:科学频道

多媒体技术的发展为电子商务和电子政务等业务提供了极大的便利,其中许多有价值的文件,如行政文件、合同文书、医疗病例和交易凭证等,被扫描成数字格式的文本图像。文本图像可以有效地存储和传输,但也可能被未经授权的人非法复制和窃取。同时,随着屏幕读写时代的到来,屏幕上显示的重要文本信息,极易被带有拍摄功能的电子设备偷拍,而不留下任何痕迹,使得难以泄密追踪。水印技术可以用于保护图像版权,通常也可以用来实现泄密追踪。数据所有者可以将身份信息等秘密信息作为水印嵌入到载体文本图像中,从而生成嵌入水印后的文本图像,即含水印图像。在存储和传输过程中,含水印图像可能会受到滤波、噪声、模糊、裁剪和压缩等干扰。然而,在屏幕显示和拍摄过程中,含水印图像则可能会受到仿射变换、光照失真、色度失真、饱和度失真、图像质量压缩和摩尔纹等失真攻击。因此,如果需要的话,应从被攻击的含水印文本图像中提取出水印信息,并以此识别出身份信息,从而进行下一步的问责流程。近年来,随着版权保护的日益重要,在数字艺术品版权保护和图像版权领域,涌现出一批杰出的专业人才,而王文昊则是其中的佼佼者。

王文昊,中国杰出的基于人工智能技术的图像版权保护专家,长期从事人工智能、计算机视觉、行人重识别相关研究,尤其是在基于人工智能技术的跨镜追踪安全算法、基于人工智能技术的数字艺术品版权保护算法的研究方面达到中国领先水准。读书生涯获得澳大利亚人工智能研究院博士全额奖学金,曾前往包括英国剑桥大学(University of Cambridge)、帝国理工大学(Imperial College London)、爱丁堡大学(The University of Edinburgh)在内的多所国际名校访学多学科方向学习人工智能前沿知识,参加先进高温结构材料国防重点实验室项目,曾工作于阿联酋起源人工智能研究院,同阿联酋起源人工智能研究院等顶尖科学家合作,现任北京高码科技有限公司人工智能技术总监,在权威学术期刊发表众多SCI论文、EI论文、人工智能顶级会议(CVPR)论文、图像处理顶级期刊 (TIP)论文,是中国顶尖的基于人工智能技术的图像版权保护专家。2022年4月1日,王文昊研发的“基于人工智能技术的数字艺术品版权保护算法系统”(简称:AIProtector)顺利获得国家版权局批准,计算机软件著作权登记号:2022SR0755323,标志着王文昊在借助AI创新技术为数字艺术品提供从版权存证、侵权监测、司法维权、数字作品交易等服务迈出了关键的一步,AIProtector全面保障艺术家及机构的知识产权,帮助数字作品发挥更大的市场潜力。

为了解决基于深度神经网络的文本图像水印方法遇到的一系列行业疑难,王文昊在对图像水印的理论、常用算法和技术等方面进行深入研究的情况下,并分别从上述的应用场景出发:(1)针对存储和传输过程中文本图像的泄密追踪问题,提出了一种基于深度神经网络的鲁棒文本图像水印方案。王文昊专门设计了一个编码器网络和一个解码器网络来嵌入和提取水印信息。然后,在编码器网络与解码器网络之间,添加一个用以模拟在现实场景中可能遇到的各种图像攻击的噪声层,其中包含裁剪、模糊、噪声、尺寸调整和JPEG压缩等图像攻击。同时,在对深度神经网络的训练过程中,针对文本图像的独特纹理特征,王文昊设计了一种文本敏感损失函数,用以限制水印嵌入过程中对文本字符的像素修改,以提高含水印图像的视觉效果。最后,为了更近一步提高含水印文本图像的视觉质量,王文昊又提出了一种水印嵌入强度调整策略,并且该策略几乎不损失水印提取精度。实验结果表明,该方案对水印鲁棒性和图像质量有良好的权衡关系。(2)针对屏幕显示和拍摄过程中文本图像的泄密追踪问题,王文昊提出了一种基于深度神经网络的抗屏幕拍摄文本图像水印方案。通过应用该方案,当含水印文本图像在屏幕上显示并被相机偷拍时,仍然可以从捕获的照片中提取水印信息。具体来说,该方案是一个基于端到端的神经网络结构,其中编码器网络用于嵌入水印信息和解码器网络用于提取水印信息。在深度神经网络的训练过程中,在编码器网络和解码器网络之间添加屏摄失真层,以模拟在真实场景下的屏幕拍摄过程中引入的各种失真,如相机失真、拍摄失真、光源失真和摩尔纹等失真。此外,在网络训练过程中,王文昊使用了文本敏感损失函数和Lpips损失函数以提高含水印文本图像的视觉质量。最后,他还测试了上文提出的嵌入强度调整策略,该策略在几乎不损失水印提取精度的情况下,有效提高视觉质量。实验结果表明,该方案在视觉质量和鲁棒性方面都取得了较高的性能。 (作者:史月飞)