中文题名: |
基于ASAPNet的图像翻译模型优化方法研究 |
姓名: | |
学号: | 1049732002605 |
保密级别: | 公开 |
论文语种: | chi |
学科代码: | 085212 |
学科名称: | 工学 - 工程 - 软件工程 |
学生类型: | 硕士 |
学校: | 武汉理工大学 |
院系: | |
专业: | |
研究方向: | 深度学习,图像处理 |
第一导师姓名: | |
第一导师院系: | |
完成日期: | 2023-03-29 |
答辩日期: | 2023-05-20 |
中文关键词: | |
中文摘要: |
图像翻译也被称作图像到图像的转换,是指把一种输入图像转换成另一种输出图像的任务,在计算机视觉领域中有着非常广泛的应用。深度学习的发展催生了许多以生成对抗网络为基础的图像翻译模型。其中,一些模型训练速度较快但翻译质量有待提升,还有一些模型容易过拟合,需要大量数据才能获得较好的效果。因此,本文以快速图像翻译领域的经典模型ASAPNet为基础,从模型目标函数优化、模型结构等角度改善该模型的图像翻译质量,并缓解模型的过拟合问题,使之在少量数据的情况下也能获得较好的翻译效果。本文的主要研究内容如下: (1)针对ASAPNet模型中的损失函数无法解耦图像结构和外观以及缺乏频域优化导致图像翻译质量欠佳的问题,提出一种基于空间相关性和焦频损失的图像翻译模型SF-ASAPNet。该模型采用两个特征提取器来提取输入图像和输出图像的自相似性模式,并利用空间相关性损失替换ASAPNet模型中的特征匹配损失,以缓解图像场景结构差异。同时,在模型中应用焦频损失FFL可以弥补在图像合成过程中缺失的频域约束,对现有的空间损失进行补充,提高图像翻译时的图像合成质量。最后,通过在公开数据集上与图像翻译领域的其他具有代表性的模型进行对比实验,验证了SF-ASAPNet模型改进工作的有效性。 (2)针对ASAPNet模型在数据较少时容易发生过拟合,训练发散的问题,提出一种基于ReMix数据增强和生成性联合训练网络的图像翻译模型RG-ASAPNet。一方面,受ReMix数据增强方法的启发,在特征层面对训练样本进行插值,通过边训练边增强的方式增加样本数量,并基于样本之间的感知关系提出一种新的内容损失,使生成器学习特征级样本而不是训练集,从而减少生成器的过拟合;另一方面,引入一种生成性联合训练网络来替换原有的鉴别器,通过参数多样化来联合训练多个不同的互补鉴别器,专注于识别图像中的不同信息,减少鉴别器的过拟合。最后,通过大量实验验证了所提模型RG-ASAPNet有效地提高了在数据较少时的图像生成质量,缓解了模型的过拟合问题。 (3)本文将空间相关性损失、焦频损失用于改进ASAPNet模型的优化目标,将ReMix数据增强作用于生成器端以及改进模型训练流程,将生成性联合训练网络用于改进ASAPNet模型的鉴别器,把这些方法有机融合在一起,共同作用于ASAPNet模型。基于此,提出了一个综合改进模型SFRG-ASAPNet。实验结果表明,相比原模型ASAPNet,SFRG-ASAPNet模型在没有过多影响平均运行时间的前提下提升了图像翻译质量,并且在少量数据的情况下依然能获得较好的图像翻译效果。 |
参考文献: |
[7] 赵汉理, 刘影, 卢望龙, 等. 基于感知去模糊的高效人脸图像修复算法[J]. 计算机辅助设计与图形学学报, 2022, 34(09): 1420-1431. [10] 刘建伟, 谢浩杰, 罗雄麟. 生成对抗网络在各领域应用研究进展[J]. 自动化学报, 2020, 46(12): 2500-2536. [23] 毛琳, 王萌, 杨大伟. 内容特征一致性风格迁移网络[J]. 计算机辅助设计与图形学学报, 2022, 34(06): 892-900. [56] 葛轶洲, 刘恒, 王言, 等. 小样本困境下的深度学习图像识别综述[J]. 软件学报, 2022, 33(01): 193-210. [57] 冯晓硕, 沈樾, 王冬琦. 基于图像的数据增强方法发展现状综述[J]. 计算机科学与应用, 2021, 11(2): 370-382. |
中图分类号: | TP391.41 |
条码号: | 002000073845 |
馆藏号: | YD10001928 |
馆藏位置: | 203 |
备注: | 403-西院分馆博硕论文库;203-余家头分馆博硕论文库 |