图鸭科技闪耀CVPRCLIC图像压缩大赛夺冠秘籍全曝光QQ最新资讯独家解密

在 CVPR 2019 CLIC 图像压缩挑战赛上,图鸭科技的创新的算法方案以出色表现赢得了三项冠军。他们提出的 TucodecSSIM 算法在 MS-SSIM 和 MOS 两个指标上脱颖而出;TucodecPSNR 则在 PSNR 指标上占据领先位置;而高码点图像压缩 Transparent Track 的冠军之座,则被 TucodecPSNR40dB 所夺得。这一系列成就是通过精心设计的网络结构和优化算法实现的。以下,我们将深入探讨图鸭科技在该比赛中的技术贡献。

技术解读

编码与解码网络

图鸭科技采用了一种非对称结构的主干自编码网络,如下所示(图1)。这个结构融合了卷积、非线性单元和残差 non-local 注意力卷积等模块。这使得网络能够有效捕捉和建模图片中的纹理、边界等复杂部分。在 Kodak 标准数据集上的实验表明,通过引入 non-local 注意力机制,PSNR 指标可以提升至0.6db,而 MS-SSIM 指标也能获得至少1.5db 的提升。

编码与解码网络

量化方法

传统取整量化方式往往会降低重建质量,这里我们采取一种基于自适应聚类的软量化策略来减少损失。这种方法利用可学习中心点,并使用最近邻分配计算量化值,以保证训练过程中端到端优化。此外,在 TensorFlow 实现时,可以使用如下代码进行参数量化:

quantized_params = tf.quantization.quantize(    model_weights,    quantization_parameters=quantization_params,)

码率估计模型

为了进行准确的码率估计,我们设计了一个结合超先验子网络、Pixel CNN++ 上下文模型并融合熵参数子的调节机制的复杂系统(如图2所示)。

![注:此处省略了具体细节描述]

结果分析

通过大量训练数据集以及针对不同场景特性的多个模型,每个模型都经过动态规划算法来调整其性能以满足各项约束条件。在方案 TucodecSSIM 中,我们采用了包括 SSIM 在内的一组损失函数来指导训练过程。而对于方案 TucodecPSNR40db 和 TucodecPSNR,我们则选择了一组专门为高 PSNR 值优化过的人工设计损失函数。

最终我们的解决方案不仅展示出了卓越性能,而且证明了深度学习技术在处理复杂任务上的强大潜力,为未来的研究提供了宝贵经验和启发。

猜你喜欢

站长统计