Advertisement

L3C-PyTorch: CVPR 2019 论文《实用全分辨率学习无损图像压缩》的 PyTorch 实现

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
L3C-PyTorch是CVPR 2019论文《实用全分辨率学习无损图像压缩》的PyTorch实现,致力于提供一种高效、灵活的框架以进行无损图像压缩研究。 我们提出了首个实用的学习无损图像压缩系统L3C,并证明其优于流行的工程编解码器PNG、WebP及JPEG2000。我们的方法核心在于采用了一种针对自适应熵编码的完全并行化分层概率模型,该模型经过优化以实现端到端的高效压缩任务处理。 与最近提出的自回归离散概率模型(如PixelCNN)不同,L3C不仅对图像分布进行建模,并且结合了学习辅助表示;此外,它仅需三个前向传递即可预测所有像素的概率值,而无需为每个单独像素执行一次。因此,在采样时,与最快的PixelCNN变体Multiscale-PixelCNN相比,L3C的效率提高了两个数量级以上。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • L3C-PyTorch: CVPR 2019 PyTorch
    优质
    L3C-PyTorch是CVPR 2019论文《实用全分辨率学习无损图像压缩》的PyTorch实现,致力于提供一种高效、灵活的框架以进行无损图像压缩研究。 我们提出了首个实用的学习无损图像压缩系统L3C,并证明其优于流行的工程编解码器PNG、WebP及JPEG2000。我们的方法核心在于采用了一种针对自适应熵编码的完全并行化分层概率模型,该模型经过优化以实现端到端的高效压缩任务处理。 与最近提出的自回归离散概率模型(如PixelCNN)不同,L3C不仅对图像分布进行建模,并且结合了学习辅助表示;此外,它仅需三个前向传递即可预测所有像素的概率值,而无需为每个单独像素执行一次。因此,在采样时,与最快的PixelCNN变体Multiscale-PixelCNN相比,L3C的效率提高了两个数量级以上。
  • RDN-pytorch:基于PyTorch残差密集网络CVPR 2018)
    优质
    RDN-pytorch是基于PyTorch框架实现的残差密集网络(Residual Dense Network)项目,用于提升图像超分辨率效果。该代码库实现了CVPR 2018论文中的方法。 RDN 存储库要求使用以下软件版本:PyTorch 1.0.0、脾气暴躁的1.15.4(这里的“脾气暴躁”可能是指另一个特定版本或组件,原文如此)、枕具5.4.1、h5py 2.8.0 和 tqdm 4.30.0。DIV2K和Set5数据集可以转换为HDF5格式,并且可以从指定链接下载相关文件。 以下是数据集的规模类型关联: - DIV2K:训练用(x2, x3, x4)、评估用(x2, x3, x4) - Set5:训练用、评估用 或者,您可以使用prepare.py脚本创建自定义数据集。运行命令如下所示: ``` python train.py --train-file BLAH_BLAH/DIV2K_x4.h5 \ --eval-file BLAH_BLAH/Set5_x4.h5 \ --outputs-dir BLAH_BLAH/outputs ```
  • -ESRGAN-PyTorch
    优质
    简介:ESRGAN-PyTorch是一款基于PyTorch框架实现的图像超分辨率工具,采用先进的ESRGAN模型,能够生成高质量、自然感强的高分辨率图像。 该资源为ESRGAN-图像超分辨率-pytorch,复现论文为《ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks》。
  • PSP_CVPR_2021: CVPR-2021PyTorch-源码
    优质
    简介:PSP_CVPR_2021是CVPR 2021年一篇论文的PyTorch版本实现,包含完整源代码。此项目便于研究者学习和复现实验结果。 CVPR-2021论文的PyTorch实现:沿视听事件线的正样本传播 视听事件(AVE)本地化任务旨在找出包含特定视听事件的视频片段,并对其进行分类。这类事件既包括视觉元素也包括听觉元素,也就是说声源必须同时出现在视觉图像和音频部分中。 为了进行这项研究,需要准备以下资料: - AVE数据集 - 提取的音频特征文件(audio_feature.h5) - 提取的视频特征文件(visual_feature.h5) 此外还需要其他预处理文件: - audio_feature_noisy.h5 - visual_feature_noisy.h5 - right_label.h5 - prob_label.h5 - labels_noisy.h5 - mil_labels.h5 所有这些必需的数据应放置在名为data的文件夹中。 同时,还包括训练顺序文件(train_order.h5)。
  • SRGANPyTorch:基于CVPR 2017“利生成对抗网络单幅照片级效果”
    优质
    本项目是针对CVPR 2017论文的实践,采用PyTorch框架实现SRGAN算法,旨在通过生成对抗网络技术提升单张低分辨率图片至高分辨率的照片级真实感。 SRGAN 是基于 CVPR 2017 论文的 PyTorch 实现。
  • Python-MetaSR: 一种于超放大网络(CVPR 2019, PyTorch
    优质
    Python-MetaSR是一种在CVPR 2019上提出的基于PyTorch框架的超分辨率放大技术,适用于多种图像放大任务,具有广泛的适用性和高效性。 Meta-SR是一个用于超分辨率的放大任意网络(CVPR2019),使用PyTorch实现。
  • 基于PyTorchRDN:利残差密集网络进行CVPR 2018)- 源码
    优质
    这段代码是基于PyTorch框架实现的残差密集网络(RDN)项目,用于执行图像超分辨率任务。该方法源于CVPR 2018会议论文,旨在提供高质量的大规模图像恢复方案。 RDN存储库要求使用PyTorch 1.0.0、pillow 5.4.1、h5py 2.8.0 和 tqdm 4.30.0。可以下载转换为HDF5格式的DIV2K和Set5数据集,用于训练和评估模型。 以下是数据集的具体规模及类型关联: - DIV2K:包含2个训练集合与3个验证集合。 - Set5:包括2个训练集合、3个评估集合以及4个测试集合。 或者,您也可以使用`prepare.py`脚本创建自定义的数据集。例如,您可以运行以下命令进行模型的训练和评估: ```shell python train.py --train-file BLAH_BLAH/DIV2K_x4.h5 \ --eval-file BLAH_BLAH/Set5_x4.h5 \ --outputs-dir BLAH_BLAH/outputs ``` 请根据实际路径替换`BLAH_BLAH`。
  • PyTorch中Python-DRRN超
    优质
    本项目在PyTorch框架下实现了基于Python的深度残差递归神经网络(DRRN)图像超分辨率技术,用于提升图像清晰度和细节表现。 Deep Recursive Residual Network for Super Resolution (DRRN) was presented at CVPR 2017.
  • 使PyTorchSRCNN超模型
    优质
    本项目采用PyTorch框架实现了SRCNN(Super-Resolution Convolutional Neural Network)模型,用于图像超分辨率处理,可有效提升低分辨率图像的清晰度和细节。 针对初学者使用指南:确保数据集文件已解压并放置在D盘上。然后,在终端按照README中的指示运行train或test部分的内容。建议使用绝对路径,并将参数num_workers设置为0,以适应大多数电脑的配置需求。整个过程仅需4积分,实际上等同于免费提供。如有任何问题,请联系博主,私信将会得到回复。
  • USRNet:基于深度展开网络(CVPR 2020,PyTorch
    优质
    USRNet是一种先进的图像超分辨率技术,利用深度学习和PyTorch框架,在CVPR 2020上展示,通过深度展开方法提升图像质量。 经典超分辨率(SISR)退化模型假设低分辨率(LR)图像为高分辨率(HR)图像的模糊、下采样以及加噪版本。从数学上讲,可以表示为: \[ I_{\text{LR}} = I_{\text{HR}} \ast h + n \] 其中 \(I_{\text{LR}}\) 是低分辨率图像,\(I_{\text{HR}}\) 是高分辨率图像,\(h\) 表示二维卷积中的模糊核。符号“\(\ast\)”表示卷积运算。下采样操作通常采用标准的倍数向下采样器来实现,即保留每个不同像素对应的左上角像素,并丢弃其他信号。 噪声 \(n\) 一般假设为加性高斯白噪声(AWGN),其强度由方差或噪声水平决定。通过设定适当的模糊核、比例因子和噪音参数,可以近似各种低分辨率图像的生成过程。这种方法在基于模型的方法中得到了广泛应用,尤其是在最大后验概率(MAP)框架下同时解决数据项与先验项的问题上取得了显著成果。