Advertisement

Mining Temporal Context for Learned Video Compression

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:ZIP


简介:
本文提出了一种学习视频压缩方法,通过挖掘时间上下文信息来提高压缩效率和视频质量,为视频编码技术提供了新思路。 本段落研究了端到端学习型视频压缩技术,并特别关注时间上下文的学习与利用。提出了一种存储先前重建帧并将其特征传播至广义解码图像缓冲区的方法,通过这些传播的特征来学习多尺度的时间上下文,并将该上下文重新整合进压缩方案中。此方案包括了上下文编码器-解码器、帧生成器和时间上下文编码器等组成部分,同时摒弃了自回归熵模型以实现更短的解码时间。经过与x264、x265及H.264、H.265和H.266官方参考软件的对比测试,在特定内部周期以及面向PSNR或MS-SSIM时,该方案展示出了优于现有技术的表现。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Mining Temporal Context for Learned Video Compression
    优质
    本文提出了一种学习视频压缩方法,通过挖掘时间上下文信息来提高压缩效率和视频质量,为视频编码技术提供了新思路。 本段落研究了端到端学习型视频压缩技术,并特别关注时间上下文的学习与利用。提出了一种存储先前重建帧并将其特征传播至广义解码图像缓冲区的方法,通过这些传播的特征来学习多尺度的时间上下文,并将该上下文重新整合进压缩方案中。此方案包括了上下文编码器-解码器、帧生成器和时间上下文编码器等组成部分,同时摒弃了自回归熵模型以实现更短的解码时间。经过与x264、x265及H.264、H.265和H.266官方参考软件的对比测试,在特定内部周期以及面向PSNR或MS-SSIM时,该方案展示出了优于现有技术的表现。
  • THE H.264 ADVANCED VIDEO COMPRESSION STANDARD
    优质
    H.264高级视频压缩标准是一种高效的数字视频编码技术,广泛应用于流媒体和广播行业,能够显著降低带宽需求同时保持高质量的视频传输。 H.264 高级视频压缩标准是目前最流行的视频压缩技术之一,由 MPEG(运动图像专家组)与 VCEG(视频编码专家小组)共同开发,并于 2003 年发布。该标准旨在提供高效的视频压缩方法以满足日益增长的数字视频应用需求。 H.264 标准的主要特点如下: 1. 高效的编码技术:通过采用变换编码、预测编码和熵编码等多种高效算法,大幅度提高了视频流的压缩效率。 2. 优秀的视频质量:能够提供高质量的视频压缩服务,适用于高清电视、数字电视以及网络直播等场景。 3. 广泛的应用范围:H.264 标准被广泛应用于各种数字视频应用领域中,包括但不限于在线点播平台、卫星和有线电视广播系统及蓝光光盘存储设备。 其技术架构主要包括: 1. 视频编码层(VCL):负责处理原始视频信号的压缩任务。 2. 网络抽象层(NAL):将已压缩的数据传输至网络环境中的各个节点上。 3. 视频应用接口(VAI):实现解码播放等功能。 H.264 标准的优势包括: 1. 高效性:相比之前的 MPEG-2 标准,H.264 可以提供两倍以上的压缩效率。 2. 优越的画质表现力:能够满足高清视频、数字电视等应用场景对高质量图像的要求。 3. 应用广泛:被大量应用于包括网络直播服务在内的多种场合。 在实际应用中,H.264 标准常用于以下几个方面: 1. 流媒体平台:支持在线播放和远程会议等功能; 2. 数字广播系统:适用于卫星及有线电视的高清传输需求; 3. 蓝光碟片技术:实现高质量视频内容的大容量存储与读取功能; 4. 高清电视机顶盒等设备。 总之,H.264 是当前数字视频应用中最流行的压缩标准之一,在众多领域内发挥着关键作用。
  • Cinematic Temporal Anti-Aliasing (CTAA) V3 for Unity
    优质
    Cinematic Temporal Anti-Aliasing (CTAA) V3 for Unity是一款为Unity游戏引擎设计的高级后处理插件,采用先进的时序抗锯齿技术优化画面质量,显著提升游戏视觉效果。 CTAA V3是一款专为Unity设计的电影时间抗锯齿插件,现已全面支持HDRP,并增加了多项增强功能。该插件适用于PC/MacOS以及所有渲染路径中的VR设备(包括单通道立体VR),能够实时实现高质量的电影级渲染效果。 在V3版本中,CTAA解决了镜面微光、PBS引起的高频闪烁及HDR Bloom闪烁等问题,提供稳定清晰的抗锯齿图像。它采用先进的技术,在物体移动时保持卓越的清晰度和细节,并且性能表现优秀。 此外,CTAA V3还提供了电影级别的时间超采样抗锯齿结果,可以与标准FXAA、MSAA结合使用以达到无与伦比的真实离线质量效果。由于其在保证高质量的同时仅需付出少量的性能成本,因此是所有VR项目中的理想选择。
  • Spatial-Temporal Attention Network for POI Recommendation: WWW21...
    优质
    本文提出了一种基于时空注意力机制的POI推荐模型,通过捕捉用户在不同时间和地点的行为模式,提升个性化推荐效果。发表于WWW 2021会议。 STAN:下一个位置建议的时空注意网络更新!该论文已被2021年的Web会议接受。会议上将有8分钟的口头演讲,提供更多细节和数据。 作者回复:感谢您对我们的工作感兴趣!对于上传错误文件一事深表歉意,请使用新的.py文件替换旧版本。 关于STAN运行速度低的问题(由于位置矩阵的记忆需求以及需要学习很长的序列),建议尝试按比例调整用户测试性能。如果增加更多用户,相应地增大embed_dim参数值。在屏幕上应能看到类似以下输出: 100%|██████████|| 100/100 [14:32 <00:00, 8.72s/it] 纪元:27,时间:23587.941201210022,valid_acc:[0.18 0.49 0.56 0.67]
  • Mining Heterogeneous Information Networks for Principles and Meta...
    优质
    《Mining Heterogeneous Information Networks for Principles and Metapath-based Applications》一书深入探讨了异构信息网络(HIN)领域的核心原则与元路径应用技术,为读者提供了全面的知识体系和实用案例分析。 《Mining Heterogeneous Information Networks for Principles and Methodologies》是由Han JiaWei编写的关于异构信息网络方面的理论书籍。
  • AVPro Video 1.3.9 for Unity
    优质
    AVPro Video 1.3.9 for Unity是一款专业的视频播放插件,支持多种格式和解码方式,为Unity游戏与应用开发提供高效稳定的视频解决方案。 AVPro Video Unity是一款视频播放插件,支持4K播放,并包含示例项目。
  • mai21-smartphone-isp-learned
    优质
    本项目mai21-smartphone-isp-learned专注于智能手机图像信号处理器(ISP)的深度学习优化技术研究与开发,致力于提升手机摄影体验和图像质量。 智能手机ISP的深度学习概述 该存储库提供了基线模型PUNET的实现,这个模型经过训练可以将直接从移动相机传感器获取的RAW Bayer数据转换为使用专业Fujifilm DSLR相机拍摄的照片,从而取代了整个手工制作的ISP相机产品线。提供的预训练PUNET模型可用于处理由Sony IMX586相机传感器捕获的RAW图像文件,并生成全分辨率12MP照片。 PUNET是从PyNET修改而来的类似UNet的架构,并且是项目的扩展。内容包括:继续训练、测试/推论;使用提供预先训练好的模型,以及自行获取模型并将检查点转换为pb格式;将.pb 文件转换为tflite文件进行TFLite推理(可选);一些有用的工具。 结果文件夹结构(默认) - 模型优化 - 常见问题 - 引文 - 执照 先决条件:Python,包括numpy、scipy、imageio和pillow套件。TensorFlow 1.15