Sisvel 专家展示 AI 驱动的编解码器优化方案

类别
音视频编码/解码
日期
2026年4月15日

首席技术官 Giovanni Ballocca 与工程师 Alessandra Mosca 所在的研究团队,利用 AI 将 EVC 压缩效率提升了 26%。

一支包括多名 Sisvel Tech 代表在内的研究团队将基于 AI 的工具集成至 MPEG-5 EVC 标准中,使该编解码器性能提升 26%。上个月,本领域顶级期刊《Multimedia Tools and Applications》《多媒体工具与应用》上发表了一篇同行评审论文,详细介绍该研究成果。

该研究在 MPAI 标准组织的支持下开展。该组织成立于 2020 年,致力于制定 AI 支持的数据编码规范。Sisvel 科技公司董事长兼首席执行官 Massimo Marcarini 担任 移动影像专家组(以下简称MPAI )董事会成员。

Sisvel 首席技术官 Giovanni Ballocca 与 Sisvel 技术专利工程师 Alessandra Mosca 均为该研究报告的八位作者之一;他们参与了数据整理与分析、实验实施及论文撰写工作。其他联合作者包括来自塞浦路斯 CYENS 卓越中心、都灵大学、巴黎高等理工学院、RAI 及 MPAI 的专家。

作者写道:“据我们所知,本项工作是首次尝试利用深度学习工具对 EVC 标准进行优化。”该研究选用由标准机构 MPEG 于 2020 年最终确定的一款 EVC 编解码器,是因为它在使用传统的非 AI 框架时,已经达到了业界顶尖的压缩效率。

本论文主要有两大贡献:

  1. 提出了一种用基于 AI 的工具替换 EVC 内部的两个编码模块的方法;

  2. 揭示了集成该基于 AI 的编码框架所带来的显著性能提升。

作者在 EVC 规范中确定了两个可通过神经网络实现优化的环节。第一个是超分辨率,即通过后处理将视频恢复至原始分辨率。AI 是完成此任务的理想选择,因为深度神经网络已被证明能够学习低分辨率图像与高分辨率图像之间的复杂映射关系。

AI 工具还被用于处理一种名为“帧内预测”的数据压缩过程。在此过程中,编解码器通过参考附近已解码的像素,预测某一像素块的视觉信息。

有关数据集、实验方式及结果的详细信息可查阅论文原文。此研究的核心结论为:BD-rate 指标提升 26%。BD-rate 是衡量压缩效率的核心指标,表示在保持视频质量不变的前提下,两种编解码器(或配置)之间的平均码率缩减量。

研究人员还表示,使用 AI 工具带来的性能提升具有叠加效应,而非孤立改进,且该方案应推广至实际应用场景中。

团队已明确多个未来研究方向:

  1. 应用环路滤波等先进技术,实现更高性能增益;

  2. 进一步优化所提出的 AI 架构,在保持效率提升的同时降低计算复杂度;以及

  3. 探索此类工具在其他视频编解码器中的应用。

点击此处查看全文。

相关文章

查看全部
新时代广播技术的全新愿景
Sisvel monogram数字视频和广播

新时代广播技术的全新愿景

阅读更多信息
AV2 时代将至,Sisvel 蓄势待发
Sisvel monogram音视频编码/解码

AV2 时代将至,Sisvel 蓄势待发

阅读更多信息

联系我们

请选择您希望联系的部门。

我感兴趣的模块