中国电信人工智能研究院(TeleAI)推出的生成式视频压缩技术(GVC),实现了0.02%的极致压缩率,标志着视频通信技术的一次范式转移。
一、技术突破:0.02%压缩率的惊人表现
2026年1月15日,中国电信人工智能研究院发布了一项突破性的视频压缩技术——GVC(Generative Video Compression)。这项技术将视频数据的压缩率提升到了
0.02%,这意味着原本1GB大小的视频文件,理论上仅需传输约
200KB的数据即可还原观看,且画质依然保持高清连贯。
核心性能指标
| 指标 | 传统技术(HEVC) | GVC技术 | 提升幅度 |
| 压缩率 |
约50%(相对H.264) |
0.02% |
2500倍 |
| 码率需求 |
100% |
约16.7% |
节省83.3%带宽 |
| 传输数据量 |
1GB |
200KB |
压缩5000倍 |
| 画质表现 |
低码率下严重模糊 |
高清连贯 |
显著优于传统 |

二、技术原理:从"像素搬运"到"语义生成"
传统视频压缩的局限性
传统视频编码技术(如H.265/HEVC、H.266/VVC)的核心逻辑是"像素搬运"。编码器通过复杂的算法去除冗余信息,尽量保留原始像素数据,再压缩传输。这种方式在宽带充足时效果良好,但在极低带宽环境下会迅速崩盘——为了传输,只能疯狂丢弃细节,导致画面糊成马赛克,甚至直接卡死。
GVC的颠覆性思路
GVC技术的核心逻辑是:
不再传递画面像素本身,而是传递"如何画出画面"的指令。这种"用计算换带宽"(Trading computation for bandwidth)的理念,彻底改变了视频传输的底层逻辑。
发送端:神经编码器
发送端不再传输完整的画面像素,而是通过神经编码器提取视频的"灵魂"信息,生成被称为
压缩Token的极小数据包。这些Token包含两类关键信息:
- 语义信息:场景中有什么(人、车、球等),物体的大致结构是什么,这是画面的骨架
- 运动信息:物体如何运动(移动方向、速度、运动趋势),这是画面的灵魂
这些Token的大小可压缩至
0.005-0.008 bpp(比特每像素),相比传统高清视频的0.1 bpp以上,数据量直接砍掉了两个数量级。
接收端:生成式视频解码器
接收端部署了预训练的
扩散模型(Diffusion Model),这个模型充当"AI画师"的角色。它根据接收到的Token指令,结合自身掌握的海量世界知识(如海浪、足球的视觉特征),实时"脑补"并生成出连贯、真实的视频画面。
通信理论的范式跨越
从香农-韦弗通信模型的角度看,GVC实现了从Level A(技术问题:传得准不准)直接跃升到Level C(有效性问题:能不能完成任务)。传统视频压缩在死磕数据传输的准确性,而GVC关注的是任务的有效性——只要生成的内容能让人看清或让机器准确分析,就达到了通信目的。
三、性能对比:GVC vs 传统编码

画质表现
在权威数据集上的测试显示,在同等视觉质量下,传统方法消耗的带宽是GVC的
6倍以上。使用LPIPS(感知画质评价指标)进行对比,GVC在极低码率下的画质显著优于传统HEVC标准。
语义准确性
GVC不仅为人眼观看设计,生成的视频在机器视觉任务(如视频物体分割)上的准确性也显著高于HEVC。这意味着压缩后的视频不仅在人眼观看时保持清晰,在机器识别和分析任务中也能保持准确的语义信息,这对于需要后续视频分析的应用场景尤为重要。
算力需求
经过模型小型化与知识蒸馏优化,GVC技术可在消费级硬件上运行。在RTX 4090等消费级显卡上,生成一组29帧的画面仅需约
0.95-1.35秒,适用于非实时或准实时场景。
四、应用场景:极端网络环境的救星
GVC技术专为极低带宽环境设计,有望解决以下极端网络场景中对高清视频传输的迫切需求:
1. 远洋海事通信
远洋货轮通常依赖狭窄带宽的卫星网络,传统视频传输在如此极端环境下几乎无法使用。GVC技术可以让船员在窄带卫星网络下流畅观看高清直播,实现远程医疗会诊、设备维修指导等关键应用。
2. 应急救援
灾区基站损毁时,网络信号极其微弱。无人机拍摄的现场画面经GVC压缩后,能以极小数据量传回指挥中心,让救援人员实时获取清晰的现场图像,为救援决策提供关键支持。
3. 深空探测与自动驾驶
深空探测器和自动驾驶汽车每天产生海量视频数据,传输和存储成本极高。GVC技术可以将这些数据压缩到极低体积,大幅降低传输成本,提升探测效率。
4. 卫星通信与边缘计算
在卫星通信、物联网边缘设备等带宽受限的场景中,GVC技术可以实现高清视频的稳定传输,为边缘智能应用提供数据支持。
五、技术背景:智传网理论体系
GVC技术建立在由中国电信提出的"
智传网"(AI Flow)理论体系之上。智传网是人工智能、通信、网络三项关键技术的融合,通过网络分层架构,基于智能体间的连接和交互,实现智能的传递和涌现。
三大数学定律
智传网理论体系包含三个核心数学定律:
- 信容律:打通通信与计算的边界,建立统一的度量方式。信息既可以通过计算获得,也可以通过通信传递
- 同源律:不同大小的家族模型可以根据资源需求,部署在端边云架构的不同节点上协同工作
- 集成律:定义多智能体协同所带来的增益上限,揭示智能涌现的内在规律
GVC技术正是"用计算换带宽"这一理念的成功实践,是智传网理论在视频通信领域的重要落地成果。
六、技术对比:GVC vs 传统编码标准
| 维度 | H.264/AVC | H.265/HEVC | H.266/VVC | GVC |
| 压缩效率 |
基准 |
比H.264高50% |
比H.265高50% |
比传统高2500倍 |
| 核心逻辑 |
像素搬运 |
像素搬运 |
像素搬运 |
语义生成 |
| 传输内容 |
像素数据 |
像素数据 |
像素数据 |
压缩Token |
| 带宽需求 |
100% |
50% |
25% |
0.02% |
| 解码复杂度 |
低 |
中 |
高 |
高(生成式) |
| 硬件要求 |
低端设备 |
中高端设备 |
高端设备 |
消费级GPU |
| 适用场景 |
全场景 |
高清/超高清 |
超高清/VR |
极端网络 |
七、未来展望:视频通信的新范式
GVC技术的发布标志着视频通信技术的一次重要演进。未来,视频传输可能不再依赖于庞大的原始数据,而是通过"语义指令"和"AI生成"的方式实现。这种转变将极大地降低通信成本,提升网络资源利用效率。随着技术的进一步完善,GVC有望在更多智能通信场景中得到应用,为边缘计算、物联网、远程医疗等领域提供支持。在未来的互联网里,流淌在光纤和电波中的,可能不再是庞大的原始数据,而是高度浓缩的智慧和指令。
八、技术报告与资源
- 技术报告:https://arxiv.org/abs/2512.24300
- 发布机构:中国电信人工智能研究院(TeleAI)
- 发布日期:2025年12月30日
GVC技术不仅是视频压缩领域的一次技术突破,更是通信范式从"数据传输"向"智能分发"转变的重要标志。它为解决极端网络环境下的视频传输难题提供了全新的解决方案,有望在远洋通信、应急救援、深空探测等领域发挥重要作用。