今年以来,疫情让互动课堂、线上会议、连麦等实时互动的场景迅速升温,数千万、数亿人的同时在线本来对网络就是一场巨大的考验,低延迟直播更对算力和网络提出前所未有的挑战。
作为在视频云领域一流的技术服务提供商,金山云不断在低延迟算法上进行探索优化,让码率带宽更加节剩
众所周知,低延迟直播需要具备较为苛刻的限制条件:1.带宽受限且面临弱网压力;2.对延迟的要求高;3.视频画面中变化并不丰富。用户对于编码、分发、渲染的延迟和画质损失的感知越低体验越好,就需要结合着三个客观条件进行针对性的优化。本文主要围绕第三点来讲述金山云低延迟直播的视频编码引擎算法优化。
人眼具有视觉掩蔽效应,对于不同平坦度、纹理、运动速度的画面内容,人眼敏感度不同。在损失相同的信息量的条件下,相对平坦或者静止区域的信息损失往往更容易被人眼察觉,而相对的纹理复杂或者更动态区域的画质损失则更易被人忽视。这成为金山云低延迟直播编码器优化的理论依据,有基于此,金山云从编码器上对算法进行了深度的优化。
在码率控制层面,很多编码器都会在量化阶段根据图像的复杂度来进行块级别QP(Quant Param,量化参数)值的调整,与它们不同的是,金山云则进一步在像素级进行QP的优化。简单地讲,在变换编码阶段之前根据人眼主观在各像素的最大损失容忍度模型,调整像素残差以减小图像频谱中的高频分量值。优势在于能够精细地保留像素级细节,同时所生成的特征图较为直观且具备可解释性,有利于后续调参,也使得其在编码器层面变得可控。