网上虚拟银行注册网站,wordpress编辑器替换,航天桥网站建设,做网站和做商城的区别在哪里与传统标准动态范围#xff08; SDR#xff09;视频相比#xff0c;高动态范围#xff08; HDR#xff09;视频由于比特深度的增加提供了更加丰富的亮区细节和暗区细节。最新的显示技术通过清晰地再现 HDR 视频内容使得为用户提供身临其境的观看体验成为可能。面对目前日益…与传统标准动态范围 SDR视频相比高动态范围 HDR视频由于比特深度的增加提供了更加丰富的亮区细节和暗区细节。最新的显示技术通过清晰地再现 HDR 视频内容使得为用户提供身临其境的观看体验成为可能。面对目前日益增长的 HDR 视频消费需求研究现有的压缩工具或引入新的技术来高效压缩 HDR 视频变得十分迫切。本文将介绍有关MPEG 及 VCEG 针对 HDR 视频压缩的一些工作。
1 背景
传统电视和 显示器 上显示的 视频信 号为标准 动态范 围视频 设计的 亮度 范围为0.01cd/m2 到 100cd/m2对比度为 10000 1。 而在现实世界中亮度范围要大得多 例如阳光照射的云层具有 100000 cd/m2 的亮度而夜空的亮度仅为 0.0001 cd/m2。 近年来显示器的亮度峰值持续在增加市面上已经出现了亮度峰值可以达到 1000cd/m2 的电视机产品而一些专业的监视器则可以达到 10000cd/m2这些显示器大多基于 LCD 技术以及 LED 背光使得亮度峰值能够达到较高的水平。 OLED 显示器也可以达到一个很高的亮度级别但峰值略低于 LCD LED 技术不过 OLED 的优点是其暗度可以达到 0.0005cd/m2。
超高清电视 UHDTV的关键目标之一是增强用户观看视频时的体验 也就是所谓的“沉浸感”和“真实感”。仅仅依靠提高分辨率不足以完全达到这一目的也无法创建、捕捉和显示比今天的电视机具有更高峰值亮度和更大对比度的视频内容。高动态范围 HDR视频的目的是提高每个像素还原视频真实场景内容的能力特别是最亮像素的亮度增加同时最暗像素可以变得更暗。另外 呈现更强的真实感需要提供更加丰富的色彩 因此必须使用具有较大色域范围的颜色空间宽色域 WCG 来表示更加饱满的色彩。因此 高动态范围 HDR与宽色域 WCG相结合可以使视频看起来更加清晰、逼真与传统的标准动态范围视频相比 能够有效改善用户的视频观看体验。
与 SDR 视频相比可以从以下几个方面了解 HDR 视频的效果
即使分辨率没有改变图像也可能看起来更加清晰。人眼将清晰度视为分辨率和对比度的组合。因此当对比度增加时 人眼感知的清晰度也会增加。因此 HD 和 4K 视频都可以通过高动态范围 HDR 增强视觉效果。明亮的物体看起来会更加逼真。许多物体包含明亮区域即使很小 也可能会影响观看效果因为它们比周围环境更亮。 HDR 视频会以较高的保真度地表现明亮区域的细节增加水面、玻璃表面、 金属表面等物体的真实感。阴影区域中的细节可能会增加。在 SDR 视频中 较暗区域看起来是均匀和平坦的而在 HDR 视频相同场景下可以清楚地看到阴影中的细节。HDR 和 WCG 的组合还会产生更加饱满的色彩。对于诸如天空之类的明亮物体 HDR和 WGC 允许出现明亮且同时饱满的颜色。
2 HDR 发展历程
2.1 ITU-R for SDR and HDR
在 ITU-R 的建议书中描述了用于表示 SDR 和 HDR 视频格式的基本技术规范。 其中 BT.709“ Parameter values for the HDTV standards for production and international programme exchange”包括了如何将 8 比特线性的 RGB 图像信号转换为非线性的 R’G’B’信号这个转换通常称为光电转换函数 opto-electronic transfer function, OETF。 BT.709 还包含了 CIE1931 色度坐标的定义 以及从 R’G’B’向 Y’CbCr 颜色空间转换方法的介绍。实际上相比于色度的变化人眼对于亮度的变化更为敏感因此通过这种转换之后就可以降低色度分量的空间采样率。但应该注意的是亮度分量并不直接对应于实际的亮度信息一部分亮度信息包含在色度分量中这就会导致在对色度分量进行下采样时也会对亮度信息产生影响这种现象称为色度泄漏 chroma leakage这对 HDR 视频的影响会比 SDR 视频更严重下文会讨论关于色度泄漏的解决方法。 BT.1886 “ Reference electro-optical transfer function for flat panel display used inHDTV studio production”中介绍了从非线性 R’G’B’信号向线性 RGB 信号转换的操作方法该转换操作在视频内容显示前进行称为电光转换函数 electro-optical transfer function, EOTF。这里提出的电光转换方程 EOTF 与 BT.709 标准中的光电转换方程 OETF 并不是互逆的关系此 EOTF 和逆 OETF 转换函数的差异可以用一个光电光学转换函数 opto-optical transferfunction或系统参数 gamma 来表示该 gamma 参数能够使得图像看起来更加自然真切。BT.2035 “ A reference viewing environment for evaluation of HDTV programme material orcompleted programmes”中给出了视频观看环境的参考设置其中规定了 亮度范围为0.01cd/m2 到 100cd/m2。
BT.2020“ Parameter values for ultra-high definition television systems for production andinternational programme exchange”中引入了 4K 3840x2160分辨率和宽色域 WCG的概念。宽色域意味着其基色范围相对于传统视频更广因而可以显示出更加饱满的颜色例如深蓝、品红、荧光绿等。但需要注意的是没有 HDR 的 WCG 其效果是很有限的同样地不引入 WCG 的 HDR 视频也是没有太大意义的 因此 HDR 和 WCG 可以很自然地结合起来用于改善每个像素点的重建效果呈现出更为生动的视频内容。 此外 如前文所述 HDR 和WCG 产生的效果几乎完全独立于空间分辨率因此可以灵活应用在 4K 分辨率及 1080p 分辨率视频中。 与此同时 BT.2020 包括了与 BT.709 相同的非恒定亮度颜色空间转换还包括可以直接应用在 RGB 信号上的恒定亮度转换。在恒定亮度下 OETF 在使用前要先进行颜色空间转换 但这种方法没有非恒定亮度那样应用广泛。
BT.2100“ Image parameter values for high dynamic range television for use in production andinternational programme exchange” 中介绍了两种不同的 HDR 转换函数 HLG Hybrid LogGamma和 PQ perceptual quantization。 HLG 的光电转换函数 OETF 与 ARIB STD-B67 中的OETF 是相同的并且对支持 WCG BT.2020的 SDR 显示器有一定的兼容性但需要注意的是 HLG 本身不兼容只支持 BT.709 色域的显示器。 PQ 电光转换函数 EOTF 与 SMPTE ST.2084 中的 EOTF 相同并具有与人类视觉系统中分布比较一致的亮度级。 SMPTE ST.2084 于 2013 年发布近年来被广泛应用于工业界并被多个不同的标准组织采纳。 MPEG 和 JCT-VC 相关的工作已经将 PQ 电光转换函数 EOTF 作为研究和测试的基准。此外 BT.2100 中的颜色基色与颜色空间转换和 BT.2020 中给出的一致。 图 10-1 PQ左和 HLG右转换曲线
2.2 MPEG 和 VCEG 关于 HDR 的工作
MPEG 在 2013 年开始研究 HDR 视频压缩时进行了多项探索性的研究测试 主要思路是将 HDR 视频压缩和处理过程的各部分分开来研究 例如在此期间研究了不同的电光转换函数并对不同的颜色格式转换和采样方法进行了测试和评估与此同时还研究了一些主观视频质量测试方法和客观视频质量评价指标。可以预计的是传统的基于像素误差的评价指标如 PSNR 在高精度 HDR 视频的评价中无法提供太多有价值的参考信息。目前已提出了一些专门针对 HDR 视频的质量指标例如 wPSNR、 tPSNR-Y、 deltaE100、 PSNR-L100 等但仍然没有一个主客观评估结果较为一致的评价指标。
2015 年初 MPEG 决定发布针对 HDR 和 WCG 视频压缩技术标准的 CfE[1]目的是为了确定当前是否存在能够改善 HDR 视频压缩性能的新技术。 CfE 中给出了一个参考配置作为对比基准 Anchor 1.0其中大部分技术方案与 HDR10 在下一节介绍 完全兼容。 Anchor 1.0 使用 PQ 电光转换函数、 Y’CbCr 颜色空间、 HEVC Main10 压缩配置基于未修改的 HEVC 参考软件 HM 进行编码并使用 HDR Tools 软件包[2]来实现必要的预处理和后处理转换步骤。 HDRTools 本身是开源免费的其在 MPEG 和 VCEG 进行的多种评估测试中都有所应用。
CfE 提出后收到了来自 Apple、 Arris、 BBC、 Dolby、 Ericsson、 FastVDO、 InterDigital、MovieLabs、 NGCodec、 Philips、 Qualcomm、 Technicolor、 University of Warwick/goHDR 等总共9 种不同的技术提案所有提案的编码结果在两个独立的实验室分别进行了主观评测得到的结果与 Anchor 1.0 进行了对比。主观评测结果显示在很多序列上部分提案的结果相比Anchor 1.0 有明显的提升[3]。
与此同时 CfE 中的一些序列测试结果表明可以通过 chroma QP offset [4]第 3 节介绍 将少量比特从亮度分量转移到色度分量从而可以减少色度失真。此外也发现在 Anchor1.0 中分配给图像暗区的比特过多 而分配给亮区的比特太少[5]为此引入了亮度调整 LumaAdjustment第 3 节介绍方法。 最后综合多种新的改进技术形成了另一个基准 Anchor 3.2。相对于 Anchor 1.0 Anchor 3.2 在各个方面都有很大程度的改善。 与 Anchor 1.0 中的方法相比同等视觉质量条件下 Anchor 3.2 可以实现大约平均 27的比特率降低使用 MOS BDRate 计算。 不过应该注意的是 Anchor 3.2 中的改变都发生在 HEVC 编码端 而在解码端没有作任何改变也就是说 Anchor 3.2 与 HDR10 完全兼容。 Anchor 3.2 与 Anchor 1.0 的编码结果对比如图 2 所示。 图 10-2 Anchor 1.0左和 Anchor 3.2右在相同码率下的压缩效果
在 2016 年 2 月的 MPEG 会议上对已有工作进行了分析后得出结论暂时没有找到一套明确的技术方案能够依此建立针对 HDR 视频的新的 HEVC 规范因此研究重点转向了技术报告。 MPEG 和 VCEG 随后的研究工作明确了与 HDR 视频转换和压缩相关的技术特性并形成了一份记录这些特性的技术报告用来指导 HDR 视频的处理过程即对支持 PQ 转换函数、 4:2:0 Y’CbCr 并使用 HEVC Main10 Profile 的 HDR 编码方案 也就是 Anchor 3.2 中所包含的编码 HDR 视频的方案提供技术参考。 该技术报告从 2015 年就开始着手准备了第一个正式的版本在 2016 年 2 月发布随后被确定为 MPEG-H 的一个新的部分也就是 MPEG-H Part14。 该技术报告的第一版为“ Conversion and coding practices for HDR/WCG video” [6]后来标题变得更加具体 即为 “ Conversion and Coding Practices for HDR/WCG Y’CbCr 4:2:0 Videowith PQ Transfer Characteristics” [7]。
这份技术报告所描述的 HDR 视频处理流程如图 3 所示其中包括 BT.2020 中所规定的线性 RGB 图像信号向 10 比特、窄范围、 PQ 转换函数、 4:2:0 采样率、非恒定亮度 Y’CbCr 图像信号进行转换时所必需的预处理步骤具体包括 EOTF 的应用、颜色空间转换、量化和色度下采样等转换操作。 相应地 该报告还介绍了在 HDR 视频解码之后执行的后处理转换步骤这些步骤用于将视频信号转换回线性的 RGB 表示从而能够在显示器上显示。 此外 中间编码部分的介绍并不是对视频编码的完整描述只是突出说明了针对 HDR 视频压缩的两种有效的方法基于平均亮度水平的 QP 自适应选择和基于内容色域的色度 QP 偏移这两种方法将在本文第三部分详细介绍。 图 10-3 HDR 视频处理流程[7]
2.3 基于 HEVC 的 HDR 方案
HEVC 具有较高的压缩效率支持 10 比特精度、 HDR 转换函数和 WCG是 HDR/WCG 视频数据的理想载体。 [8]中给出了将 HEVC 编码器及其 Main10 配置文件用于消费者 HDR/WCG应用的可行性。该报告记录了使用 HEVC Main10 配置文件和 BT.2100 PQ 转换函数在不同比特率下编码 HDR 后所进行的一些主观测试结果。该报告的结论是 HEVC Main 10 配置文件确实能够以行业常见的比特率高质量地编码 HDR/WCG 视频而无需对 HEVC 标准进行任何进一步的修改。 [7]中具体给出了关于如何使用 HEVC 和 PQ 函数转换 HDR 视频以进行高效压缩而[9]中给出了一些使用 HEVC 和 HLG 函数进行 HDR 视频编码的指导性方案。
HEVC 编码器、 10 比特精度、 BT.2100 色彩基色和 PQ 转换函数的组合通常称为 PQ10同样 HEVC 编码器、 10 比特精度、 BT.2100 色彩基色和 HLG 转换函数通常称为 HLG10。 PQ10和 HLG10 编码 HDR 的方案目前已被许多标准化机构采用和部署其中包括 ETSI / DVB 2017 年 2 月发布的技术规范 2.3.1 版本中 UHD 第 2 阶段部署采用 HEVC 编码包括使用 PQ10 或 HLG10 方案。 BD ROM BDA Blu-ray Disc Association是最早支持 HDR 视频的行业组织之一 编码方案中采用了多个不同的 HDR 关键技术其中主要使用的是 HDR10。 HDR10 技术涵盖 PQ 转换函数、BT.2020 色域、 非恒定亮度 Y’CbCr 颜色空间、 4:2:0 采样格式、 采用 HEVC Main10 编码配置。在实际应用时 HDR10 中还包括一些常用的元数据比如 Mastering Display Colour Information及 Content Light Level Information 等。2015 年 7 月发布的用于蓝光光盘的技术规范 3.0 版本支持 HEVC Main 10 Profile Level5.1最高码率 100 Mbps分辨率为 HD 或 4K帧率 24-60fps 兼容 PQ10 方案。 Ultra HD Forum 2017 年 4 月 1 日发布的技术规范“ UHD Phase A 内容参数”指定使用 HEVC Main10 编码配置并采用 PQ10 或 HLG10 中的颜色表示方案。 3GPP 基于感知量化器 PQ 并遵循 ITU-R BT.2100 颜色格式的 HDR 方案被添加到了 3GPP TS 26.116 电视视频配置集中 具体包括 HEVC Main10 编码方案转换函数、 颜色基色和相关元数据的规定以及与 PSS分组交换流和 MBMS多媒体广播和多播服务的集成。 ATSC 3.0 使用 PQ10 或 HLG10 方案编码 HDR 视频。 除了标准化机构采用 PQ10 和 HLG10 之外还有许多商业机构直接使用 HEVC 标准进行HDR/WCG 编码、传输和播放其中包括行业领先的流媒体服务商、主流的手机和电视制造商。 目前基本上市场上所有销售的具有 HDR 功能的电视机都内置了 10 比特 HEVC 解码器。
3 HDR 视频编码端的关键技术
3.1 Luma adjustment
之前已经提到在 Y’CbCr 表示中一些亮度信息携带在色度分量中当色度分量进行下采样时可能出现色度泄漏。对于 HDR 视频由于 PQ 电光转换函数 EOTF 具有高度非线性特性以及相邻像素之间的亮度可能显著不同这种影响可能非常大。图 4 给出了色度泄漏的示例并在之后介绍了如何使用亮度调整方法解决此问题。应当注意该例子使用了 BT.709容器中所有可用的色度代码值并在 BT.709 显示器上分级显示。这是因为在 MPEG 中暂时没有可用的具有完整 BT.2020 色域的测试材料但是对于 BT.2020 容器中的测试材料预期也会具有类似的效果。因此图 4 中的示例经过了色调映射以便能够在 SDR 显示器中呈现。 图 10-4 色度泄漏示例 a.原图 4:4:4 b.色度下采样图 4:2:0 c. Luma adjustment
如图 5 所示亮度调整方法[10]增加了色度上采样环节使得 Cb 和 Cr 信息参与到亮度分量的调整中来以确保解码后在对色度进行上采样时保留有价值的亮度信息如图 6 所示。 图 10-5 编码预处理过程亮度调整方法示意图 图 10-6 解码后处理过程示意图
在后处理阶段根据亮度调整值Yadjust ′ 和经过上采样反量化得到的Cb ̃和Cr ̃经过一系列转换可以得到重建值{R̃, G̃, B̃}确保RGB ̃能够接近最初的RGB是优化的目标。 RGB ̃和RGB之间的差异可以表示如下 D D i f f ( R G B , R G B ~ ) (1) DDiff(RGB,\tilde{RGB})\tag{1} DDiff(RGB,RGB~)(1) 一般采用基于权重的误差和来表示 D权重 wR, wG, wB 可以设定为各分量对亮度的贡献比例。 D ( W R ∗ ( R ~ − R ) W G ∗ ( G ~ − G ) W B ∗ ( B ~ − B ) ) 2 (2) D(W_R\ast(\tilde{R}-R)W_G\ast(\tilde{G}-G)W_B\ast(\tilde{B}-B))^2\tag{2} D(WR∗(R~−R)WG∗(G~−G)WB∗(B~−B))2(2) 根据 R 和R′之间的 EOTF 转换关系上式等价于 D ( W R ∗ ( E O T F ( R ′ ~ ) − E O T F ( R ′ ) ) W G ∗ ( E O T F ( G ′ ~ ) − E O T F ( G ′ ) ) W B ∗ ( E O T F ( B ′ ~ ) − E O T F ( B ′ ) ) ) 2 (3) D(W_R\ast(EOTF(\tilde{R^\prime})-EOTF(R^\prime))W_G\ast(EOTF(\tilde{G^\prime})-EOTF(G^\prime))W_B\ast(EOTF(\tilde{B^\prime})-EOTF(B^\prime)))^2\tag{3} D(WR∗(EOTF(R′~)−EOTF(R′))WG∗(EOTF(G′~)−EOTF(G′))WB∗(EOTF(B′~)−EOTF(B′)))2(3) 其中 EOTF()为 PQ EOTF。为了得到可以收敛的结果对EOTF()进行泰勒级数展开 E O T F ( x i △ ) ≈ E O T F ( x i ) E O T F ′ ( x i ) ∗ △ x (4) EOTF(x_i\triangle)\approx EOTF(x_i)EOTF^\prime(x_i)\ast \triangle_x\tag{4} EOTF(xi△)≈EOTF(xi)EOTF′(xi)∗△x(4) EOTF′()是EOTF()关于 x 在 xi 处的一阶导数。将(4)式带入(3)式可得 D ( W R ∗ E O T F ′ ( R ′ ) ∗ △ R W G ∗ E O T F ′ ( G ′ ) ∗ △ G W B ∗ E O T F ′ ( B ′ ) ∗ △ B ) 2 (5) D(W_R\ast EOTF^\prime(R^\prime)\ast \triangle_RW_G\ast EOTF^\prime(G^\prime)\ast \triangle_GW_B\ast EOTF^\prime(B^\prime)\ast \triangle_B)^2\tag{5} D(WR∗EOTF′(R′)∗△RWG∗EOTF′(G′)∗△GWB∗EOTF′(B′)∗△B)2(5) 由于 RGB与 YCb ̃Cr ̃之间可以进行如下转换 [ R ′ G ′ B ′ ] A [ Y ′ C b C r ] W − 1 [ Y ′ C b C r ] 1 d e t ( W ) a d j ( W ) [ Y ′ C b C r ] [ Y ′ C b C r ] [ a R Y a R C b a R C r a G Y a G C b a G C r a B Y a B C b a B C r ] (6) \begin{bmatrix}R^\prime\\G^\prime\\B^\prime\\ \end{bmatrix} A\begin{bmatrix}Y^\prime\\Cb\\Cr\\ \end{bmatrix} W^{-1}\begin{bmatrix}Y^\prime\\Cb\\Cr\\ \end{bmatrix} \frac{1}{det(W)}adj(W)\begin{bmatrix}Y^\prime\\Cb\\Cr\\ \end{bmatrix} \begin{bmatrix}Y^\prime\\Cb\\Cr\\ \end{bmatrix} \begin{bmatrix}a_{RY} a_{RCb} a_{RCr}\\a_{GY} a_{GCb} a_{GCr}\\a_{BY} a_{BCb} a_{BCr}\\ \end{bmatrix}\tag{6} R′G′B′ A Y′CbCr W−1 Y′CbCr det(W)1adj(W) Y′CbCr Y′CbCr aRYaGYaBYaRCbaGCbaBCbaRCraGCraBCr (6) 将上式代入(5)式替换掉变化量 D 可表示为如下所示记为(7)式。 ( W R ∗ E O T F ′ ( R ′ ) ∗ ( a R Y ∗ Y a d j u s t ′ a R C b ∗ C b ~ a R C r ∗ C r ~ − ( a R Y ∗ Y ′ a R C b ∗ C b a R C r ∗ C r ) W G ∗ E O T F ′ ( G ′ ) ∗ ( a G Y ∗ Y a d j u s t ′ a G C b ∗ C b ~ a G C r ∗ C r ~ − ( a G Y ∗ Y ′ a G C b ∗ C b a G C r ∗ C r ) W B ∗ E O T F ′ ( B ′ ) ∗ ( a B Y ∗ Y a d j u s t ′ a B C b ∗ C b ~ a B C r ∗ C r ~ − ( a B Y ∗ Y ′ a B C b ∗ C b a B C r ∗ C r ) ) 2 (7) (W_R\ast EOTF^\prime(R^\prime)\ast(a_{RY}\ast Y^\prime_{adjust}a_{RCb}\ast\tilde{Cb}a_{RCr}\ast \tilde{Cr}-(a_{RY}\ast Y^\primea_{RCb}\ast Cba_{RCr}\ast Cr)\\ W_G\ast EOTF^\prime(G^\prime)\ast(a_{GY}\ast Y^\prime_{adjust}a_{GCb}\ast\tilde{Cb}a_{GCr}\ast \tilde{Cr}-(a_{GY}\ast Y^\primea_{GCb}\ast Cba_{GCr}\ast Cr)\\ W_B\ast EOTF^\prime(B^\prime)\ast(a_{BY}\ast Y^\prime_{adjust}a_{BCb}\ast\tilde{Cb}a_{BCr}\ast \tilde{Cr}-(a_{BY}\ast Y^\primea_{BCb}\ast Cba_{BCr}\ast Cr))^2\tag{7} (WR∗EOTF′(R′)∗(aRY∗Yadjust′aRCb∗Cb~aRCr∗Cr~−(aRY∗Y′aRCb∗CbaRCr∗Cr)WG∗EOTF′(G′)∗(aGY∗Yadjust′aGCb∗Cb~aGCr∗Cr~−(aGY∗Y′aGCb∗CbaGCr∗Cr)WB∗EOTF′(B′)∗(aBY∗Yadjust′aBCb∗Cb~aBCr∗Cr~−(aBY∗Y′aBCb∗CbaBCr∗Cr))2(7) 经过矩阵 A 的系数替换之后可简化为 D ( W R ∗ E O T F ′ ( R ′ ) ∗ ( Y a d j u s t ′ − e R ) W G ∗ E O T F ′ ( G ′ ) ∗ ( Y a d j u s t ′ − e G ) W B ∗ E O T F ′ ( B ′ ) ∗ ( Y a d j u s t ′ − e B ) ) 2 (8) D(W_R\ast EOTF^{\prime(R^\prime)}\ast(Y^\prime_{adjust}-e_R)W_G\ast EOTF^{\prime(G^\prime)}\ast(Y^\prime_{adjust}-e_G)W_B\ast EOTF^{\prime(B^\prime)}\ast(Y^\prime_{adjust}-e_B))^2\tag{8} D(WR∗EOTF′(R′)∗(Yadjust′−eR)WG∗EOTF′(G′)∗(Yadjust′−eG)WB∗EOTF′(B′)∗(Yadjust′−eB))2(8) 其中部分系数如下所示 e R Y ′ − ( C r ~ − C r ) ∗ a R C r ′ (9) e_RY^\prime-(\tilde{Cr}-Cr)\ast a_{RCr^\prime}\tag{9} eRY′−(Cr~−Cr)∗aRCr′(9) e G Y ′ − ( C b ~ − C b ) ∗ a G C b − ( C r ~ − C r ) ∗ a G C r ′ (10) e_GY^\prime-(\tilde{Cb}-Cb)\ast a_{GCb}-(\tilde{Cr}-Cr)\ast a_{GCr^\prime}\tag{10} eGY′−(Cb~−Cb)∗aGCb−(Cr~−Cr)∗aGCr′(10) e B Y ′ − ( C b ~ − C b ) ∗ a B C b ′ (11) e_BY^\prime-(\tilde{Cb}-Cb)\ast a_{BCb^\prime}\tag{11} eBY′−(Cb~−Cb)∗aBCb′(11)
为了得到(8)式的局部最优解对其关于Yadjust ′ 求导并令 D 为 0 可得 Y a d j u s t ′ W R ∗ E O T F ′ ( R ′ ) ∗ e R W G ∗ E O T F ′ ( G ′ ) ∗ e G W B ∗ E O T F ′ ( B ′ ) ∗ e B W R ∗ E O T F ′ ( R ′ ) W G ∗ E O T F ′ ( G ′ ) W B ∗ E O T F ′ ( B ′ ) (12) Y^\prime_{adjust}\frac {W_R\ast EOTF^\prime(R^\prime)\ast e_RW_G\ast EOTF^\prime(G^\prime)\ast e_GW_B\ast EOTF^\prime(B^\prime)\ast e_B} {W_R\ast EOTF^\prime(R^\prime)W_G\ast EOTF^\prime(G^\prime)W_B\ast EOTF^\prime(B^\prime)}\tag{12} Yadjust′WR∗EOTF′(R′)WG∗EOTF′(G′)WB∗EOTF′(B′)WR∗EOTF′(R′)∗eRWG∗EOTF′(G′)∗eGWB∗EOTF′(B′)∗eB(12) 计算(12)式即可求导调整后的亮度值Yadjust ′ 。
3.2 QP selection based on average luma
对于 SDR 数据使用的是 BT.709 中的幂律转换函数而 HDR/WCG 数据则一般使用在SMPTE ST 2084 和 BT.2100 中定义的 PQ 转换函数因此经过处理后数据特性会有很大差别可以使用 BT.709 转换函数和 BT.2100 PQ 转换函数处理相同的 SDR 数据来观察这一差异。对于 10 比特的数据如果源数据的亮度峰值为 100cd/m2 并使用 BT.709 转换函数亮度分量分布在 64-940而如果使用 BT.2100 PQ 转换函数亮度分量分布在 64-590可以看到两者范围差异较大。如果使用 PQ 时在 code level 为 509 100cd/m2附近出现一些扰动 /- 1等价于使用 BT.709 在 code level 为 940 100cd/m2出现/- 4 的扰动。与此同时使用 PQ时在 code level 为 80 0.01cd/m2附近出现一些扰动 /- 1等价于使用 BT.709 在 codelevel 为 80 0.01cd/m2出现/- 1 的扰动。因此可以推断如果编码器在亮区和暗区附近使用相同的方式处理 1 个 code level 的误差那么相对 BT.709 使用 PQ 时将会在亮区 100cd/m2产生 4 倍左右的误差。也就是说从 BT.709 切换到 PQ 将会导致许多比特从亮区重新分配到暗区。因此原先针对 BT.709 在亮区和暗区取得较好平衡的编码器如果不做修改而直接使用 PQ则分配给亮区的比特过少暗区的比特过多所以亮区就会出现失真对于 HDR/WCG数据会表现得更加明显。一种常见的做法是基于局部块的平均亮度值自适应地调整块的 QP。
许多编码器都采用了自适应 QP 选择的方法。在 HEVC 中可以单独为每个编码单元设置 QP以便使得比特分配与人类视觉系统特性保持一致。通常对于平坦区域低方差使用较低的 QP 并且对于纹理密集的区域高方差使用较高的 QP。此外在其他一些系统中还可能会考虑亮度、边缘、运动等特性。但这些方法都是针对 SDR 内容特性的。对于使用 PQ 电光转换函数的 HDR 视频需要考虑上述转换函数带来的数据特性上的改变。具体地 通过对具有较低平均亮度值的块暗区域使用较高的 QP而对具有较高平均亮度值的块亮区域使用较低的 QP可以有效改善图像的主观质量。下面给出一个基于平均亮度进行自适应量化的示例。 Q P P Q Q P 709 d Q P ( i n t L ) (13) QP_{PQ}QP_{709}dQP(int_L)\tag{13} QPPQQP709dQP(intL)(13) intL 表示局部 64x64 CTU 编码块的平均亮度值 Laverage intL Round(Laverage)。 dQP 与 int的对应关系通过如下查找表和图 7 给出。
表 1 dQP 与 intL 之间的对应关系
luma intL rangedQPintL 3013301 ≤ intL 3672367 ≤ intL 4341434 ≤ intL 5010501 ≤ intL 567-1567 ≤ intL 634-2634 ≤ intL 701-3701 ≤ intL 767-4767 ≤ intL 834-5intL ≥ 834-6 图 10-7 dQP 与 intL 之间的对应关系
3.3 Chroma QP offset based on content colour gamut
针对使用 BT.709 色域和光电转换函数的 SDR 内容现有的编码器配置已经可以在亮度和色度之间取得较好的平衡。对于 HDR 视频与 SDR 视频相比 PQ EOTF 和 BT.2020 色彩基色的组合会使得 Cb 和 Cr 的取值更加紧密地聚集在零附近。因此使用同样的编码配置编码HDR 视频可能不会获得与 SDR 类似的性能。 具体在编码 HDR 视频时 过于集中的色度分量在量化过程中会出现丢失此时比特分配会从色度分量向亮度分量偏移。如果没有为色度分量分配足够多的比特就会产生色度失真例如白色区域中会出现青色和品红色如图 2左图所示窗户和伞内区域发散出了多种颜色。
HEVC 中的 Chroma QP offset调节着亮度 QP 与色度 QP 之间的平衡关系。通过对 Cb 和Cr 单独设置色度 QP 偏移可以确保在亮度使用较高的 QP 值时色度 QP 仍然维持在一个正常的水平使得在量化期间不会发生较为严重的色度信息丢失。例如在失真较为严重的低码率情况对 Chroma QP offset 取一个较大的负值能够有效减少色度失真在码率增加到某个点时色度分量的质量可能已经足够好了所以在高码率情况下可以采取较小的偏移值甚至设为 0。 另外 如果在编码过程中已知视频内容没有应用全色域通过分析视频或视频附带的元数据可知则可以进一步优化色度 QP 偏移以提供更好的编码结果。
以下给出了设置 chroma QP offset 的一个例子。假定已知 HDR 捕捉和显示设备的颜色基色 chroma QP offset 可以基于亮度 QP 值和基色因子ccbccr采用下式给出的模型进行计算 Q P o f f s e t C b C l i p 3 ( − 12 , 0 , R o u n d ( C c b ∗ ( k ∗ Q P 1 ) ) ) (14) QPoffsetCbClip3(-12,0,Round(C_{cb}\ast(k\ast QP1)))\tag{14} QPoffsetCbClip3(−12,0,Round(Ccb∗(k∗QP1)))(14) Q P o f f s e t C r C l i p 3 ( − 12 , 0 , R o u n d ( C c r ∗ ( k ∗ Q P 1 ) ) ) (15) QPoffsetCrClip3(-12,0,Round(C_{cr}\ast(k\ast QP1)))\tag{15} QPoffsetCrClip3(−12,0,Round(Ccr∗(k∗QP1)))(15)
如果 HDR 捕捉和显示设备的颜色基色相同则 ccb 1 ccr 1。如果捕捉设备采用 P3D65基色显示设备采用 BT.2020则 ccb 1.04 ccr 1.39。如果捕捉设备采用 BT.709显示设备采用 BT.2020则 ccb 1.14 ccr 1.78。最后 k -0.46 l 0.26。