学术交流
当前位置:
  • 首页
  • >
  • 学术交流
  • >
  • 专题研讨

超高清晰度电视系统概貌

2014-11-27 22:11 来源:电视技术

责编:陈默

                      超高清晰度电视系统概貌
                                           潘榕 李桂苓

超高清晰度电视(Ultra High Definition Television,UHDTV)致力于“在与家庭和公共场所使用环境相对应的合适显示器尺寸上,呈现几乎涵盖人类视野全部范围的宽视场,从而为观众提供增强的视觉体验”。第一部完善的UHDTV标准由SMPTE于2009年制定并颁布,随后ITU于2012年颁布了Rec. ITU-R BT.2020《超高清晰度电视系统节目制作和国际交换用参数值》。SMPTE和ITU的这两部标准核心内容区别不大,且两者分别在2013年和2014年进行了版本更新。UHDTV标准的颁布,带动了各国试验UHDTV系统和试播UHDTV节目的热潮,我国辽宁省大连市也通过有线广播方式,于2014年8月第一次在国内试播了UHDTV节目。

1UHDTV系统模型

UHDTV系统包含几个关键环节:节目制作、压缩编码、传送、接收解码和显示。UHDTV的系统模型如图1所示。

2UHDTV节目参数
2.1 基本参数

用于UHDTV节目制作和交换用的参数见SMPTE ST 2036-1和Rec. ITU-R BT.2020-1。以上两个标准所给的参数基本一致,主要区别在于前者没有规定恒定亮度,且允许HDTV中的色度参数作为UHDTV中可选的参数。部分基本参数如表1所示。
2.1.1 宽高比
宽高比是图像的基本性质之一,不同宽高比之间的转换必然会带来可以观察到的失真现象。但人们选择何种宽高比并没有美学或生理上的依据。对于UHDTV的宽高比而言,选择16 ∶9的原因只是在ITU-R BT.1201建议书中,将极高分辨率成像(Extremely High Resolution Imagery,EHRI)的分辨率简单设定为1 920×1 080的整数倍,从而UHDTV也沿袭了16 ∶9的宽高比。

2.1.2 像素数
所需视场和清晰度的大小决定了像素数(或像素每单位视角):3 840×2 160(以下简称4K以及对应UHDTV4K)和7 680 × 4 320(以下简称8K,对应UHDTV8K)。

2.1.3 帧频
BT.2020规定了超高清视频的最高帧频可以达到120 Hz。这是因为随着超高清画面视角的加大,人类视觉系统的临界闪烁频率(Critical FlickerFrequencies,CFF)也随之提高,因此需要提高帧频,减少人们在观看UHDTV节目时对闪烁的感知。另外,当系统的视场变大时,物体速度(角度/秒)通常会趋向于变快。例如,保持拍摄角度不变,HDTV屏幕上的物体会比SDTV屏幕上的运动更快,而保持类型显示器(如LCD)会有运动感知模糊的问题,需要在某一帧频上,在闪烁和运动感知模糊之间做出折中,目前好的方式就是提高系统帧率。

2.1.4 扫描方式
UHDTV采用逐行扫描方式。HDTV等电视系统都采用了隔行扫描,第一是为了与之前模拟电视系统的扫描方式相兼容,第二是为了降低传送码率。在UHDTV中采用逐行扫描的原因是:第一是隔行扫描中的反交错技术不能真正实现完整画面;第二是现有的视频编码技术如HEVC等的效率很高,不需再使用隔行技术以降低带宽。目前,很多电视显示器在显示画面时,都会将接收到的场图像先合并成帧图像,再采用MEMC(运动估计和运动补偿)等技术将帧图像内插,形成高达120 f/s(帧/秒)甚至更高帧频的图像序列在显示端播放,因此再在电视前端输出场信号意义不大。

2.1.5 色域
分别根据HDTV和UHDTV的三基色坐标,可得两者之间及与可见光谱色轨迹(舌形曲线)的对比,如图2所示。将一幅花卉的图像色度坐标描绘在色域中,可见该坐标已经超出了HDTV的色域范围,但绝大部分还处于UHDTV的色度范围内,这表明UHDTV对三基色的规定更符合客观需求。

2.1.6 信号格式
在三种信号格式中,R'G'B'用于保证节目的最佳品质;恒定亮度中亮度信息只由Y'C携带(由RGB以线性方式生成),与C'BC和C'RC无关,这样可以准确保留亮度信息,改进传输编码效率;非恒定亮度中RGB经过非线性处理,再生成Y',因此Y'含有色度信息,这样可以兼容SDTV和HDTV广播环境。

2.1.7 编码格式
UHDTV的宽色域要求决定了图像信号的编码格式。与HDTV相比,UHDTV的色域范围更大,若赋予相同的编码位数,则UHDTV相邻色度之间的色差[ΔEab*]也会更大。表2给出了同时设置为8bit编码时,HDTV和UHDTV的色差[ΔEab*]的比较。这表明需要赋予UHDTV更多的编码位数,使得色度数值更为精确,连续色度值之间的色差更小,最终达到人眼不可察的程度。UHDTV给出了10 bit和12 bit两种编码格式,10 bit编码时最大色差降到1以下;12 bit时将低于最小可察对比度。

2.2 导出参数

对上述参数进行推导,还可以得到一些直接反映UHDTV特征的参数(简称导出参数)。
在ITU-R BT.1845-1中指出“在最佳观看距离处,一单位像素对应于一角分的视角”。观看UHDTV节目的最佳距离为
[d=Hv×tan1'] (1)
式中:v为扫描行数(2 160或4 320);H是有效发光屏幕高度;d是最佳观看距离。
观看UHDTV节目时的水平和垂直视角为
[θH=2⋅arctanHr2d] (2)
[θV=2⋅arctanH2d] (3)
式中:r是宽高比;d是最佳观看距离;θH和θV分别是水平和垂直视角。


从SDTV到HDTV时代,人们在家庭中观看电视的平均距离(2.1 m)基本没有改变。因此可根据式(1)得到屏幕高度H(此时d=2.1 m),再经过换算得到屏幕尺寸。UHDTV导出参数见表3。

人类视野差异很大,一般扫视一眼景物的水平视角约120°,极限接近180°,垂直一般为30°~38°,极限近80°。测试表明:视网膜中心分辨力最高,约15°,称分辨视域;向外到的30°称有效视域,分辨力下降,但不转动头部仍能看清物体的存在及其运动;约30°~100°周边称诱导视野(余光),会因感到物体的存在或运动而转动眼球或头颈去看清楚。在最佳观看距离处,4K的UHDTV还无法满足上述要求,8K则接近该要求。在通常的观看距离下,人们需要购置100 in以上的电视才能充分体验4K电视带来的视觉享受,但可能在很长一个阶段都很难在家庭中普及该尺寸的电视。

3UHDTV节目压缩编码

UHDTV的原始数据量大小(如表4所示)为
[D=p×f×s×b] (4)
式中:p是像素数;f是帧频;s是取样结构对应的倍数(4 ∶4 ∶4对应3倍、4 ∶2 ∶2对应2倍、4 ∶2 ∶0对应1.5倍);b是编码位数(10 bit或12 bit);D是数据量。

i

由表4可见,在最低要求下(像素3 840×2 160/帧频24 Hz/取样结构4 ∶2 ∶0/编码位数10 bit),最小数据量都有3 Gbit/s。必须采用高效的视频压缩编码技术,将数据压缩在可接受范围内。目前广泛认可的可用于UHDTV的编码技术是HEVC,我国自主知识产权的视频编码标准AVS的下一代演进标准AVS2也有望在我国的UHDTV发展中发挥重要作用。AVS2的最新标准草案于2014年8月发布。AVS2的首要应用目标就是对超高清晰度视频的高效编码,具有针对UHDTV内容的超大块数据组织方式。其他适用的编码标准还有Google开发的VP9等。

图3给出了HEVC混合编码框图。它提供了编码树单元和编码树块结构,可提供比传统宏块更大的块(最大为64×64),这类块结构非常适用于超高分辨率图像编码。图中灰色方块为解码器模型中的元素。

4UHDTV节目传送

目前可能用于UHDTV节目长距离实时传送的方式包括地面、卫星和有线广播,以及宽带网络传输。我国目前推荐采用AVS+对HDTV节目进行压缩,建议高清视音频总码率不低于12 Mbit/s,由于UHDTV4K的数据量是HDTV的4倍及以上,因此若也采用AVS+编码,如果要保证UHDTV节目的质量,视频码率应高于48 Mbit/s。我国地面数字电视传输标准DTMB的传输速率在5.414~32.486 Mbit/s之间,还不足以传送1路UHDTV节目。

解决上述问题的方法有两种,一是利用多个广播信道传送UHDTV节目;二是开发更高效率的信道编码技术。在文献[10-11]中分别给出了针对有线信道和地面信道的UHDTV节目多信道传送方法,文献[10]采用的信源编码方法是MPEG-2,因此采用了高达5个信道来传送UHDTV节目。但这种方法无法解决信道资源有限的问题,因此需要基于各种信道开发新的技术,提高频谱利用效率。

以卫星传送为例,2014年3月,第三代DVB卫星电视广播标准DVB-S2X发布。DVB-S2X与DVB-S2相比,采用了多种新技术,频谱效率提高了51%,充分满足了传输UHDTV节目的需求。2014年4月,在美国拉斯维加斯的NAB2014上首次采用DVB-S2X进行了UHDTV节目的实时卫星传送(从伦敦到拉斯维加斯),视频采用HEVC压缩,码率为100 Mbit/s,采用DVB-S2X上星传输,其中转发器具有36 MHz带宽,调制方式为16APSK,信道编码率为3/4,滚降系数为5%。

5UHDTV节目显示
5.1 显示传送接口

UHDTV经解码器(机顶盒)解码后,送入UHDTV显示器播放;或直接将UHDTV压缩码流送入显示器自身解码后再播放。前一种方式需要支持高速率的接口。表4给出了目前常用的接口类型及其最大支持传输速率,以及各个接口的演进标准(已有标准但还未大规模应用)。其中HDMI常用于消费电子产品互联;DP接口与HDMI类似,其最大优势是专利免费;SDI常用于专业设备互联中,但在厂家的UHDTV展示机型中,也常使用多路SDI接口的组合来实现信号传递。从表5中可知现有和未来应用的主流接口,可实现对不同数据量的UHDTV的支持。

5.2 显示技术

显示技术的提升也是UHDTV标准制定和系统设计的重要影响因素之一,UHDTV显示设备先于标准而存在,为标准的制定提供了重要参考。表6给出了超高清显示器的开发历程。

标准的制定反过来也进一步明确了UHDTV显示需求。BT.2020对UHDTV显示器的像素数、帧频、色域和编码位数提出了比HDTV更高的要求。其中最难实现的是UHDTV的宽色域。由图2可见该色域的三基色坐标正好落在谱色轨迹上,现阶段只有激光显示是一种可行方案,譬如将激光作为投影仪的光源或LCD的背光。OLED等自发光显示器目前还无法达到这么宽的色域,但已能超出HDTV色域要求。文献[14]给出的WRGB OLED显示器具备BT.709规定的118%色域面积,并且100%包含BT.709色域范围。因此OLED也是未来超高显示的一个发展方向。

在UHDTV显示技术中,氧化物薄膜晶体管(Thin-Film Transistor,TFT)技术是目前的主要发展方向之一[15]。氧化物TFT除了能够更好地驱动大尺寸平板显示器(包括LCD和OLED)之外,还能为大尺寸显示器提供更大的开口率,从而提高能效水平。

6UHDTV音频系统

22.2多声道系统是NHK专门为UHDTV开发的系统[16-17],为配合UHDTV画面垂直和水平视角大的特点所设计,具备3层共24个声道(使用24个扬声器),如图4所示。

 

顶层(9个声道):残响和堂音;位于上方的声音,譬如悬挂于体育馆顶上的扩音器、飞机和焰火;不一般的声音,譬如无意义的声音。

中层(10个声道):基本声场形成;环绕感重建。

底层(5个声道,其中包括2个低频效果声道):水的声音,譬如大海、河流、水滴;鸟瞰时地面上的声音。

22.2多声道系统是一种典型的3D音频系统。3D音频系统的主要特征就是具备大量的声道,一般是数十个甚至能到上百个声道。人们对更多声道的追求没有止境,贝尔实验室在20世纪30年代的研究表明如果采用无穷多个麦克风对声音进行采集,那么使用无穷多个扬声器可以完美复现声音场景[19]。在一些典型应用如影院中,3D音频系统取代立体声(2.1声道)和环绕声(5.1声道)的趋势非常明显。
这种放声系统可较好地模拟三维声场,提供足够大的优良视听区,适应声像与宽视野画面同步需要,满足超高清系统对声音的要求。这种系统也便于兼容目前已有的几种多声道音频格式,使用较少扬声器的放音系统也可在某种程度上重现图4中从各声道方向来的声音。

7小结

本文从给出UHDTV的系统模型开始,依次介绍了UHDTV的基本参数和导出参数、高效视频编码技术、节目传送技术、输入输出接口和显示技术以及22.2多声道系统的基本情况,可依据文中给出的总体框架,对UHDTV的各个技术部分再进行深入研究,推动UHDTV在我国的发展。

 

本文已刊登在《电视技术》2014年38卷第18期。

订阅电话:010-59570227