凌群電子報

HEVC(High Efficiency Video Coding)高效率視訊編碼法介紹

作者/許庭瑋

[發表日期：2018/1/5]

作者簡歷

作者目前服務於凌群電腦證券產品研發處之軟體工程師，專長為Typescript,Node.js之開發，目前負責前後端網頁串流與設計工作。

前言

近年來網路技術及行動裝置的普及，越來越多人透過行動通訊裝置線上觀看視訊，但每位使用者的觀看裝置並不一定相同，例如:電腦、平板、手機等等，但是受限於各種行動裝置的解析度、處理能力、儲存容量、網路使用頻寬並不相同，因此為了符合各個裝置下的視訊需求，將視訊分別編碼出不同解析度(畫質)、幀率(影格率)或畫質的位元流(bitstream)來滿足使用者需求，但隨著需求增多(畫質、傳輸速度)使得視訊壓縮的技術更為重要。視訊壓縮的技術可以讓觀看裝置更有效率的存取更多的多媒體資料，也能在儲存容量和網路頻寬都有限制的情況下，提供觀看者一定的觀看品質。

視訊壓縮標準已經發展相當長的一段時間，從早期H.261、H.263、MPEG-1、MPEG-2、H.264/AVC，到近期市面上最長使用的High efficiency video coding (HEVC)。隨著數位多媒體應用技術不斷進步，硬體設備所提供的畫質和解析度也隨之上升，從行動裝置上的HD(720p和1080p)到4k x 2k的超高解析度，使得2003年所制定的H.264/AVC已經不敷使用，因此為了使高畫質影片有效的在有限的頻寬下傳輸，由視訊發標準組織：ISO/IEC Moving Picture Experts Group(MPEG)和ITU-T Video Coding Experts Group(VCEG)發展出以H.264/AVC為基準開始制定新的視訊壓縮標準H.265/HEVC，並於2013年4月13日被國際電信聯盟(ITU-T)接受為正式標準。HEVC比起上一代的視訊壓縮標準H.264/AVC可在相同畫面品質下，只需要約一半的位元率(Bitrate)，也就是說能夠達到兩倍的壓縮效率。

HEVC提供了可調式結構的編碼單位(quadtree-based coding Unit、可調式結構的轉換單位(quadtree-based transform Unit)、更多的預測模式(predict mode)等方法，更進一步的提升壓縮效率、減少位元率，解決儲存容量和網路頻寬有限的問題。

H.265/HEVC 編碼架構

一、H.265/HEVC編碼架構介紹

高效率視訊編碼技術(High Efficiency Video Coding, HEVC)是最新一代的視訊編碼標準，相較於前一代的視訊編碼標準(H.264/AVC)，H.265/HEVC可在相同的畫面品質下，節省約一半的位元率。除了良好的壓縮率外，H.265/HEVC最高可支援至解析度 8192x4320(8K解析度)，比起以往的視訊標準會更適合用在高畫質視訊上。然而H.265/HEVC高壓縮率來自遠較於 H.264/AVC 複雜的視訊運算邏輯，大幅增加編解碼的運算複雜度。HEVC整體編碼器架構分為網路提取層(Network Abstraction Layer, NAL)和視訊編碼層(Video Coding Layer, VCL)，以下會對這兩部分做介紹。

二、HEVC網路提取層(NAL)

NAL可讓HEVC容易透過網路來傳輸，因為以NAL封包為單位的方式來做為VCL編解碼的運算單位，如此傳輸層取得NAL封包後不需要再進行切割，只需附加該傳輸協定的標頭資訊就可以交由底層傳送出去。NAL作封裝(packaging)模組將VCL以Slice為單位的位元流封裝成適當大小的封包單位(NAL-unit)，並在封包之標頭檔中的格式欄位記載其封包格式，每種格式分別對應到VCL中不同的編解碼工具。

三、HEVC視訊編碼層(VCL)

VCL層包含了HEVC的核心技術為運動估計(Motion Estimation)、運動補償(Motion Compensation)、轉換(Transform)、量化(Quantization)和熵編碼(Entropy Coding)，HEVC的編碼架構如圖一，與H.264/AVC的架構相似，但HEVC在對區塊壓縮時與其它視訊編碼標準不同的是HEVC新增了編碼單位(Coding Unit, CU)、預測單位(Prediction Unit, PU)和轉換單位(Transform Unit, TU)，以下將會對此三個單位作介紹。

《圖一》HEVC架構流程圖

四、H.265/HEVC編碼單元(Coding Unit, CU)

H.265/HEVC中繼承了過去H.264/AVC的區塊編碼特性，在H.264/AVC 的區塊(Macroblock)為固定大小的16x16的方形區塊，然而H.265/HEVC則採用更富有彈性的編碼樹單元(Coding Tree Unit, CTU) 藉此獲得更佳的壓縮效果。

CTU採用四分樹的編碼架構，其區塊大小可以從64x64到16x16，依據不同區塊大小分別定義為不同深度(Depth)，64x64為深度0(Depth 0)，32x32為深度1(Depth 1)以此類推，如圖二所示。每個切割後的區塊稱為編碼單元(Coding Unit, CU)，每個CU包含了一個或一個以上的PU和TU如圖三。

《圖二》CU四分樹結構

《圖三》CU、PU、TU分割示意圖

五、H.265/HEVC預測單元(Prediction Unit, PU)

HEVC中的PU與H.264/AVC的PU都包含了畫面內預測(Intra Prediction)和畫面間預測(Inter Prediction)，換句話說，HEVC以PU為單位做各種預測行為包含動量估測、運動補償，與H.264/AVC不同的是，HEVC另外提供了Skip模式，且畫面內預測最多增加到35中模式、畫面監獄側則有非對稱分割，所有預測方式一定以CU為單位分割，如圖四。接下來別介紹畫面內預測、畫面間預測。

《圖四》HEVC之PU模式與分割類型

畫面內預測(Intra Prediction)

當編碼一個區塊的過程中，將鄰近區塊已編碼之像素點的直對區塊進行預測以增加編碼效率，此即為畫面內預測。HEVC的畫面內預測提供最多33種Angular modes模式、DC mode以及Planar mode，如圖五所示。

《圖五》HEVC畫面內模式之33種方向預測

畫面間預測(Inter Prediction)

由於人眼的視覺暫留特性，我們才會在看影片時認為畫面是連續的，此外，相鄰視訊畫面間存在著高度的相似性，在編碼某一張畫面時往往可以利用前後相鄰畫面的相似區塊表示，減少時間上的冗餘藉此達到壓縮目的，此即為畫面間預測之宗旨。

畫面間預測PU共有8種分割方式(如圖二-三所示)，分別為四種對稱分割:2Nx2N、NxN、2NxN、Nx2N與四種非對稱分割: 2N×nU、2N×nD、nL×2N、nR×2N。

六、H.265/HEVC轉換單元(Transform Unit, TU)

TU是HEVC做轉換、量化和熵編碼的基本單位，TU大小不得超過所屬CU大小，TU可以在CU底下遞迴往下繼續分割，也就是四分樹的方式儲存。且TU必為正方形且大小有32×32、16×16、8×8、4×4共四種。

七、率失真最佳化(Rate-Distortion Optimization Routin)

HEVC在進行畫面內預測和畫面間預測，兩種預測分別有相當多種的預測方向以及PU分割模式，HEVC會在多種切割情況中選出一個最佳的模式，最直觀的方法就是找出能以最少位元率編碼的模式也就是編碼花費，稱之為RD-cost，HEVC採用以下數學式表示:J = D + λ × R

變數D表示為失真(殘餘值)，λ 為一個Lagrange 函數並由量化參數和編碼類型(採用畫面內預測或畫面間預測)而決定，而R 是編碼當前PU 的運動向量、分割資訊等所花費的位元數。

視訊編碼的發展

HEVC為了達到更好的壓縮效率，所以採用了較複雜的運算方式與多種選擇模式的編碼架構，例如有更多選擇的影像區塊大小、多種畫面內及畫面間的預測模式，使其預測可以更加精準，達到更好的壓縮效率。但是編碼效能提升，使得系統架構的編碼複雜度大大增加，造成編碼時間的拉長。為因應現在數位影音的發展，其要求高畫質的影音展現，往往需要更快速且有效率的編碼技術，所以現階段研究常常利用HEVC架構中的區塊模式、預測模式的運用，達到編碼複雜度的下降且不會造成影像的過度失真，來達到整體編碼效率提升。

影像編碼技術可以運用在數位電視、行動視訊、影音串流等各項新興多媒體服務中都具有極高的應用價值。現階段數位科技蓬勃發展使得編碼技術日趨重要，但如何在更有效率的形況下達到良好的編碼品質，是目前最重要的課題。

資料來源
1."High Efficiency Video Coding" From:Wikipedia

2.G. J. Sullivan, et al, “Overview of the High Efficiency Video Coding (HEVC) Standard,” IEEE Trans. Circuits and Systems for Video Technology, vol. 22, no. 12, pp. 1649-1668, Sep. 2012.

3."What is HEVC?" 2014-04-18-09:21AM By Geoffrey Morrison From:CNET

4."Entropy encoding(熵編碼法)" From:Wikipedia