AV1 vs. h265 (HEVC) vs. VP9:這些壓縮標準有何區別?

AV1 vs. h265 (HEVC) vs. VP9:這些壓縮標準有何區別?

4K 流媒體是新常態,但每 16 毫秒傳輸超過 820 萬像素的信息——在互聯網上存儲和傳輸 4K 視頻並非易事。

一部兩小時長的電影在未壓縮時會佔用超過 1.7 TB 的存儲空間。那麼,像 YouTube 和 Netflix 這樣的流媒體巨頭是如何設法存儲和流式傳輸佔用如此多空間的視頻的呢?

嗯,他們不是因為他們使用視頻編解碼器來減小電影的大小,但是什麼是視頻編解碼器,哪個是最好的?

什麼是視頻編解碼器?

在深入研究視頻編解碼器的複雜性之前,了解視頻的創建方式至關重要。簡而言之,視頻不過是一組快速相互替換的靜止圖像。

在計算機上運行的視頻編輯軟件

由於這種高速變化,人腦認為圖像在移動,從而產生觀看視頻的錯覺。因此,在觀看 4K 視頻時,你只是在看一組分辨率為 2160×3840 的圖像。這種高分辨率的圖像使 4K 視頻拍攝能夠提供出色的視頻體驗。也就是說,這種高分辨率的圖像增加了視頻的大小,使得無法通過帶寬有限的渠道(例如互聯網)進行流式傳輸。

為了解決這個問題,我們有視頻編解碼器。編碼器/解碼器或壓縮/解壓縮的縮寫,視頻編解碼器將圖像流壓縮成數據位。根據所使用的壓縮算法,此壓縮可能會降低視頻質量或對其沒有影響。

顧名思義,編解碼器中的壓縮位會減小每個圖像的大小。為此,壓縮算法利用了人眼的細微差別——防止人們知道他們觀看的視頻是經過壓縮的。

相反,解壓縮的工作方式相反,並使用壓縮信息呈現視頻。

儘管編解碼器在壓縮信息方面做得很好,但執行同樣的操作可能會對您的 CPU 造成負擔。因此,當您在系統上運行視頻壓縮算法時,系統性能出現波動是正常的。

在 iPad 上運行的視頻編輯應用程序

為了解決這個問題,CPU 和 GPU 配備了可以運行這些壓縮算法的特殊硬件。使 CPU 能夠執行手頭的任務,同時專用硬件處理視頻編解碼器,從而提高效率。

視頻編解碼器如何工作?

現在我們對視頻編解碼器的作用有了基本的了解,我們可以看看編解碼器是如何工作的。

色度子採樣

如前所述,視頻由圖像組成,色度子採樣減少了每個圖像中的信息。為此,它減少了每個圖像中包含的顏色信息,但人眼如何檢測到這種顏色信息的減少?

好吧,你看,人眼很擅長檢測亮度的變化,但對於顏色卻不能這樣說。這是因為與視錐細胞(負責區分顏色的感光細胞)相比,人眼具有更多的視桿細胞(負責檢測亮度變化的感光細胞)。在比較壓縮圖像和未壓縮圖像時,視桿和視錐的差異會阻止眼睛檢測顏色變化。

使用色度子採樣的不同級別的 pf 視頻壓縮
圖片來源:英文維基百科/Wikimedia Commons 的 Janke

為了執行色度子採樣,視頻壓縮算法將 RGB 中的像素信息轉換為亮度和顏色數據。之後,該算法會根據壓縮級別減少圖像中的顏色量。

去除冗餘幀信息

視頻由幾幀圖像組成,在大多數情況下,所有這些幀都包含相同的信息。例如,想像一段視頻,其中有一個人在固定背景下講話。在這種情況下,視頻中的所有幀都具有相似的構圖。因此,不需要所有圖像來渲染視頻。我們所需要的只是一張基本圖片,其中包含從一幀移動到另一幀時與變化相關的所有信息和數據。

因此,為了減小視頻大小,壓縮算法將視頻幀分為 I 幀和 P 幀(預測幀)。這裡 I 幀是基本事實,用於創建 P 幀。然後使用 I 幀中的信息和該特定幀的更改信息來渲染 P 幀。使用這種方法,視頻被分解成一組 I 幀,交織成 P 幀,進一步壓縮視頻。

運動壓縮

現在我們已經將視頻分成 I 幀和 P 幀,我們需要看看運動壓縮。視頻壓縮算法的一部分,有助於使用 I 幀創建 P 幀。為此,壓縮算法將 I 幀分成稱為宏塊的塊。然後為這些塊提供運動矢量,運動矢量定義這些塊在從一幀過渡到另一幀時移動的方向。

遊戲圖像上的運動矢量
圖片來源:Blender Foundation/維基媒體

每個塊的運動信息有助於視頻壓縮算法預測每個塊在即將到來的幀中的位置。

刪除高頻圖像數據

就像顏色數據的變化一樣,人眼無法察覺圖像中高頻元素的細微變化,但什麼是高頻元素呢?嗯,你看,屏幕上呈現的圖像包含幾個像素,這些像素的值根據顯示的圖像而變化。

在圖片的某些區域,像素值逐漸變化,這些區域被稱為頻率較低。另一方面,如果像素數據發生快速變化,則該區域被歸類為具有高頻數據。視頻壓縮算法使用離散餘弦變換來減少高頻分量。

下面是它的工作原理。首先,DCT 算法在每個宏塊上運行,然後檢測像素強度變化非常快的區域。然後它從圖像中刪除這些數據點——減小視頻的大小。

編碼

現在視頻中的所有冗餘信息都已被刪除,我們可以存儲剩餘的數據位。為此,視頻壓縮算法使用了一種編碼方案,例如霍夫曼編碼,它將幀中的所有數據位與它們在視頻中出現的次數相關聯,然後以樹狀方式將它們連接起來。此編碼數據存儲在系統中,使其能夠輕鬆呈現視頻。

霍夫曼編碼結構
圖片來源:Redor/維基媒體

AV1 vs. HEVC vs. VP9:哪種編解碼器最好?

現在我們了解了編解碼器的工作原理,我們可以確定 AV1、HEVC 和 VP9 中哪個是最好的。

可壓縮性和質量

如果您的 4K 視頻在您的系統上佔用了大量空間並且無法將其上傳到您最喜歡的流媒體平台,您可能正在尋找提供最佳壓縮比的視頻編解碼器。但是,您還需要考慮到,隨著您不斷壓縮視頻,它提供的質量會下降。因此,在選擇壓縮算法時,必須查看它在特定比特率下提供的質量,但視頻的比特率是多少?

簡單來說,視頻的碼率定義為視頻播放一秒需要的比特數。例如,以 60 幀運行的 24 位未壓縮 4K 視頻的比特率為 11.9 Gb/s。因此,如果您在互聯網上流式傳輸未壓縮的 4K 視頻,您的 Wi-Fi 必須每秒傳輸 11.9 吉比特的數據——幾分鐘內就會用完您每月的數據配額。

相反,使用壓縮算法可以根據您選擇的比特率將比特率降低到非常小的數量,而不會降低質量。

在可壓縮性/質量數字方面,AV1 處於領先地位,與 H.265 相比壓縮率提高 28.1%,與 VP9 相比節省 27.3%,同時提供相似的質量。

因此,如果您正在尋找不降低質量的最佳壓縮,AV1 就是適合您的壓縮比。由於 AV1 編解碼器具有很高的壓縮質量比,谷歌在其視頻會議應用程序 Google Duo 中使用它,Netflix 在低帶寬數據連接上傳輸視頻時使用它。

兼容性

如前所述,視頻壓縮算法會在視頻被壓縮後對其進行編碼。現在要播放此視頻,您的設備需要對其進行解碼。因此,如果您的設備不支持解壓縮視頻的硬件/軟件,將無法運行它。

因此,了解壓縮算法的兼容性方面很重要,因為創建和壓縮不能在許多設備上運行的內容有什麼意義?

因此,如果您正在尋找兼容性,那麼 VP9 應該是您的編解碼器,因為它在超過 20 億個端點上受支持,並且可以在每個瀏覽器、智能手機和智能電視上運行。

AV1 則不同,因為它使用更新、更複雜的算法來減小視頻文件的大小,並且無法在舊設備上播放。關於瀏覽器支持,Safari 無法播放 AV1,但 Firefox 和 Chrome 等瀏覽器可以毫無問題地播放 AV1 視頻。

在硬件支持方面,Snapdragon 8 Gen 2、三星 Exynos 2200、聯發科天璣 1000 5G、Google Tensor G2、Nvidia 的 RTX 4000 系列以及 Intel Xe 和 Arc GPU 等新的 SoC 和 GPU 支持 AV1 編解碼器的加速硬件解碼. 因此,如果您擁有由這些芯片組驅動的設備,您可以享受使用 AV1 編解碼器壓縮的流媒體內容,而不會耗盡您的 CPU/GPU 的能力。

對於 H.265 編解碼器,大多數流行的瀏覽器(如 Safari、Firefox 和 Google Chrome)都可以毫無問題地運行使用壓縮算法編碼的視頻。也就是說,與 AV1 和 VP9 相比,H.265 不是開源的,需要購買許可證才能使用 H.265 編解碼器。因此,操作系統自帶的 Microsoft Movies & TV 視頻播放器等應用默認無法運行使用 H.265 編碼的視頻。相反,用戶必須從 Windows 商店安裝附加組件才能運行此類視頻。

編碼速度

視頻編解碼器可大幅縮減視頻的大小,但要縮減視頻的大小,需要使用軟件對未壓縮的視頻進行處理,這需要時間。因此,如果要減小視頻的大小,則必須查看使用壓縮算法壓縮視頻所需的時間。

在編碼效率上,VP9領先,壓縮視頻的編碼時間遠低於H.265和AV1。另一方面,AV1 的編碼時間最慢,與 H.265 相比,編碼視頻的時間可能多出三倍。

您應該選擇哪種編解碼器?

談到視頻編解碼器,找到完美的編解碼器是非常主觀的,因為每個編解碼器都提供不同的功能。

如果您正在尋找最佳視頻質量,請選擇 AV1。另一方面,如果您正在尋找最兼容的視頻編解碼器,VP9 將是您的最佳選擇。

最後,如果您需要高質量和無編碼開銷的壓縮,H.265 編解碼器非常適合。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *