🥇Kā darbojas video kodeks. 2. daļa. Kas, kāpēc, kā

Pirmā daļa: Pamati darbam ar video un attēliem

Kas ir? Video kodeks ir programmatūras/aparatūras daļa, kas saspiež un/vai atspiež digitālo video.

Par ko? Neskatoties uz noteiktiem ierobežojumiem gan attiecībā uz joslas platumu, gan
un datu uzglabāšanas vietas ziņā tirgus pieprasa arvien augstākas kvalitātes video. Vai atceries, kā pēdējā ierakstā mēs aprēķinājām nepieciešamo minimumu 30 kadriem sekundē, 24 bitiem uz pikseļu, ar izšķirtspēju 480x240? Bez saspiešanas saņēmām 82,944 Mbit/s. Saspiešana pašlaik ir vienīgais veids, kā vispārēji pārraidīt HD/FullHD/4K uz televīzijas ekrāniem un internetu. Kā tas tiek panākts? Tagad īsumā apskatīsim galvenās metodes.

Tulkojums tika veikts ar EDISON Software atbalstu.

Mēs esam saderinājušies videonovērošanas sistēmu integrācijaun izstrādājam mikrotomogrāfu.

Kodeks pret konteineru

Iesācēju izplatīta kļūda ir digitālā video kodeka un digitālā video konteinera sajaukšana. Konteiners ir noteikta formāta. Aptinums, kurā ir video (un, iespējams, audio) metadati. Saspiesto video var uzskatīt par konteinera lietderīgo slodzi.

Parasti video faila paplašinājums norāda tā konteinera veidu. Piemēram, fails video.mp4, iespējams, ir konteiners MPEG-4 14. daļa, un fails ar nosaukumu video.mkv, visticamāk, ir matrjoška. Lai būtu pilnībā pārliecināts par kodeku un konteinera formātu, varat izmantot FFmpeg vai MediaInfo.

Nedaudz vēstures

Pirms mēs nonākam pie Kā?, iedziļināsimies vēsturē, lai mazliet labāk izprastu dažus vecākus kodekus.

Video kodeks H.261 parādījās 1990. gadā (tehniski - 1988. gadā) un tika radīts darbam ar datu pārraides ātrumu 64 Kbps. Tajā jau tika izmantotas tādas idejas kā krāsu apakšizlase, makrobloki utt. Video kodeku standarts tika publicēts 1995. gadā H.263, kas attīstījās līdz 2001. gadam.

Pirmā versija tika pabeigta 2003. gadā H.264 / AVC. Tajā pašā gadā TrueMotion izlaida savu bezmaksas zaudējumu video kodeku ar nosaukumu VP3. Google nopirka uzņēmumu 2008. gadā, atbrīvojot VP8 tajā pašā gadā. 2012. gada decembrī Google izlaida VP9, un to atbalsta aptuveni ¾ pārlūkprogrammu tirgus (ieskaitot mobilās ierīces).

AV1 ir jauns bezmaksas un atvērtā koda video kodeks, ko izstrādājis Atvērto mediju alianse (AOMedia), kurā ietilpst slavenākie uzņēmumi, piemēram: Google, Mozilla, Microsoft, Amazon, Netflix, AMD, ARM, NVidia, Intel un Cisco. Kodeka pirmā versija 0.1.0 tika publicēta 7. gada 2016. aprīlī.

AV1 dzimšana

2015. gada sākumā Google strādāja pie VP10Xiph (kas pieder Mozilla) strādāja pie Daala, un Cisco izveidoja savu bezmaksas video kodeku ar nosaukumu Thor.

Tad MPEG LA pirmo reizi paziņotie gada limiti HEVC (H.265) un maksa 8 reizes lielāka nekā par H.264, taču drīz viņi atkal mainīja noteikumus:

nav gada limita,
satura maksa (0,5% no ieņēmumiem) un
vienības maksa ir aptuveni 10 reizes lielāka nekā H.264.

Atvērto mediju alianse veidoja dažādu jomu uzņēmumi: iekārtu ražotāji (Intel, AMD, ARM, Nvidia, Cisco), satura nodrošinātāji (Google, Netflix, Amazon), pārlūkprogrammu veidotāji (Google, Mozilla) un citi.

Uzņēmumiem bija kopīgs mērķis – bez autoratlīdzības izveidot video kodeku. Pēc tam parādās AV1 ar daudz vienkāršāku patenta licenci. Timotijs B. Teriberijs sniedza satriecošu prezentāciju, kas kļuva par pašreizējās AV1 koncepcijas un tā licencēšanas modeļa izcelsmi.

Jūs būsiet pārsteigts, uzzinot, ka varat analizēt AV1 kodeku, izmantojot pārlūkprogrammu (interesanti var doties uz aomanalyzer.org).

Universāls kodeks

Apskatīsim galvenos mehānismus, kas ir universālā video kodeka pamatā. Lielākā daļa no šiem jēdzieniem ir noderīgi un tiek izmantoti mūsdienu kodekos, piemēram, VP9, AV1 и HEVC. Brīdinu, ka daudzas no paskaidrotajām lietām tiks vienkāršotas. Dažreiz tehnoloģiju demonstrēšanai tiks izmantoti reālās pasaules piemēri (kā ar H.264).

1. solis - attēla sadalīšana

Pirmais solis ir sadalīt rāmi vairākās sadaļās, apakšsadaļās un tālāk.

Par ko? Ir daudz iemeslu. Kad mēs sadalām attēlu, mēs varam precīzāk paredzēt kustības vektoru, izmantojot mazas sadaļas mazām kustīgām daļām. Statiskā fona gadījumā varat aprobežoties ar lielākām sadaļām.

Kodeki parasti organizē šīs sadaļas sadaļās (vai daļās), makroblokos (vai kodēšanas koka blokos) un vairākās apakšsadaļās. Šo nodalījumu maksimālais izmērs ir atšķirīgs, HEVC iestata to uz 64x64, savukārt AVC izmanto 16x16, un apakšsadaļas var sadalīt līdz 4x4 izmēriem.

Vai atceries rāmju veidus no pēdējā raksta?! To pašu var attiecināt uz blokiem, tāpēc mums var būt I-fragments, B-bloks, P-makrobloks utt.

Tiem, kas vēlas praktizēt, skatieties, kā attēls tiek sadalīts sadaļās un apakšsadaļās. Lai to izdarītu, varat izmantot to, kas jau minēts iepriekšējā rakstā. Intel Video Pro analizators (tā, kas ir apmaksāta, bet ar bezmaksas izmēģinājuma versiju, kas ir ierobežota līdz pirmajiem 10 kadriem). Šeit analizētas sadaļas VP9:

2. solis - prognozēšana

Kad mums ir sadaļas, mēs varam tām veikt astroloģiskās prognozes. Priekš INTER prognozes ir jāpārnes kustības vektori un atlikusī daļa, un INTRA prognozēšanai tas tiek pārraidīts prognozes virziens un pārējais.

3. solis – transformācija

Kad mums ir atlikušais bloks (paredzamā sadaļa → reālā sadaļa), ir iespējams to pārveidot tā, lai mēs zinātu, kurus pikseļus var izmest, saglabājot kopējo kvalitāti. Ir dažas transformācijas, kas nodrošina precīzu uzvedību.

Lai gan ir arī citas metodes, apskatīsim tās sīkāk. diskrēta kosinusa transformācija (DCT - no plkst diskrēta kosinusa transformācija). Galvenās DCT funkcijas:

Pārvērš pikseļu blokus vienāda izmēra frekvences koeficientu blokos.
Kondensē jaudu, lai palīdzētu novērst telpisko dublēšanos.
Nodrošina atgriezeniskumu.

2. gada 2017. februāris Sintra R.J. (Cintra, RJ) un Bayer F.M. (Bayer FM) publicēja rakstu par DCT līdzīgu transformāciju attēla saspiešanai, kas prasa tikai 14 papildinājumus.

Neuztraucieties, ja nesaprotat katras preces priekšrocības. Tagad izmantosim konkrētus piemērus, lai redzētu to patieso vērtību.

Ņemsim šo 8x8 pikseļu bloku:

Šis bloks tiek atveidots šādā 8 x 8 pikseļu attēlā:

Lietojiet DCT šim pikseļu blokam un iegūstiet 8x8 koeficientu bloku:

Un, ja mēs atveidosim šo koeficientu bloku, mēs iegūsim šādu attēlu:

Kā redzat, tas neizskatās pēc sākotnējā attēla. Var redzēt, ka pirmais koeficients ļoti atšķiras no visiem pārējiem. Šis pirmais koeficients ir pazīstams kā līdzstrāvas koeficients, kas atspoguļo visus ievades masīvā esošos paraugus, piemēram, vidējo.

Šim koeficientu blokam ir interesanta īpašība: tas atdala augstfrekvences komponentus no zemfrekvences.

Attēlā lielākā daļa jaudas ir koncentrēta zemākās frekvencēs, tādēļ, pārvēršot attēlu tā frekvenču komponentos un atmetot augstākos frekvences koeficientus, varat samazināt attēla aprakstīšanai nepieciešamo datu apjomu, nezaudējot pārāk daudz attēla kvalitātes.

Frekvence norāda, cik ātri signāls mainās.

Mēģināsim pielietot testa gadījumā iegūtās zināšanas, pārveidojot sākotnējo attēlu tā frekvencē (koeficientu blokā), izmantojot DCT un pēc tam atmetot daļu no mazāk svarīgiem koeficientiem.

Vispirms mēs to pārvēršam frekvences domēnā.

Tālāk mēs atmetam daļu (67%) koeficientu, galvenokārt apakšējo labo daļu.

Visbeidzot, mēs rekonstruējam attēlu no šī izmestā koeficientu bloka (atcerieties, tam jābūt invertējamam) un salīdzinām to ar oriģinālu.

Mēs redzam, ka tas atgādina sākotnējo attēlu, taču ir daudz atšķirību no oriģināla. Izmetām 67,1875% un tomēr saņēmām kaut ko līdzīgu oriģinālam. Varēja pārdomātāk atmest koeficientus, lai iegūtu vēl kvalitatīvāku attēlu, bet tā ir nākamā tēma.

Katrs koeficients tiek ģenerēts, izmantojot visus pikseļus

Svarīgi: katrs koeficients nav tieši kartēts vienam pikselim, bet ir visu pikseļu svērtā summa. Šis pārsteidzošais grafiks parāda, kā pirmais un otrais koeficients tiek aprēķināts, izmantojot katram indeksam unikālos svarus.

Varat arī mēģināt vizualizēt DCT, aplūkojot vienkāršu attēla veidojumu, pamatojoties uz to. Piemēram, šeit ir simbols A, kas ģenerēts, izmantojot katra koeficienta svaru:

4. solis - kvantēšana

Pēc tam, kad iepriekšējā solī esam izmetuši dažus koeficientus, pēdējā solī (transformācijā) veicam īpašu kvantēšanas formu. Šajā posmā ir pieļaujams pazaudēt informāciju. Vai, vienkāršāk sakot, mēs kvantificēsim koeficientus, lai panāktu saspiešanu.

Kā jūs varat kvantificēt koeficientu bloku? Viena no vienkāršākajām metodēm ir vienota kvantēšana, kad ņemam bloku, sadalām to ar vienu vērtību (ar 10) un rezultātu noapaļo.

Vai mēs varam mainīt šo koeficientu bloku? Jā, mēs varam, reizinot ar to pašu vērtību, ar kuru mēs dalījām.

Šī pieeja nav labākā, jo tajā nav ņemta vērā katra koeficienta nozīme. Atsevišķas vērtības vietā varētu izmantot kvantētāju matricu, un šī matrica varētu izmantot DCT īpašību, kvantējot lielāko daļu apakšējā labās puses un mazākumu augšējās kreisās puses.

5. solis – entropijas kodēšana

Kad dati (attēlu bloki, fragmenti, kadri) ir kvantificēti, mēs joprojām varam tos bez zudumiem saspiest. Ir daudzi algoritmiski datu saspiešanas veidi. Mēs īsi apskatīsim dažus no tiem. Lai iegūtu dziļāku izpratni, varat izlasīt grāmatu Understanding Compression: Data Compression for Modern Developers ("Izpratne par saspiešanu: datu saspiešana mūsdienu izstrādātājiem").

Video kodēšana, izmantojot VLC

Pieņemsim, ka mums ir rakstzīmju straume: a, e, r и t. Šajā tabulā ir parādīta varbūtība (no 0 līdz 1), cik bieži katra rakstzīme parādās straumē.

	a	e	r	t
Varbūtība	0,3	0,3	0,2	0,2

Mēs varam piešķirt unikālus bināros kodus (vēlams mazus) visticamākajiem un lielākus kodus mazāk ticamiem.

	a	e	r	t
Varbūtība	0,3	0,3	0,2	0,2
Binārais kods	0	10	110	1110

Mēs saspiežam straumi, pieņemot, ka mēs galu galā iztērēsim 8 bitus katrai rakstzīmei. Bez saspiešanas katrai rakstzīmei būtu nepieciešami 24 biti. Ja katru rakstzīmi aizstājat ar tās kodu, jūs ietaupīsit!

Pirmais solis ir iekodēt rakstzīmi e, kas ir vienāds ar 10, un otrā rakstzīme ir a, kas tiek pievienota (ne matemātiskā veidā): [10][0] un visbeidzot trešā rakstzīme t, kas padara mūsu galīgo saspiesto bitu straumi vienādu ar [10][0][1110] vai 1001110, kas prasa tikai 7 bitus (3,4 reizes mazāk vietas nekā oriģinālam).

Lūdzu, ņemiet vērā, ka katram kodam ir jābūt unikālam kodam ar prefiksu. Hafmena algoritms palīdzēs jums atrast šos skaitļus. Lai gan šī metode nav bez trūkumiem, ir video kodeki, kas joprojām piedāvā šo algoritmisko kompresijas metodi.

Gan kodētājam, gan dekodētājam ir jābūt piekļuvei simbolu tabulai ar saviem binārajiem kodiem. Tāpēc kā ievadi ir jānosūta arī tabula.

Aritmētiskā kodēšana

Pieņemsim, ka mums ir rakstzīmju straume: a, e, r, s и t, un to varbūtība ir parādīta šajā tabulā.

	a	e	r	s	t
Varbūtība	0,3	0,3	0,15	0,05	0,2

Izmantojot šo tabulu, mēs izveidosim diapazonus, kas satur visas iespējamās rakstzīmes, sakārtotas pēc lielākā skaita.

Tagad iekodēsim trīs rakstzīmju straumi: ēst.

Vispirms atlasiet pirmo rakstzīmi e, kas ir apakšdiapazonā no 0,3 līdz 0,6 (neskaitot). Mēs ņemam šo apakšdiapazonu un sadalām to vēlreiz tādās pašās proporcijās kā iepriekš, bet šim jaunajam diapazonam.

Turpināsim mūsu straumes kodēšanu ēst. Tagad paņemiet otro rakstzīmi a, kas ir jaunajā apakšdiapazonā no 0,3 līdz 0,39, un pēc tam ņemiet mūsu pēdējo rakstzīmi t un atkārtojot to pašu procesu vēlreiz, mēs iegūstam galīgo apakšdiapazonu no 0,354 līdz 0,372.

Mums vienkārši jāatlasa skaitlis pēdējā apakšdiapazonā no 0,354 līdz 0,372. Izvēlēsimies 0,36 (bet jūs varat izvēlēties jebkuru citu skaitli šajā apakšdiapazonā). Tikai ar šo numuru mēs varēsim atjaunot savu sākotnējo straumi. Tas ir tā, it kā mēs vilktu līniju diapazonā, lai kodētu mūsu straumi.

Apgrieztā darbība (tas ir, dekodēšana) ir tikpat vienkāršs: ar mūsu skaitli 0,36 un sākotnējo diapazonu mēs varam palaist to pašu procesu. Bet tagad, izmantojot šo numuru, mēs identificējam straumi, kas kodēta, izmantojot šo numuru.

Ar pirmo diapazonu mēs pamanām, ka mūsu numurs atbilst šķēlei, tāpēc šī ir mūsu pirmā rakstzīme. Tagad mēs atkal sadalām šo apakšdiapazonu, veicot to pašu procesu kā iepriekš. Šeit var redzēt, ka 0,36 atbilst simbolam a, un pēc procesa atkārtošanas nonācām pie pēdējās rakstzīmes t (veidojot mūsu sākotnējo kodēto straumi ēst).

Gan kodētājam, gan dekodētājam ir jābūt simbolu varbūtību tabulai, tāpēc ir nepieciešams to nosūtīt arī ievaddatos.

Diezgan eleganti, vai ne? Tas, kurš izdomāja šo risinājumu, bija sasodīti gudrs. Daži video kodeki izmanto šo paņēmienu (vai vismaz piedāvā to kā opciju).

Ideja ir bez zudumiem saspiest kvantētu bitu straumi. Protams, šajā rakstā trūkst detaļu, iemeslu, kompromisu utt. Bet, ja esat izstrādātājs, jums vajadzētu zināt vairāk. Jaunie kodeki mēģina izmantot dažādus entropijas kodēšanas algoritmus, piemēram, ANS.

6. darbība - bitu plūsmas formāts

Pēc visa tā veikšanas atliek tikai izpakot saspiestos kadrus veikto darbību kontekstā. Dekodētājs ir skaidri jāinformē par kodētāja pieņemtajiem lēmumiem. Dekodētājam ir jābūt nodrošinātam ar visu nepieciešamo informāciju: bitu dziļumu, krāsu telpu, izšķirtspēju, prognozēšanas informāciju (kustības vektori, virziena INTER prognoze), profilu, līmeni, kadru ātrumu, kadra veidu, kadra numuru un daudz ko citu.

Mēs ātri apskatīsim bitu straumi H.264. Mūsu pirmais solis ir izveidot minimālu H.264 bitu straumi (FFmpeg pēc noklusējuma pievieno visas kodēšanas opcijas, piemēram, SEI NAL - mēs uzzināsim, kas tas ir nedaudz tālāk). Mēs to varam izdarīt, izmantojot savu repozitoriju un FFmpeg.

./s/ffmpeg -i /files/i/minimal.png -pix_fmt yuv420p /files/v/minimal_yuv420.h264

Šī komanda ģenerēs neapstrādātu bitu straumi H.264 ar vienu kadru, 64×64 izšķirtspēja, ar krāsu telpu YUV420. Šajā gadījumā kā rāmis tiek izmantots šāds attēls.

H.264 bitu plūsma

Standarts AVC (H.264) nosaka, ka informācija tiks nosūtīta makrokadros (tīkla izpratnē), sauc NAL (tas ir tīkla abstrakcijas līmenis). NAL galvenais mērķis ir nodrošināt "tīmeklim draudzīgu" video prezentāciju. Šim standartam vajadzētu darboties televizoros (pamatojoties uz straumi), internetā (pakešu bāzes).

Ir sinhronizācijas marķieris, lai definētu NAL elementu robežas. Katrs sinhronizācijas marķieris satur vērtību 0x00 0x00 0x01, izņemot pašu pirmo, kas ir vienāds ar 0x00 0x00 0x00 0x01. Ja palaižam hexdump ģenerētajai H.264 bitu plūsmai faila sākumā mēs identificējam vismaz trīs NAL modeļus.

Kā minēts, dekodētājam ir jāzina ne tikai attēla dati, bet arī informācija par video, kadrs, krāsas, izmantotie parametri un daudz kas cits. Katra NAL pirmais baits nosaka tā kategoriju un veidu.

NAL tipa identifikators	Apraksts
0	Nezināms veids
1	Kodēts attēla fragments bez IDR
2	Kodēta šķēluma datu sadaļa A
3	Kodēta šķēluma datu sadaļa B
4	Kodēta šķēluma datu sadaļa C
5	Kodēts IDR attēla IDR fragments
6	Plašāka informācija par SEI paplašinājumu
7	SPS secības parametru iestatījums
8	PPS attēla parametru komplekts
9	Piekļuves atdalītājs
10	Secības beigas
11	Vītnes beigas
...	...

Parasti pirmais bitu straumes NAL ir SPS. Šis NAL veids ir atbildīgs par informēšanu par izplatītākajiem kodēšanas mainīgajiem, piemēram, profilu, līmeni, izšķirtspēju utt.

Ja mēs izlaižam pirmo sinhronizācijas marķieri, mēs varam atšifrēt pirmo baitu, lai noskaidrotu, kurš NAL veids ir pirmais.

Piemēram, pirmais baits pēc sinhronizācijas pilnvaras ir 01100111, kur pirmais bits (0) atrodas laukā forbidden_zero_bit. Nākamie 2 biti (11) stāsta mums lauks nal_ref_idc, kas norāda, vai šis NAL ir atsauces lauks vai nav. Un atlikušie 5 biti (00111) stāsta mums lauks nal_unit_type, šajā gadījumā tas ir SPS bloks (7) NAL.

Otrais baits (binārs=01100100, hex=0x64, decembris=100) SPS NAL ir lauks profile_idc, kas parāda kodētāja izmantoto profilu. Šajā gadījumā tika izmantots ierobežots augsts profils (ti, augsts profils bez divvirzienu B segmenta atbalsta).

Ja paskatās uz bitu plūsmas specifikāciju H.264 SPS NAL mēs atradīsim daudzas parametra nosaukuma, kategorijas un apraksta vērtības. Piemēram, apskatīsim laukus pic_width_in_mbs_minus_1 и pic_height_in_map_units_minus_1.

Parametra nosaukums	kategorija	Apraksts
pic_width_in_mbs_minus_1	0	ue (v)
pic_height_in_map_units_minus_1	0	ue (v)

Ja mēs veiksim dažas matemātiskas darbības ar šo lauku vērtībām, mēs iegūsim izšķirtspēju. Var attēlot 1920 x 1080, izmantojot pic_width_in_mbs_minus_1 ar vērtību 119 ((119 + 1) * makrobloka_izmērs = 120 * 16 = 1920). Atkal, lai ietaupītu vietu, 1920. gada kodēšanas vietā mēs to darījām ar 119.

Ja mēs turpinām pārbaudīt mūsu izveidoto video binārā formā (piemēram: xxd -b -c 11 v/minimal_yuv420.h264), tad varat doties uz pēdējo NAL, kas ir pats rāmis.

Šeit mēs redzam tās pirmās 6 baitu vērtības: 01100101 10001000 10000100 00000000 00100001 11111111. Tā kā zināms, ka pirmais baits norāda NAL tipu, šajā gadījumā (00101) ir IDR fragments (5), un pēc tam varat to izpētīt tālāk:

Izmantojot specifikācijas informāciju, būs iespējams atšifrēt fragmenta veidu (slice_type) un rāmja numurs (kadra_numurs) starp citām svarīgām jomām.

Lai iegūtu dažu lauku vērtības (ue(v), me(v), se(v) vai te(v)), mums ir nepieciešams atšifrēt fragmentu, izmantojot īpašu dekodētāju, kura pamatā ir eksponenciālais Golomba kods. Šī metode ir ļoti efektīva mainīgo vērtību kodēšanai, īpaši, ja ir daudz noklusējuma vērtību.

Vērtības slice_type и kadra_numurs no šī videoklipa ir 7 (I fragments) un 0 (pirmais kadrs).

Bitu plūsmu var uzskatīt par protokolu. Ja vēlaties uzzināt vairāk par bitu straumi, skatiet specifikāciju ITU H.264. Šeit ir makro diagramma, kas parāda, kur atrodas attēla dati (YUV saspiestā veidā).

Var pārbaudīt citas bitu plūsmas, piemēram VP9, H.265 (HEVC) vai pat mūsu jauno labāko bitu straumi AV1. Vai viņi visi ir līdzīgi? Nē, bet, kad saprotat vismaz vienu, ir daudz vieglāk saprast pārējo.

Vai vēlaties praktizēt? Izpētiet H.264 bitu straumi

Varat ģenerēt viena kadra video un izmantot MediaInfo, lai pārbaudītu bitu straumi H.264. Patiesībā nekas neliedz jums pat apskatīt avota kodu, kas analizē bitu straumi H.264 (AVC).

Praksei var izmantot Intel Video Pro Analyzer (vai es jau teicu, ka programma ir maksas, bet ir bezmaksas izmēģinājuma versija ar 10 kadru ierobežojumu?).

Pārskatiet

Ņemiet vērā, ka daudzi mūsdienu kodeki izmanto to pašu modeli, kuru mēs tikko pētījām. Šeit apskatīsim video kodeka blokshēmu Thor. Tajā ir ietverti visi soļi, kurus esam gājuši cauri. Šīs ziņas mērķis ir vismaz sniegt jums labāku izpratni par jauninājumiem un dokumentāciju šajā jomā.

Iepriekš tika aprēķināts, ka vienu stundu ilga video faila glabāšanai 139p kvalitātē un 720 kadri sekundē būs nepieciešami 30 GB diska vietas. Ja izmantojat šajā rakstā aplūkotās metodes (starpkadru un iekšējās prognozes, transformācijas, kvantēšana, entropijas kodēšana u.c.), varat iegūt (pamatojoties uz to, ka mēs tērējam 0,031 bitu uz pikseli), video ar diezgan apmierinoša kvalitāte, aizņemot tikai 367,82 MB, nevis 139 GB atmiņu.

Kā H.265 panāk labāku kompresijas pakāpi nekā H.264?

Tagad, kad mēs zinām vairāk par kodeku darbību, ir vieglāk saprast, kā jaunāki kodeki var nodrošināt augstāku izšķirtspēju ar mazāku bitu skaitu.

Ja salīdzinām AVC и HEVC, ir vērts atcerēties, ka šī gandrīz vienmēr ir izvēle starp lielāku CPU slodzi un kompresijas pakāpi.

HEVC ir vairāk sadaļas (un apakšsadaļas) opciju nekā AVC, vairāk iekšējo prognozēšanas virzienu, uzlabota entropijas kodēšana un daudz kas cits. Visi šie uzlabojumi ir veikti H.265 spēj saspiest par 50% vairāk nekā H.264.

Pirmā daļa: Pamati darbam ar video un attēliem

Avots: www.habr.com

Kā darbojas video kodeks? 2. daļa. Kas, kāpēc, kā

Pirmā daļa: Pamati darbam ar video un attēliem

Kodeks pret konteineru

Nedaudz vēstures

AV1 dzimšana

Universāls kodeks

1. solis - attēla sadalīšana

2. solis - prognozēšana

3. solis – transformācija

Katrs koeficients tiek ģenerēts, izmantojot visus pikseļus

4. solis - kvantēšana

5. solis – entropijas kodēšana

Video kodēšana, izmantojot VLC

Aritmētiskā kodēšana

6. darbība - bitu plūsmas formāts

H.264 bitu plūsma

Vai vēlaties praktizēt? Izpētiet H.264 bitu straumi

Pārskatiet

Kā H.265 panāk labāku kompresijas pakāpi nekā H.264?

Pirmā daļa: Pamati darbam ar video un attēliem

Pievieno komentāru Atcelt atbildi