የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

የመጀመሪያው ክፍል: ከቪዲዮ እና ምስሎች ጋር የመስራት መሰረታዊ ነገሮች

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

ምን? ቪዲዮ ኮዴክ ዲጂታል ቪዲዮን የሚጭን እና/ወይም የሚጨምረው ሶፍትዌር/ሃርድዌር ነው።

ለምን? በሁለቱም የመተላለፊያ ይዘት እና የተወሰኑ ገደቦች ቢኖሩም
እና የውሂብ ማከማቻ ቦታን በተመለከተ, ገበያው እየጨመረ ከፍተኛ ጥራት ያለው ቪዲዮ ይፈልጋል. በመጨረሻው ጽሁፍ ላይ የሚፈለገውን ዝቅተኛውን ለ 30 ክፈፎች በሰከንድ፣ 24 ቢት በፒክሰል፣ በ 480x240 ጥራት እንዴት እንደምናሰላ ታስታውሳለህ? ያለ መጭመቂያ 82,944 Mbit / s ተቀብለናል. በአጠቃላይ HD/FullHD/4K ወደ ቴሌቪዥን ስክሪኖች እና ኢንተርኔት ለማስተላለፍ ብቸኛው መንገድ መጭመቅ ነው። ይህ እንዴት ሊገኝ ቻለ? አሁን ዋና ዋና ዘዴዎችን በአጭሩ እንመልከት.

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

ትርጉሙ የተደረገው በEDISON ሶፍትዌር ድጋፍ ነው።

እኛ ተሰማርተናል የቪዲዮ ክትትል ስርዓቶች ውህደት, እንዲሁም ማይክሮቶሞግራፍ እያዘጋጀን ነው።.

ኮዴክ vs ኮንቴይነር

አዲስ ጀማሪዎች የሚሠሩት የተለመደ ስህተት ዲጂታል ቪዲዮ ኮዴክ እና ዲጂታል ቪዲዮ ኮንቴይነር ግራ የሚያጋባ ነው። መያዣ የተወሰነ ቅርጸት ነው. ቪዲዮ (እና ምናልባትም ኦዲዮ) ሜታዳታ የያዘ መጠቅለያ። የታመቀው ቪዲዮ እንደ መያዣ ጭነት ተደርጎ ሊወሰድ ይችላል።

በተለምዶ የቪዲዮ ፋይል ማራዘሚያ የእቃውን አይነት ያሳያል። ለምሳሌ, ፋይሉ video.mp4 ምናልባት መያዣ ነው MPEG-4 ክፍል 14, እና video.mkv የሚባል ፋይል በጣም አይቀርም ማትሪዮሽካ. ስለ ኮዴክ እና መያዣ ቅርፀት ሙሉ በሙሉ እርግጠኛ ለመሆን, መጠቀም ይችላሉ FFpepeg ወይም MediaInfo.

ትንሽ ታሪክ

ከመድረሳችን በፊት እንዴት?አንዳንድ የቆዩ ኮዴኮችን በጥቂቱ በተሻለ ለመረዳት ወደ ታሪክ ውስጥ ትንሽ እንዝለቅ።

የቪዲዮ ኮዴክ H.261 እ.ኤ.አ. በ 1990 (በቴክኒክ - በ 1988) ታየ እና በ 64 Kbps የውሂብ ማስተላለፍ ፍጥነት እንዲሠራ ተፈጠረ። ቀደም ሲል እንደ የቀለም ናሙና, ማክሮብሎክ, ወዘተ የመሳሰሉ ሀሳቦችን ተጠቅሟል. የቪዲዮ ኮዴክ መስፈርት በ1995 ታትሟል H.263እስከ 2001 ድረስ ያደገው.

የመጀመሪያው እትም በ 2003 ተጠናቀቀ ኤክስኤክስኤክስኤክስኤክስ / ኤ.ሲ.ሲ.. በዚያው ዓመት፣ TrueMotion የተባለውን ነፃ ኪሳራ ያለበት የቪዲዮ ኮድ አወጣ VP3. ጎግል ኩባንያውን በ 2008 ገዝቷል, በመልቀቅ VP8 በዚያው ዓመት. በታህሳስ 2012 ጎግል ተለቋል VP9እና በአሳሽ ገበያው ¾ ውስጥ ይደገፋል (ሞባይል መሳሪያዎችን ጨምሮ)።

AV1 አዲስ ነፃ እና ክፍት ምንጭ ቪዲዮ ኮድክ የተሰራ ነው። አሊያንስ ለክፍት ሚዲያ (AOMedia), እንደ ጎግል ፣ ሞዚላ ፣ ማይክሮሶፍት ፣ Amazon ፣ Netflix ፣ AMD ፣ ARM ፣ NVidia ፣ Intel እና Cisco ያሉ በጣም ታዋቂ ኩባንያዎችን ያጠቃልላል። የመጀመሪያው የኮዴክ ስሪት 0.1.0 ሚያዝያ 7 ቀን 2016 ታትሟል።

የ AV1 መወለድ

በ 2015 መጀመሪያ ላይ Google እየሰራ ነበር VP10Xiph (የሞዚላ ንብረት የሆነው) እየሰራ ነበር። ዳላ, እና Cisco የተባለ የራሱን ነጻ ቪዲዮ ኮድ አደረገ ቶር.

እንግዲህ MPEG ላ ለመጀመሪያ ጊዜ የታወጀ ዓመታዊ ገደቦች ለ HEVC (H.265) እና ክፍያ ከH.8 264 እጥፍ ይበልጣል፣ ግን ብዙም ሳይቆይ ህጎቹን እንደገና ቀይረዋል፡-

አመታዊ ገደብ የለም,
የይዘት ክፍያ (ከገቢው 0,5%) እና
የክፍል ክፍያው ከH.10 በ264 እጥፍ ይበልጣል።

አሊያንስ ለክፍት ሚዲያ በተለያዩ መስኮች በኩባንያዎች የተፈጠረ ነው-የመሳሪያዎች አምራቾች (ኢንቴል, ኤኤምዲ, ኤአርኤም, ኒቪዲ, ሲሲሲ), የይዘት አቅራቢዎች (Google, Netflix, Amazon), አሳሽ ፈጣሪዎች (Google, ሞዚላ) እና ሌሎች.

ኩባንያዎቹ አንድ ግብ ነበራቸው - ከሮያሊቲ ነፃ የሆነ የቪዲዮ ኮድ። ከዚያም ይታያል AV1 በጣም ቀላል በሆነ የፓተንት ፈቃድ። ቲሞቲ ቢ ቴሪቤሪ የአሁኑ AV1 ፅንሰ-ሀሳብ እና የፍቃድ አሰጣጥ ሞዴል መነሻ የሆነን አስደናቂ አቀራረብ አቅርቧል።

የ AV1 ኮዴክን በአሳሽ በኩል መተንተን እንደሚችሉ ስታውቅ ትገረማለህ (ፍላጎት ያላቸው ወደ መሄድ ይችላሉ። aomanalyzer.org).

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

ሁለንተናዊ ኮዴክ

ሁለንተናዊ የቪዲዮ ኮዴክን ዋና ዋና ዘዴዎችን እንመልከት ። አብዛኛዎቹ እነዚህ ጽንሰ-ሀሳቦች ጠቃሚ ናቸው እና በዘመናዊ ኮዴኮች ውስጥ ጥቅም ላይ ይውላሉ እንደ VP9, AV1 и HEVC. ብዙዎቹ የተብራሩት ነገሮች ቀላል እንደሚሆኑ አስጠነቅቃችኋለሁ. አንዳንድ ጊዜ የገሃዱ ዓለም ምሳሌዎች (እንደ H.264) ቴክኖሎጂውን ለማሳየት ይጠቅማሉ።

1 ኛ ደረጃ - ምስሉን መከፋፈል

የመጀመሪያው እርምጃ ክፈፉን ወደ ብዙ ክፍሎች, ክፍሎች እና ከዚያ በላይ መከፋፈል ነው.

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

ለምንድነው? ብዙ ምክንያቶች አሉ። ምስልን ስንከፋፍል ለትንሽ ተንቀሳቃሽ ክፍሎች ትናንሽ ክፍሎችን በመጠቀም የእንቅስቃሴውን ቬክተር በበለጠ በትክክል መተንበይ እንችላለን። ለቋሚ ዳራ እራስዎን በትልልቅ ክፍሎች መገደብ ይችላሉ።

ኮዴኮች በተለምዶ እነዚህን ክፍሎች በክፍሎች (ወይም በክፍሎች)፣ በማክሮብሎኮች (ወይም በኮድ የዛፍ ብሎኮች) እና በበርካታ ንዑስ ክፍሎች ያደራጃሉ። የእነዚህ ክፍፍሎች ከፍተኛ መጠን ይለያያል, HEVC ወደ 64x64 ያዋቅረዋል, AVC 16x16 ይጠቀማል, እና ንዑስ ክፍልፋዮች እስከ 4x4 መጠኖች ሊከፋፈሉ ይችላሉ.

ካለፈው መጣጥፍ የክፈፎች ዓይነቶችን ታስታውሳለህ?! በብሎኮች ላይም እንዲሁ ሊተገበር ይችላል፣ስለዚህ I-fragment፣B-block፣P-macroblock፣ወዘተ ሊኖረን ይችላል።

ለመለማመድ ለሚፈልጉ, ምስሉ በክፍል እና በንዑስ ክፍሎች እንዴት እንደሚከፋፈል ይመልከቱ. ይህንን ለማድረግ በቀድሞው ጽሑፍ ውስጥ ቀደም ሲል የተጠቀሰውን መጠቀም ይችላሉ. ኢንቴል ቪዲዮ ፕሮ ተንታኝ (የሚከፈለው፣ ግን ከነጻ የሙከራ ስሪት ጋር በመጀመሪያዎቹ 10 ክፈፎች የተገደበ)። እዚህ የተተነተኑ ክፍሎች VP9:

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

2 ኛ ደረጃ - ትንበያ

ክፍሎች ካሉን በኋላ ለእነርሱ የኮከብ ቆጠራ ትንበያዎችን ማድረግ እንችላለን. ለ የ INTER ትንበያዎች መተላለፍ አለበት። እንቅስቃሴ ቬክተሮች እና ቀሪው, እና ለ INTRA ትንበያ ይተላለፋል ትንበያ አቅጣጫ እና ቀሪው.

3 ኛ ደረጃ - ለውጥ

አንድ ጊዜ ቀሪ እገዳ (የተገመተው ክፍል → እውነተኛ ክፍል) ካለን በኋላ አጠቃላይ ጥራትን እየጠበቅን የትኞቹ ፒክሰሎች ሊጣሉ እንደሚችሉ በማወቅ መለወጥ ይቻላል ። ትክክለኛውን ባህሪ የሚያቀርቡ አንዳንድ ለውጦች አሉ.

ሌሎች ዘዴዎች ቢኖሩም, እነሱን የበለጠ በዝርዝር እንመልከታቸው. discrete ኮሳይን ለውጥ (ዲ.ሲ. - ከ discrete ኮሳይን ለውጥ). የDCT ዋና ተግባራት፡-

  • የፒክሰሎች ብሎኮችን ወደ እኩል መጠን ያላቸው የድግግሞሽ መጠኖች ብሎኮች ይለውጣል።
  • የቦታ ድግግሞሽን ለማስወገድ የሚረዳውን ኃይል ያጠናቅቃል።
  • ተገላቢጦሽ ያቀርባል.

ፌብሩዋሪ 2, 2017 ሲንታራ አር.ጄ. (Cintra, R.J.) እና ባየር ኤፍ.ኤም. (ቤየር ኤፍ.ኤም.) 14 ተጨማሪዎች ብቻ ስለሚያስፈልገው የምስል መጨናነቅ ስለ DCT መሰል ለውጥ አንድ ጽሑፍ አሳተመ።

የእያንዳንዱን ነጥብ ጥቅሞች ካልተረዳህ አትጨነቅ። አሁን እውነተኛ ዋጋቸውን ለማየት የተወሰኑ ምሳሌዎችን እንጠቀም።

ይህንን 8x8 ብሎክ ፒክስሎች እንውሰድ፡-

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

ይህ እገዳ በሚከተለው 8 በ 8 ፒክሰል ምስል ቀርቧል፡

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

በዚህ የፒክሰሎች ብሎክ ላይ DCT ይተግብሩ እና 8x8 ብሎክ ኮፊሸን ያግኙ፡

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

እና ይህንን የቁጥሮች ብሎክ ከሠራን ፣ የሚከተለውን ምስል እናገኛለን።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

እንደሚመለከቱት, ዋናውን ምስል አይመስልም. የመጀመሪያው ኮፊሸን ከሌሎቹ ሁሉ በጣም የተለየ መሆኑን ማየት ይችላሉ. ይህ የመጀመሪያው ኮፊሸን የዲሲ ኮፊሸን በመባል ይታወቃል፣ እሱም በግቤት ድርድር ውስጥ ያሉትን ሁሉንም ናሙናዎች የሚወክል፣ አማካይ የሆነ።

ይህ የቁጥር ማገጃዎች አስደሳች ንብረት አለው፡ ከፍተኛ ድግግሞሽ ክፍሎችን ከዝቅተኛ ድግግሞሽ ይለያል።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

በምስሉ ላይ አብዛኛው ሃይል በዝቅተኛ ፍሪኩዌንሲዎች ላይ ያተኮረ ነው፡ ስለዚህ ምስሉን ወደ ፍሪኩዌንሲ ክፍሎቹ ከቀየሩት እና ከፍተኛ ፍሪኩዌንሲዎችን ካስወገዱ ብዙ የምስል ጥራትን ሳያጠፉ ምስሉን ለመግለጽ የሚያስፈልገውን የውሂብ መጠን መቀነስ ይችላሉ።

ድግግሞሽ ምልክቱ በምን ያህል ፍጥነት እንደሚቀየር ያመለክታል።

በፈተና ጉዳይ ያገኘነውን እውቀት የመጀመሪያውን ምስል ወደ ፍሪኩዌንሲው (Block of Coefficients) ዲሲቲ በመጠቀም በመቀየር ተግባራዊ ለማድረግ እንሞክር እና ከዚያም በጣም አስፈላጊ ያልሆኑትን ውህዶች በከፊል በመጣል።

በመጀመሪያ ወደ ድግግሞሽ ጎራ እንለውጣለን.

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

በመቀጠል፣ ከፊል (67%) ውህዶችን፣ በተለይም የታችኛውን የቀኝ ክፍል እናስወግዳለን።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

በመጨረሻም፣ ምስሉን ከዚህ ከተጣለው የቁጥር ውህዶች እንደገና እንገነባለን (አስታውስ፣ የማይገለበጥ መሆን አለበት) እና ከመጀመሪያው ጋር እናነፃፅረው።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

ከመጀመሪያው ምስል ጋር እንደሚመሳሰል እናያለን, ነገር ግን ከመጀመሪያው ብዙ ልዩነቶች አሉ. 67,1875% ጥለናል እና አሁንም ኦርጅናሉን የሚመስል ነገር አግኝተናል። የተሻለ ጥራት ያለው ምስል ለማግኘት በትኩረት ነጥቦቹን መጣል ተችሏል፣ ግን ያ ቀጣይ ርዕስ ነው።

እያንዳንዱ ቅንጅት የሚመነጨው ሁሉንም ፒክስሎች በመጠቀም ነው።

ጠቃሚ፡ እያንዳንዱ ኮፊሸን በቀጥታ ወደ አንድ ፒክስል አልተነደፈም፣ ነገር ግን የሁሉም ፒክስሎች ክብደት ያለው ድምር ነው። ይህ አስገራሚ ግራፍ ለእያንዳንዱ ኢንዴክስ ልዩ የሆኑ ክብደቶችን በመጠቀም የመጀመሪያ እና ሁለተኛ ደረጃዎች እንዴት እንደሚሰሉ ያሳያል።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

በእሱ ላይ የተመሰረተ ቀላል የምስል አሰራርን በመመልከት ዲሲቲውን በዓይነ ሕሊናህ ለማየት መሞከር ትችላለህ። ለምሳሌ፣ እያንዳንዱን የተመጣጠነ ክብደት በመጠቀም የመነጨው ምልክት A እዚህ አለ።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

4 ኛ ደረጃ - የቁጥር መጠን

በቀድሞው ደረጃ ላይ አንዳንድ ጥራዞችን ከወረወርን በኋላ በመጨረሻው ደረጃ (ትራንስፎርሜሽን) ላይ ልዩ የቁጥር መጠን እንሰራለን. በዚህ ደረጃ መረጃን ማጣት ተቀባይነት አለው. ወይም፣ በይበልጥ ቀላል፣ መጭመቂያውን ለማግኘት የቁጥሮችን መጠን እንቆጥራለን።

የኮፊፊፍፍፍቶችን ብሎክ እንዴት ማስላት ይቻላል? በጣም ቀላል ከሆኑት ዘዴዎች አንዱ ወጥ የሆነ የቁጥር መጠን ነው, ብሎክን ስንወስድ, በአንድ እሴት (በ 10) ይከፋፍሉት እና ውጤቱን ያጠጋጉ.

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

ይህንን የቁጥር ማገጃዎች መቀልበስ እንችላለን? አዎ፣ በተከፋፈልንበት ተመሳሳይ እሴት በማባዛት እንችላለን።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

ይህ አቀራረብ በጣም ጥሩ አይደለም ምክንያቱም የእያንዳንዱን ኮፊፊሽን አስፈላጊነት ግምት ውስጥ አያስገባም. አንድ ሰው ከአንድ እሴት ይልቅ የኳንትራይዘር ማትሪክስ መጠቀም ይችላል፣ እና ይህ ማትሪክስ የታችኛውን ቀኝ እና የላይ ግራ አናሳዎችን በቁጥር በመለካት የዲሲቲ ንብረትን ሊበዘብዝ ይችላል።

ደረጃ 5 - ኢንትሮፒ ኮድ ማድረግ

አንዴ መረጃውን (የምስል ብሎኮች፣ ፍርስራሾች፣ ክፈፎች) በቁጥር ካደረግን በኋላ፣ አሁንም ያለምንም ኪሳራ መጭመቅ እንችላለን። መረጃን ለመጭመቅ ብዙ አልጎሪዝም መንገዶች አሉ። አንዳንዶቹን በፍጥነት እንመለከታቸዋለን፣ ለበለጠ ግንዛቤ መረዳትን መረዳት፡ ዳታ መጭመቅ ለዘመናዊ ገንቢዎች ("መጨናነቅን መረዳት፡ ለዘመናዊ ገንቢዎች የውሂብ መጭመቂያ").

ቪኤልሲ በመጠቀም የቪዲዮ ኢንኮዲንግ

የገጸ-ባህሪያት ዥረት አለን እንበል፡- a, e, r и t. እያንዳንዱ ቁምፊ በዥረት ውስጥ ምን ያህል ጊዜ እንደሚታይ እድሉ (ከ0 እስከ 1) በዚህ ሠንጠረዥ ቀርቧል።

a e r t
ሊሆን ይችላል። 0,3 0,3 0,2 0,2

ልዩ የሆኑ ሁለትዮሽ ኮዶችን (ይመረጣል ትንንሾችን) በጣም እድለኞች ለሆኑ እና ትልቅ ለሆኑት ደግሞ ትልቅ ኮዶችን ልንሰጥ እንችላለን።

a e r t
ሊሆን ይችላል። 0,3 0,3 0,2 0,2
ሁለትዮሽ ኮድ 0 10 110 1110

ለእያንዳንዱ ገፀ ባህሪ 8 ቢት እናወጣለን ብለን በማሰብ ዥረቱን እንጨምቀዋለን። ያለ መጭመቂያ፣ በቁምፊ 24 ቢት ያስፈልጋል። እያንዳንዱን ቁምፊ በኮዱ ከቀየሩ ቁጠባ ያገኛሉ!

የመጀመሪያው እርምጃ ቁምፊውን ኢንኮድ ማድረግ ነው e, እሱም ከ 10 ጋር እኩል ነው, እና ሁለተኛው ቁምፊ ነው a, የተጨመረው (በሂሳብ መንገድ አይደለም): [10][0] እና በመጨረሻም ሦስተኛው ቁምፊ tየመጨረሻውን የተጨመቀ ቢትዥረት [10][0][1110] ወይም 10011107 ቢት ብቻ (ከመጀመሪያው 3,4 እጥፍ ያነሰ ቦታ) የሚያስፈልገው።

እባክዎ እያንዳንዱ ኮድ ቅድመ ቅጥያ ያለው ልዩ ኮድ መሆን አለበት። ሃፍማን አልጎሪዝም እነዚህን ቁጥሮች ለማግኘት ይረዳዎታል. ምንም እንኳን ይህ ዘዴ ከስህተቶቹ ውጭ ባይሆንም ፣ አሁንም ይህንን ስልተ ቀመር ለመጭመቅ የሚያቀርቡ የቪዲዮ ኮዴኮች አሉ።

ኢንኮደር እና ዲኮደር ሁለቱም ሁለትዮሽ ኮዶች ያሉት የምልክት ሠንጠረዥ መድረስ አለባቸው። ስለዚህ, እንደ ግብአት ጠረጴዛ መላክም አስፈላጊ ነው.

አርቲሜቲክ ኮድ

የገጸ-ባህሪያት ዥረት አለን እንበል፡- a, e, r, s и t, እና የእነሱ ዕድል በዚህ ሰንጠረዥ ውስጥ ቀርቧል.

a e r s t
ሊሆን ይችላል። 0,3 0,3 0,15 0,05 0,2

ይህንን ሠንጠረዥ በመጠቀም በትልቁ ቁጥር የተደረደሩ ሁሉንም ሊሆኑ የሚችሉ ቁምፊዎችን የያዙ ክልሎችን እንገነባለን።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

አሁን የሶስት ቁምፊዎችን ዥረት እንኮድ በል.

በመጀመሪያ የመጀመሪያውን ቁምፊ ይምረጡ eከ 0,3 እስከ 0,6 ባለው ንዑስ ክፍል ውስጥ (ሳይጨምር)። ይህንን ንዑስ ክፍል ወስደን እንደ ቀድሞው ተመሳሳይ መጠን እንደገና እንካፈላለን ፣ ግን ለዚህ አዲስ ክልል።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

ዥረታችንን ኮድ ማድረጉን እንቀጥል በል. አሁን ሁለተኛውን ቁምፊ ይውሰዱ aከ 0,3 ወደ 0,39 በአዲሱ ንዑስ ክፍል ውስጥ ነው, እና ከዚያ የመጨረሻውን ገጸ ባህሪያችንን እንውሰድ. t እና ተመሳሳይ ሂደትን እንደገና በመድገም የመጨረሻውን ንዑስ ክፍል ከ 0,354 ወደ 0,372 እናገኛለን.

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

በመጨረሻው ንዑስ ክፍል ውስጥ ከ 0,354 እስከ 0,372 ያለውን ቁጥር መምረጥ ብቻ ያስፈልገናል. 0,36 እንምረጥ (ነገር ግን በዚህ ንዑስ ክፍል ውስጥ ማንኛውንም ሌላ ቁጥር መምረጥ ይችላሉ). በዚህ ቁጥር ብቻ የመጀመሪያውን ዥረት ወደነበረበት መመለስ እንችላለን። የኛን ዥረት ለመመስጠር በየክልሎቹ ውስጥ መስመር እየሳልን ያለ ይመስላል።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

የተገላቢጦሽ አሠራር (ማለትም, መፍታት) እንዲሁ ቀላል ነው: በእኛ ቁጥር 0,36 እና በመነሻ ክልላችን, ተመሳሳይ ሂደትን ማካሄድ እንችላለን. አሁን ግን ይህን ቁጥር በመጠቀም፣ ይህንን ቁጥር በመጠቀም ኢንኮድ የተደረገውን ዥረት ለይተናል።

ከመጀመሪያው ክልል ጋር, ቁጥራችን ከቁጣው ጋር እንደሚዛመድ እናስተውላለን, ስለዚህ ይህ የእኛ የመጀመሪያ ባህሪ ነው. አሁን እንደ ቀድሞው ተመሳሳይ ሂደትን በመከተል ይህንን ንዑስ ክፍል እንደገና እንከፋፍለዋለን። እዚህ 0,36 ከምልክቱ ጋር እንደሚዛመድ ማየት ይችላሉ a, እና ሂደቱን ደጋግመን ከጨረስን በኋላ የመጨረሻው ገጸ ባህሪ ላይ ደርሰናል t (የእኛን ኦሪጅናል ኮድ የተደረገበት ዥረት በመፍጠር ላይ በል).

ኢንኮደር እና ዲኮደር ሁለቱም የምልክት ፕሮባቢሊቲዎች ሠንጠረዥ ሊኖራቸው ይገባል፣ስለዚህ በግብዓት ውሂቡ ውስጥም መላክ ያስፈልጋል።

በጣም የሚያምር፣ አይደል? ይህን መፍትሄ ያመጣው ማንም ሰው ብልህ ነበር። አንዳንድ የቪዲዮ ኮዴኮች ይህንን ዘዴ ይጠቀማሉ (ወይም ቢያንስ እንደ አማራጭ ያቅርቡ)።

ሀሳቡ ያለ ኪሳራ በቁጥር የተሰራ የቢት ዥረት መጭመቅ ነው። በእርግጥ ይህ መጣጥፍ በጣም ብዙ ዝርዝሮች ፣ ምክንያቶች ፣ የንግድ ልውውጥ ፣ ወዘተ ይጎድላል። ግን ገንቢ ከሆንክ የበለጠ ማወቅ አለብህ። አዲስ ኮዴኮች እንደ የተለያዩ ኢንትሮፒ ኢንኮዲንግ ስልተ ቀመሮችን ለመጠቀም ይሞክራሉ። ANS.

ደረጃ 6 - የቢት ዥረት ቅርጸት

ይህን ሁሉ ካደረጉ በኋላ፣ የተጨመቁትን ክፈፎች በተከናወኑት እርምጃዎች አውድ ውስጥ መክፈት ብቻ ይቀራል። በመቀየሪያው የተደረጉትን ውሳኔዎች ዲኮደር በግልፅ ማሳወቅ አለበት። ዲኮደሩ ሁሉንም አስፈላጊ መረጃዎች ማለትም የቢት ጥልቀት፣ የቀለም ቦታ፣ መፍታት፣ የትንበያ መረጃ (የእንቅስቃሴ ቬክተሮች፣ አቅጣጫዊ INTER ትንበያ)፣ መገለጫ፣ ደረጃ፣ የፍሬም ፍጥነት፣ የፍሬም አይነት፣ የፍሬም ቁጥር እና ሌሎችም መሰጠት አለበት።

ቢትስትሪክቱን በፍጥነት እንመለከታለን H.264. የእኛ የመጀመሪያ እርምጃ አነስተኛውን H.264 ቢት ዥረት መፍጠር ነው (FFmpeg በነባሪ ሁሉንም የመቀየሪያ አማራጮችን ይጨምራል ለምሳሌ SEI NAL - ትንሽ ወደ ፊት ምን እንደሆነ እናገኛለን). የራሳችንን ማከማቻ እና FFmpeg በመጠቀም ይህንን ማድረግ እንችላለን።

./s/ffmpeg -i /files/i/minimal.png -pix_fmt yuv420p /files/v/minimal_yuv420.h264

ይህ ትዕዛዝ ጥሬ የቢት ዥረት ይፈጥራል H.264 ከአንድ ፍሬም ጋር፣ 64×64 ጥራት፣ ከቀለም ቦታ ጋር YUV420. በዚህ ሁኔታ, የሚከተለው ምስል እንደ ክፈፍ ጥቅም ላይ ይውላል.

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

H.264 bitstream

መደበኛ AVC (H.264) መረጃ በማክሮ ክፈፎች (በኔትወርክ ስሜት) እንደሚላክ ይወስናል ናል (ይህ የአውታረ መረብ ረቂቅ ደረጃ ነው)። የ NAL ዋና ግብ ለ"ድር ተስማሚ" የቪዲዮ አቀራረብ ማቅረብ ነው። ይህ መመዘኛ በቲቪዎች (በዥረት ላይ የተመሰረተ)፣ በይነመረብ (በፓኬት ላይ የተመሰረተ) ላይ መስራት አለበት።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

የNAL አካላትን ወሰን ለመወሰን የማመሳሰል ምልክት ማድረጊያ አለ። እያንዳንዱ የማመሳሰል ማስመሰያ ዋጋ አለው። 0x00 0x00 0x01, ከመጀመሪያው በስተቀር, እሱም እኩል ነው 0x00 0x00 0x00 0x01. ከጀመርን hexdump ለተፈጠረው H.264 bitstream፣ በፋይሉ መጀመሪያ ላይ ቢያንስ ሶስት የ NAL ንድፎችን ለይተናል።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

እንደተገለጸው ዲኮደር የምስል መረጃን ብቻ ሳይሆን የቪዲዮውን፣ የፍሬምን፣ የቀለሞችን፣ ጥቅም ላይ የዋሉ መለኪያዎችን እና ሌሎችንም ዝርዝሮች ማወቅ አለበት። የእያንዳንዱ NAL የመጀመሪያ ባይት ምድቡን እና አይነቱን ይገልጻል።

NAL አይነት መለያ መግለጫ
0 ያልታወቀ አይነት
1 የምስል ቁርጥራጭ ያለ IDR
2 ኮድ የተደረገ ቁራጭ ውሂብ ክፍል A
3 ኮድ የተደረገ ቁራጭ ውሂብ ክፍል B
4 ኮድ የተደረገ ቁራጭ ውሂብ ክፍል C
5 የኢዲአር ምስል የ IDR ቁራጭ
6 ስለ SEI ቅጥያ ተጨማሪ መረጃ
7 የ SPS ቅደም ተከተል መለኪያ አዘጋጅ
8 የ PPS ምስል መለኪያዎች ስብስብ
9 የመዳረሻ መለያያ
10 ቅደም ተከተል መጨረሻ
11 የክር መጨረሻ
... ...

በተለምዶ የቢትዥረት የመጀመሪያው NAL ነው። SPS. ይህ ዓይነቱ NAL እንደ መገለጫ፣ ደረጃ፣ መፍታት፣ ወዘተ ያሉ የተለመዱ ኢንኮዲንግ ተለዋዋጮችን የማሳወቅ ኃላፊነት አለበት።

የመጀመሪያውን የማመሳሰል ምልክት ከዘለልን፣ የመጀመርያው የ NAL ዓይነት የትኛው እንደሆነ ለማወቅ የመጀመሪያውን ባይት መፍታት እንችላለን።

ለምሳሌ፣ ከማመሳሰል ቶከን በኋላ ያለው የመጀመሪያው ባይት ነው። 01100111የመጀመሪያው ቢት የት0) በመስክ ላይ ነው forbidden_ዜሮ_ቢት. ቀጣይ 2 ቢት (11) ሜዳውን ይነግረናል። nal_ref_idc፣ ይህ NAL የማጣቀሻ መስክ መሆኑን ወይም አለመሆኑን ያመለክታል. እና የተቀሩት 5 ቢት (00111) ሜዳውን ይነግረናል። nal_unit_አይነት፣ በዚህ ሁኔታ የ SPS እገዳ ነው (7) ናኤል.

ሁለተኛ ባይት (ሁለትዮሽ=01100100, hex=0x64, ዲሴ=100) በ SPS NAL ውስጥ መስክ ነው መገለጫ_IDc፣ ኢንኮደሩ የተጠቀመበትን መገለጫ ያሳያል። በዚህ አጋጣሚ፣ የተወሰነ ከፍተኛ መገለጫ ጥቅም ላይ ውሏል (ማለትም፣ ባለሁለት አቅጣጫዊ ቢ-ክፍል ድጋፍ ያለ ከፍተኛ መገለጫ)።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

የ Bitstream ዝርዝር መግለጫን ከተመለከቱ H.264 ለ SPS NAL, ለፓራሜትር ስም, ምድብ እና መግለጫ ብዙ እሴቶችን እናገኛለን. ለምሳሌ ሜዳዎቹን እንይ የምስል_ስፋት_በmbs_minus_1 и የምስል ቁመት_በካርታ_ክፍል_ሲቀነስ_1.

የመለኪያ ስም መደብ መግለጫ
የምስል_ስፋት_በmbs_minus_1 0 ዩ(ቪ)
የምስል ቁመት_በካርታ_ክፍል_ሲቀነስ_1 0 ዩ(ቪ)

ከእነዚህ መስኮች እሴቶች ጋር አንዳንድ የሂሳብ ስራዎችን ከሠራን, መፍትሄ እናገኛለን. አንድ በመጠቀም 1920 x 1080 ሊወክል ይችላል። የምስል_ስፋት_በmbs_minus_1 በ 119 ((119 + 1) * ማክሮብሎክ_መጠን = 120 * 16 = 1920)። እንደገና፣ ቦታን ለመቆጠብ፣ 1920ን ኢንኮድ ከማድረግ ይልቅ፣ በ119 አደረግነው።

የተፈጠረውን ቪዲዮ በሁለትዮሽ መልክ ማየታችንን ከቀጠልን (ለምሳሌ፡- xxd -b -c 11 v / minimal_yuv420.h264), ከዚያ ወደ መጨረሻው NAL መሄድ ይችላሉ, እሱም ፍሬም ራሱ ነው.

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

የመጀመሪያዎቹን 6 ባይት እሴቶቹን እናያለን፡- 01100101 10001000 10000100 00000000 00100001 11111111. የመጀመሪያው ባይት የ NAL ዓይነትን እንደሚያመለክት ስለሚታወቅ በዚህ ሁኔታ (00101) የ IDR ቁራጭ (5) ነው፣ እና ከዚያ በበለጠ ማሰስ ይችላሉ፡-

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

የዝርዝር መረጃውን በመጠቀም፣ የቁራጭ አይነትን (ኮድ) መፍታት ይቻላል።ቁራጭ_አይነት) እና የክፈፍ ቁጥር (ፍሬም_ቁጥር) ከሌሎች አስፈላጊ መስኮች መካከል.

የአንዳንድ መስኮች እሴቶችን ለማግኘት (ue(v), me(v), se(v) ወይም te(v)) ላይ የተመሠረተ ልዩ ዲኮደር በመጠቀም ቁርጥራጩን መፍታት አለብን ገላጭ የጎልምብ ኮድ. ይህ ዘዴ ተለዋዋጭ እሴቶችን ለመቀየስ በጣም ቀልጣፋ ነው, በተለይም ብዙ ነባሪ ዋጋዎች ሲኖሩ.

እሴቶች ቁራጭ_አይነት и ፍሬም_ቁጥር የዚህ ቪዲዮ 7 (I-fragment) እና 0 (የመጀመሪያ ፍሬም) ናቸው።

ትንሽ ዥረት እንደ ፕሮቶኮል ተደርጎ ሊወሰድ ይችላል። ስለ ቢትስትሪክቱ የበለጠ ለማወቅ ከፈለጉ ዝርዝር መግለጫውን ይመልከቱ ITU H.264. የምስል ውሂቡ የት እንዳለ የሚያሳይ የማክሮ ዲያግራም ይኸውና (ዩኢቪ በተጨመቀ ቅርጽ).

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

ሌሎች የቢት ዥረቶች ሊመረመሩ ይችላሉ, ለምሳሌ VP9, H.265 (HEVC) ወይም አዲሱ የእኛ ምርጥ ቢት ዥረት እንኳን AV1. ሁሉም ተመሳሳይ ናቸው? አይደለም፣ ግን ቢያንስ አንዱን ከተረዳህ፣ የቀረውን ለመረዳት በጣም ቀላል ነው።

ልምምድ ማድረግ ይፈልጋሉ? H.264 bitstreamን ያስሱ

ነጠላ የፍሬም ቪዲዮ ማመንጨት እና የቢት ዥረቱን ለመመርመር MediaInfoን መጠቀም ይችላሉ። H.264. እንደ እውነቱ ከሆነ የቢት ዥረቱን የሚተነትነውን የምንጭ ኮድን እንኳ ከመመልከት የሚከለክል ነገር የለም። H.264 (AVC).

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

ለልምምድ፣ የ Intel Video Pro Analyzerን መጠቀም ይችላሉ (ፕሮግራሙ ተከፍሏል ብዬ ተናግሬ ነበር፣ ግን የ 10 ክፈፎች ገደብ ያለው ነፃ የሙከራ ስሪት አለ?)።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

አጠቃላይ እይታ

ብዙ ዘመናዊ ኮዴኮች አሁን ያጠናነውን ሞዴል እንደሚጠቀሙ ልብ ይበሉ። እዚ፡ የቪዲዮ ኮዴክን የማገጃ ዲያግራም እንመልከት ቶር. ያለፍንባቸውን ደረጃዎች ሁሉ ይዟል። የዚህ ጽሑፍ አጠቃላይ ነጥብ ቢያንስ በዚህ አካባቢ ስላሉት ፈጠራዎች እና ሰነዶች የተሻለ ግንዛቤ እንዲሰጥዎት ነው።

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

ከዚህ ቀደም አንድ ሰአት የሚቆይ የቪዲዮ ፋይል በ139p ጥራት እና 720fps ለማከማቸት 30 ጂቢ የዲስክ ቦታ እንደሚያስፈልግ ተሰልቷል። በዚህ ጽሑፍ ውስጥ የተብራሩትን ዘዴዎች (ኢንተር-ፍሬም እና ውስጣዊ ትንበያዎች ፣ ትራንስፎርሜሽን ፣ ኳንቲላይዜሽን ፣ ኢንትሮፒ ኮድ ፣ ወዘተ) ከተጠቀሙ (በፒክሰል 0,031 ቢት በምናጠፋው እውነታ ላይ) በጣም አጥጋቢ ጥራት ያለው ቪዲዮ ማግኘት ይችላሉ ። , የሚይዘው 367,82 ሜባ ብቻ ነው, 139 ጂቢ ማህደረ ትውስታ አይደለም.

H.265 ከH.264 የተሻለ የመጨመቂያ ሬሾን እንዴት ያገኛል?

አሁን ኮዴኮች እንዴት እንደሚሠሩ የበለጠ ስለምናውቅ፣ እንዴት አዳዲስ ኮዴኮች በትንሽ ቢት ከፍተኛ ጥራት እንደሚያቀርቡ ለመረዳት ቀላል ነው።

ብናወዳድር AVC и HEVCይህ ሁልጊዜ ማለት ይቻላል በትልቁ ሲፒዩ ጭነት እና በመጭመቂያ ሬሾ መካከል ያለው ምርጫ መሆኑን ማስታወስ ጠቃሚ ነው።

HEVC የበለጠ ክፍል (እና ንዑስ ክፍል) አማራጮች አሉት AVC፣ የበለጠ የውስጥ ትንበያ አቅጣጫዎች ፣ የተሻሻለ ኢንትሮፒ ኮድ እና ሌሎችም። እነዚህ ሁሉ ማሻሻያዎች ተደርገዋል። H.265 ከ 50% በላይ መጭመቅ የሚችል H.264.

የቪዲዮ ኮዴክ እንዴት ነው የሚሰራው? ክፍል 2. ምን, ለምን, እንዴት

የመጀመሪያው ክፍል: ከቪዲዮ እና ምስሎች ጋር የመስራት መሰረታዊ ነገሮች

ምንጭ: hab.com

አስተያየት ያክሉ