Microsoft-en misioa planetako pertsona eta erakunde bakoitzari gehiago lortzeko ahalmena ematea da. Komunikabideen industria misio hau errealitate bihurtzearen adibide bikaina da. Gero eta eduki gehiago sortzen eta kontsumitzen den garai batean bizi gara, modu gehiagotan eta gailu gehiagotan. IBC 2019-n, lantzen ari garen azken berrikuntzak eta zure komunikabideen esperientzia eraldatzen nola lagun dezaketen partekatu dugu.
Ebaki azpian xehetasunak!
Orrialde hau
Video Indexer-ek animazioa eta eduki eleanitza onartzen ditu orain
Iaz IBCn gure saritua egin genuen
Gure azken eskaintzak oso eskatutako eta bereizitako bi ezaugarriren aurrebistak barne hartzen ditu, karaktere animatuak hautematea eta ahots-transkripzioa eleaniztuna, baita gaur egun dauden modeloen hainbat gehigarri ere Video Indexer-en.
Pertsonaien aitortza animatua
Animaziozko edukia eduki mota ezagunenetako bat da, baina giza aurpegiak ezagutzeko diseinatutako ordenagailu bidezko ikusmenaren eredu estandarrak ez dute ondo funtzionatzen, batez ere edukiak giza aurpegiko ezaugarririk gabeko pertsonaiak baditu. Aurrebista bertsio berriak Video Indexer Microsoft-en Azure Custom Vision zerbitzuarekin konbinatzen du, eta animaziozko pertsonaiak automatikoki hautematen eta taldekatzen dituen eredu-multzo berri bat eskaintzen du eta etiketatu eta antzematen erraz egiten ditu ikusmen-eredu pertsonalizatu integratuak erabiliz.
Ereduak kanalizazio bakar batean integratzen dira, edonork zerbitzua erabiltzeko aukera ematen du ikaskuntza automatikoko ezagutzarik gabe. Emaitzak koderik gabeko Video Indexer atari baten bidez edo REST API baten bidez eskuragarri daude zure aplikazioetan azkar integratzeko.
Prestakuntzarako eta probak egiteko benetako animaziozko edukia eskaini zuten bezero batzuekin sortu genituen pertsonaia-eredu hauek. Funtzionalitate berriaren balioa ondo deskribatu zuen Andy Gutteridgek, Viacom International Media Networks-eko estudioko teknologia eta postprodukzioko zuzendari seniorrak, datu-hornitzaileetako bat izan zena: "AI oinarritutako animaziozko edukia detektatzeko funtzio sendo bat gehitzeak ahalbidetuko digu. gure liburutegiko karaktere metadatuak azkar eta eraginkortasunez aurkitzeko eta katalogatzeko.
Garrantzitsuena, gure sormen-taldeei behar duten edukia berehala aurkitzeko gaitasuna emango die, hedabideak kudeatzen emandako denbora gutxituz eta sormenean zentratu ahal izatekoΒ».
Honekin animaziozko pertsonaien aitorpena ezagutzen has zaitezke
Hainbat hizkuntzatako edukien identifikazioa eta transkripzioa
Zenbait komunikabide-baliabide, hala nola, albisteak, kronikak eta elkarrizketak, hizkuntza desberdinak hitz egiten dituzten pertsonen grabazioak dituzte. Lehendik dauden hizketarako testurako gaitasun gehienek audioa ezagutzeko hizkuntza aldez aurretik zehaztea eskatzen dute, bideo eleaniztunak transkribatzea zailduz.
Hainbat eduki motatarako ahozko hizkuntzaren identifikazio automatikoko eginbide berriak ikaskuntza automatikoko teknologia erabiltzen du multimedia-aktiboetan aurkitzen diren hizkuntzak identifikatzeko. Detektatu ondoren, hizkuntza-segmentu bakoitzak automatikoki transkripzio-prozesu bat egiten du dagokion hizkuntzan, eta, ondoren, segmentu guztiak hizkuntza anitzeko transkripzio-fitxategi bakarrean konbinatzen dira.
Lortutako transkripzioa Video Indexer-en JSON irteeraren zati gisa eta azpititulu fitxategi gisa eskuragarri dago. Irteerako transkripzioa Azure Search-ekin ere integratuta dago, zure bideoetan hizkuntza-segmentu desberdinak berehala bilatzeko aukera emanez. Gainera, transkripzioa eleaniztuna eskuragarri dago Video Indexer atariarekin lan egiten duzunean, eta, beraz, denboran zehar transkripzioa eta identifikatutako hizkuntza ikusi ahal izango dituzu, edo hizkuntza bakoitzerako bideoko leku zehatzetara salto egin eta transkripzio eleaniztuna azpititulu gisa ikus dezakezu bideoa erreproduzitu ahala. Jasotako testua eskuragarri dauden 54 hizkuntzetako edozeinetara ere itzul dezakezu atariaren eta APIaren bidez.
Lortu informazio gehiago eduki eleaniztunak ezagutzeko eginbide berriari buruz eta nola erabiltzen den Video Indexer-en
Eredu eguneratu eta hobetuak gehigarriak
Eredu berriak ere gehitzen ari gara Video Indexer-era eta lehendik daudenak hobetzen ari gara, behean azaltzen direnak barne.
Pertsona eta lekuekin lotutako entitateak ateratzea
Dauden markak ezagutzeko gaitasunak zabaldu ditugu izen eta kokapen ezagunak barne hartzeko, hala nola, Parisko Eiffel Dorrea eta Londresko Big Ben. Sortutako transkripzioan edo karaktereen ezagupen optikoa (OCR) erabiliz pantailan agertzen direnean, dagokion informazioa gehitzen da. Ezaugarri berri honekin, bideo batean agertzen diren pertsona, leku eta marka guztiak bilatu eta haiei buruzko xehetasunak ikus ditzakezu, tarteak, deskribapenak eta Bing bilatzailerako estekak barne, informazio gehiago lortzeko.
Editorearentzako fotograma detektatzeko eredua
Ezaugarri berri honek "etiketa" multzo bat gehitzen die marko indibidualei erantsitako metadatuei JSON xehetasunetan haien editorial mota adierazteko (adibidez, fotograma zabala, fotograma ertaina, hurbileko planoa, hurbileko planoa, bi plano, pertsona anitz, kanpoaldean. , barrualdean, etab.). Fotograma-motaren ezaugarri hauek erabilgarriak dira klip eta trailerrentzako bideoak editatzeko edo helburu artistikoetarako fotograma-estilo zehatz bat bilatzerakoan.
IPTC maparen granulartasun aurreratua
Gure gaiak hautemateko ereduak transkripzioan, karaktereen ezagupen optikoan (OCR) eta detektatutako pertsona ospetsuetan oinarrituta zehazten du bideo baten gaia, nahiz eta gaia esplizituki zehaztu ez izan. Detektatutako gai hauek lau sailkapen eremutan mapatzen ditugu: Wikipedia, Bing, IPTC eta IAB. Hobekuntza honek bigarren mailako IPTC sailkapena sartzeko aukera ematen digu.
Hobekuntza hauek aprobetxatzea zure egungo Video Indexer liburutegia berriro indexatzea bezain erraza da.
Zuzeneko igorpenaren funtzionaltasun berria
Azure Media Services aurrebistan, zuzeneko igorpenerako bi funtzio berri ere eskaintzen ari gara.
Denbora errealeko AI transkripzioak zuzeneko erreprodukzioa hurrengo mailara eramaten du
Zuzeneko igorpenerako Azure Media Services erabiliz, orain audio- eta bideo-edukiaz gain automatikoki sortutako testu-pista bat biltzen duen irteera-korronte bat jaso dezakezu. Testua adimen artifizialean oinarritutako denbora errealeko audio transkripzioa erabiliz sortzen da. Teknika pertsonalizatuak hizketa-testu bihurtzearen aurretik eta ondoren aplikatzen dira emaitzak hobetzeko. Testu-pista IMSC1, TTML edo WebVTT-en paketatzen da, DASH, HLS CMAF edo HLS TS-en hornitzen denaren arabera.
Denbora errealeko lerro-kodeketa 24/7 OTT kanaletarako
Gure v3 APIak erabiliz, OTT kanalak (over-the-top) sortu, kudeatu eta igorri ditzakezu, eta Azure Media Services beste eginbide guztiak erabil ditzakezu, hala nola zuzeneko eskaeraren bidezko bideoa (VOD, eskaeraren araberako bideoa), paketatzea eta eskubide digitalen kudeaketa ( DRM, eskubide digitalen kudeaketa).
Ezaugarri hauen aurrebista lortzeko, bisitatu
Paketeak sortzeko gaitasun berriak
Audio-deskribapen pisten euskarria
Igorpen-edukiak sarritan audio-pista bat izaten du pantailan gertatzen denari buruzko hitzezko azalpenekin, ohiko audioaz gain. Horrek ikusmen-urritasuna duten ikusleentzat programak eskuragarriago bihurtzen ditu, batez ere edukia batez ere bisuala bada. Berria
ID3 metadatuak txertatzen
Bezeroaren erreproduzitzaileari iragarkiak edo metadatuen gertaera pertsonalizatuak txertatzea adierazteko, igorleek sarritan erabiltzen dituzte bideoan txertatutako metadatu tenporizatuak. SCTE-35 seinaleztapen moduez gain, orain ere onartzen dugu
Microsoft Azure bazkideek amaierako irtenbideak erakusten dituzte
nazioarteko konpainia
Iturria: www.habr.com