12 Azure Media Zerbitzu berri adimen artifizialarekin

Microsoft-en misioa planetako pertsona eta erakunde bakoitzari gehiago lortzeko ahalmena ematea da. Komunikabideen industria misio hau errealitate bihurtzearen adibide bikaina da. Gero eta eduki gehiago sortzen eta kontsumitzen den garai batean bizi gara, modu gehiagotan eta gailu gehiagotan. IBC 2019-n, lantzen ari garen azken berrikuntzak eta zure komunikabideen esperientzia eraldatzen nola lagun dezaketen partekatu dugu.
12 Azure Media Zerbitzu berri adimen artifizialarekin
Ebaki azpian xehetasunak!

Orrialde hau gure webgunea.

Video Indexer-ek animazioa eta eduki eleanitza onartzen ditu orain

Iaz IBCn gure saritua egin genuen Azure Media Services Bideo-indizetzaileaeta aurten ere hobera egin du. Video Indexer-ek automatikoki ateratzen ditu informazioa eta metadatuak (adibidez, ahozko hitzak, aurpegiak, emozioak, gaiak eta markak multimedia-fitxategietatik), eta ez duzu makina ikasteko aditua izan behar hura erabiltzeko.

Gure azken eskaintzak oso eskatutako eta bereizitako bi ezaugarriren aurrebistak barne hartzen ditu, karaktere animatuak hautematea eta ahots-transkripzioa eleaniztuna, baita gaur egun dauden modeloen hainbat gehigarri ere Video Indexer-en.

Pertsonaien aitortza animatua

12 Azure Media Zerbitzu berri adimen artifizialarekin
Animaziozko edukia eduki mota ezagunenetako bat da, baina giza aurpegiak ezagutzeko diseinatutako ordenagailu bidezko ikusmenaren eredu estandarrak ez dute ondo funtzionatzen, batez ere edukiak giza aurpegiko ezaugarririk gabeko pertsonaiak baditu. Aurrebista bertsio berriak Video Indexer Microsoft-en Azure Custom Vision zerbitzuarekin konbinatzen du, eta animaziozko pertsonaiak automatikoki hautematen eta taldekatzen dituen eredu-multzo berri bat eskaintzen du eta etiketatu eta antzematen erraz egiten ditu ikusmen-eredu pertsonalizatu integratuak erabiliz.

Ereduak kanalizazio bakar batean integratzen dira, edonork zerbitzua erabiltzeko aukera ematen du ikaskuntza automatikoko ezagutzarik gabe. Emaitzak koderik gabeko Video Indexer atari baten bidez edo REST API baten bidez eskuragarri daude zure aplikazioetan azkar integratzeko.

Prestakuntzarako eta probak egiteko benetako animaziozko edukia eskaini zuten bezero batzuekin sortu genituen pertsonaia-eredu hauek. Funtzionalitate berriaren balioa ondo deskribatu zuen Andy Gutteridgek, Viacom International Media Networks-eko estudioko teknologia eta postprodukzioko zuzendari seniorrak, datu-hornitzaileetako bat izan zena: "AI oinarritutako animaziozko edukia detektatzeko funtzio sendo bat gehitzeak ahalbidetuko digu. gure liburutegiko karaktere metadatuak azkar eta eraginkortasunez aurkitzeko eta katalogatzeko.

Garrantzitsuena, gure sormen-taldeei behar duten edukia berehala aurkitzeko gaitasuna emango die, hedabideak kudeatzen emandako denbora gutxituz eta sormenean zentratu ahal izatekoΒ».

Honekin animaziozko pertsonaien aitorpena ezagutzen has zaitezke dokumentazio orriak.

Hainbat hizkuntzatako edukien identifikazioa eta transkripzioa

Zenbait komunikabide-baliabide, hala nola, albisteak, kronikak eta elkarrizketak, hizkuntza desberdinak hitz egiten dituzten pertsonen grabazioak dituzte. Lehendik dauden hizketarako testurako gaitasun gehienek audioa ezagutzeko hizkuntza aldez aurretik zehaztea eskatzen dute, bideo eleaniztunak transkribatzea zailduz.

Hainbat eduki motatarako ahozko hizkuntzaren identifikazio automatikoko eginbide berriak ikaskuntza automatikoko teknologia erabiltzen du multimedia-aktiboetan aurkitzen diren hizkuntzak identifikatzeko. Detektatu ondoren, hizkuntza-segmentu bakoitzak automatikoki transkripzio-prozesu bat egiten du dagokion hizkuntzan, eta, ondoren, segmentu guztiak hizkuntza anitzeko transkripzio-fitxategi bakarrean konbinatzen dira.

12 Azure Media Zerbitzu berri adimen artifizialarekin

Lortutako transkripzioa Video Indexer-en JSON irteeraren zati gisa eta azpititulu fitxategi gisa eskuragarri dago. Irteerako transkripzioa Azure Search-ekin ere integratuta dago, zure bideoetan hizkuntza-segmentu desberdinak berehala bilatzeko aukera emanez. Gainera, transkripzioa eleaniztuna eskuragarri dago Video Indexer atariarekin lan egiten duzunean, eta, beraz, denboran zehar transkripzioa eta identifikatutako hizkuntza ikusi ahal izango dituzu, edo hizkuntza bakoitzerako bideoko leku zehatzetara salto egin eta transkripzio eleaniztuna azpititulu gisa ikus dezakezu bideoa erreproduzitu ahala. Jasotako testua eskuragarri dauden 54 hizkuntzetako edozeinetara ere itzul dezakezu atariaren eta APIaren bidez.

Lortu informazio gehiago eduki eleaniztunak ezagutzeko eginbide berriari buruz eta nola erabiltzen den Video Indexer-en dokumentazioa irakurri.

Eredu eguneratu eta hobetuak gehigarriak

Eredu berriak ere gehitzen ari gara Video Indexer-era eta lehendik daudenak hobetzen ari gara, behean azaltzen direnak barne.

Pertsona eta lekuekin lotutako entitateak ateratzea

Dauden markak ezagutzeko gaitasunak zabaldu ditugu izen eta kokapen ezagunak barne hartzeko, hala nola, Parisko Eiffel Dorrea eta Londresko Big Ben. Sortutako transkripzioan edo karaktereen ezagupen optikoa (OCR) erabiliz pantailan agertzen direnean, dagokion informazioa gehitzen da. Ezaugarri berri honekin, bideo batean agertzen diren pertsona, leku eta marka guztiak bilatu eta haiei buruzko xehetasunak ikus ditzakezu, tarteak, deskribapenak eta Bing bilatzailerako estekak barne, informazio gehiago lortzeko.

12 Azure Media Zerbitzu berri adimen artifizialarekin

Editorearentzako fotograma detektatzeko eredua

Ezaugarri berri honek "etiketa" multzo bat gehitzen die marko indibidualei erantsitako metadatuei JSON xehetasunetan haien editorial mota adierazteko (adibidez, fotograma zabala, fotograma ertaina, hurbileko planoa, hurbileko planoa, bi plano, pertsona anitz, kanpoaldean. , barrualdean, etab.). Fotograma-motaren ezaugarri hauek erabilgarriak dira klip eta trailerrentzako bideoak editatzeko edo helburu artistikoetarako fotograma-estilo zehatz bat bilatzerakoan.

12 Azure Media Zerbitzu berri adimen artifizialarekin
Gehiago ikasi Fotograma mota hautematea Video Indexer-en.

IPTC maparen granulartasun aurreratua

Gure gaiak hautemateko ereduak transkripzioan, karaktereen ezagupen optikoan (OCR) eta detektatutako pertsona ospetsuetan oinarrituta zehazten du bideo baten gaia, nahiz eta gaia esplizituki zehaztu ez izan. Detektatutako gai hauek lau sailkapen eremutan mapatzen ditugu: Wikipedia, Bing, IPTC eta IAB. Hobekuntza honek bigarren mailako IPTC sailkapena sartzeko aukera ematen digu.
Hobekuntza hauek aprobetxatzea zure egungo Video Indexer liburutegia berriro indexatzea bezain erraza da.

Zuzeneko igorpenaren funtzionaltasun berria

Azure Media Services aurrebistan, zuzeneko igorpenerako bi funtzio berri ere eskaintzen ari gara.

Denbora errealeko AI transkripzioak zuzeneko erreprodukzioa hurrengo mailara eramaten du

Zuzeneko igorpenerako Azure Media Services erabiliz, orain audio- eta bideo-edukiaz gain automatikoki sortutako testu-pista bat biltzen duen irteera-korronte bat jaso dezakezu. Testua adimen artifizialean oinarritutako denbora errealeko audio transkripzioa erabiliz sortzen da. Teknika pertsonalizatuak hizketa-testu bihurtzearen aurretik eta ondoren aplikatzen dira emaitzak hobetzeko. Testu-pista IMSC1, TTML edo WebVTT-en paketatzen da, DASH, HLS CMAF edo HLS TS-en hornitzen denaren arabera.

Denbora errealeko lerro-kodeketa 24/7 OTT kanaletarako

Gure v3 APIak erabiliz, OTT kanalak (over-the-top) sortu, kudeatu eta igorri ditzakezu, eta Azure Media Services beste eginbide guztiak erabil ditzakezu, hala nola zuzeneko eskaeraren bidezko bideoa (VOD, eskaeraren araberako bideoa), paketatzea eta eskubide digitalen kudeaketa ( DRM, eskubide digitalen kudeaketa).
Ezaugarri hauen aurrebista lortzeko, bisitatu Azure Media Services komunitateak.

12 Azure Media Zerbitzu berri adimen artifizialarekin

Paketeak sortzeko gaitasun berriak

Audio-deskribapen pisten euskarria

Igorpen-edukiak sarritan audio-pista bat izaten du pantailan gertatzen denari buruzko hitzezko azalpenekin, ohiko audioaz gain. Horrek ikusmen-urritasuna duten ikusleentzat programak eskuragarriago bihurtzen ditu, batez ere edukia batez ere bisuala bada. Berria audio deskribapen funtzioa audio-pistetako bat audio-deskribapen-pista gisa (AD, audio-deskribapena) idazteko aukera ematen du, jokalariei AD pista ikusleen eskura jartzeko aukera emanez.

ID3 metadatuak txertatzen

Bezeroaren erreproduzitzaileari iragarkiak edo metadatuen gertaera pertsonalizatuak txertatzea adierazteko, igorleek sarritan erabiltzen dituzte bideoan txertatutako metadatu tenporizatuak. SCTE-35 seinaleztapen moduez gain, orain ere onartzen dugu ID3v2 eta beste eskema pertsonalizatuak, aplikazioen garatzaileak definitua bezeroaren aplikazioak erabiltzeko.

Microsoft Azure bazkideek amaierako irtenbideak erakusten dituzte

Bitmovin Microsoft Azurerako Bitmovin Video Encoding eta Bitmovin Video Player aurkezten ditu. Bezeroek orain kodetze- eta erreprodukzio-soluzio hauek aprobetxatu ditzakete Azure-n eta funtzio aurreratuez aprobetxatu, hala nola, hiru faseko kodeketa, AV1/VC kodeken euskarria, azpititulu eleaniztunak eta QoS, publizitatea eta bideoaren jarraipena egiteko aurrez integratutako bideo-analisiak.

Evergent Erabiltzaileen Bizi-zikloa Kudeatzeko Plataforma erakusten du Azure-n. Diru-sarreren eta bezeroen bizi-zikloaren kudeaketa-soluzioen hornitzaile nagusi gisa, Evergent-ek Azure AI erabiltzen du premium entretenimendu-hornitzaileei bezeroak eskuratzea eta atxikitzea hobetzen laguntzeko, bezeroen bizi-zikloko puntu kritikoetan zerbitzu-pakete eta eskaintza zuzenduak sortuz.

Havision Hodeian oinarritutako multimedia bideratze-zerbitzu adimenduna erakutsiko du, SRT Hub, bezeroei amaierako lan-fluxuak eraldatzen laguntzen diena. Azure Data Box Edge eta lan-fluxuak eraldatzea Avid, Telestream, Wowza, Cinegy eta Make.tv-en Hublet-ekin.

SES emisio-mailako hedabide-zerbitzuen multzoa garatu du Azure plataforman satelite eta kudeatutako komunikabide-zerbitzuen bezeroentzat. SESek erabat kudeatutako erreprodukzio zerbitzuetarako soluzioak erakutsiko ditu, besteak beste, erreprodukzio nagusia, erreprodukzio lokalizatua, iragarkiak aurkitzea eta ordezkatzea eta kalitate handiko denbora errealean 24x7 kanal anitzeko kodeketa Azuren.

SyncWords hodeiko tresna erosoak eta sinadura automatizatzeko teknologia eskaintzen ditu Azure-n. Eskaintza horiei esker, hedabide-erakundeek automatikoki gehitzea erraztuko dute, atzerriko hizkuntzako azpitituluak barne, Azure-n zuzeneko eta lineaz kanpoko bideo-fluxuetan.
nazioarteko konpainia Tata Elxsi, zerbitzu teknologikoen konpainiak, bere OTT SaaS plataforma TEPlay integratu du Azure Media Services-en OTT edukia hodeitik emateko. Tata Elxsi-k bere Falcon Eye kalitatearen esperientziaren (QoE) monitorizazio irtenbidea ere ekarri du Microsoft Azurera, erabakiak hartzeko analitikoak eta neurketak eskainiz.

Verizon Media bere zuzeneko streaming plataforma Azuren eskuragarri jartzen du beta gisa. Verizon Media Platform enpresa-mailako kudeatutako OTT irtenbide bat da, DRM, iragarkiak txertatzea, saio pertsonalizatuak, eduki dinamikoa ordezkatzea eta bideoaren entrega biltzen dituena. Integrazioak lan-fluxuak, laguntza globala eta eskalagarritasuna errazten ditu, eta Azuren aurkitutako gaitasun berezi batzuetarako sarbidea irekitzen du.

Iturria: www.habr.com

Gehitu iruzkin berria