12 shërbime të reja mediatike Azure me inteligjencë artificiale

Misioni i Microsoft është të fuqizojë çdo person dhe organizatë në planet për të arritur më shumë. Industria e medias është një shembull i shkëlqyer për ta bërë këtë mision realitet. Ne jetojmë në një epokë ku po krijohet dhe konsumohet më shumë përmbajtje, në më shumë mënyra dhe në më shumë pajisje. Në IBC 2019, ne ndamë risitë më të fundit mbi të cilat po punojmë dhe se si ato mund të ndihmojnë në transformimin e përvojës suaj mediatike.
12 shërbime të reja mediatike Azure me inteligjencë artificiale
Detaje nën prerje!

Kjo faqe është aktive faqen tonë të internetit.

Video Indexer tani mbështet animacion dhe përmbajtje shumëgjuhëshe

Vitin e kaluar në IBC ne fituam çmimin tonë Azure Media Services Video Indexer, dhe këtë vit u bë edhe më mirë. Video Indexer nxjerr automatikisht informacionin dhe meta të dhënat nga skedarët e medias, të tilla si fjalët e folura, fytyrat, emocionet, temat dhe markat, dhe nuk keni nevojë të jeni ekspert i të mësuarit në makinë për t'i përdorur ato.

Ofertat tona më të fundit përfshijnë pamje paraprake të dy veçorive shumë të kërkuara dhe të diferencuara—njohja e animuar e karaktereve dhe transkriptimi shumëgjuhësh i të folurit—si dhe disa shtesa në modelet ekzistuese të disponueshme sot në Video Indexer.

Njohja e personazheve të animuar

12 shërbime të reja mediatike Azure me inteligjencë artificiale
Përmbajtja e animuar është një nga llojet më të njohura të përmbajtjes, por modelet standarde të vizionit kompjuterik të krijuar për të njohur fytyrat e njeriut nuk funksionojnë mirë me të, veçanërisht nëse përmbajtja përmban karaktere pa tipare të fytyrës njerëzore. Versioni i ri i pamjes paraprake kombinon Video Indexer me shërbimin Azure Custom Vision të Microsoft, duke ofruar një grup të ri modelesh që zbulojnë dhe grupojnë automatikisht personazhet e animuar dhe i bëjnë ata të lehtë për t'u etiketuar dhe njohur duke përdorur modele të integruara të vizionit të personalizuar.

Modelet janë të integruara në një tubacion të vetëm, duke i lejuar këdo që të përdorë shërbimin pa ndonjë njohuri për mësimin e makinerive. Rezultatet janë të disponueshme përmes një portali Video Indexer pa kod ose nëpërmjet një API REST për integrim të shpejtë në aplikacionet tuaja.

Ne ndërtuam këto modele për të punuar me personazhe të animuar së bashku me disa konsumatorë që ofruan përmbajtje reale të animuar për trajnim dhe testim. Vlera e funksionalitetit të ri u përmblodh mirë nga Andy Gutteridge, drejtor i lartë i teknologjisë në studio dhe post-produksionit në Viacom International Media Networks, i cili ishte një nga ofruesit e të dhënave: “Shtimi i zbulimit të fuqishëm të përmbajtjes së animuar me AI do të lejojë ne për të gjetur dhe kataloguar shpejt dhe me efikasitet meta të dhënat e personazheve nga përmbajtja e bibliotekës sonë.

Më e rëndësishmja, do t'u japë ekipeve tona krijuese aftësinë për të gjetur menjëherë përmbajtjen që u nevojitet, duke minimizuar kohën e shpenzuar për menaxhimin e mediave dhe duke i lejuar ata të përqendrohen në kreativitet."

Mund të filloni të njiheni me njohjen e personazheve të animuar me faqet e dokumentacionit.

Identifikimi dhe transkriptimi i përmbajtjes në shumë gjuhë

Disa burime mediatike, si lajmet, kronikat dhe intervistat, përmbajnë regjistrime të njerëzve që flasin gjuhë të ndryshme. Shumica e aftësive ekzistuese të fjalës në tekst kërkojnë që gjuha e njohjes së audios të specifikohet paraprakisht, duke e bërë të vështirë transkriptimin e videove shumëgjuhëshe.

Funksioni ynë i ri i identifikimit automatik të gjuhës së folur për lloje të ndryshme të përmbajtjes përdor teknologjinë e mësimit të makinerive për të identifikuar gjuhët që gjenden në asetet e medias. Pasi të zbulohet, çdo segment gjuhësor kalon automatikisht përmes një procesi transkriptimi në gjuhën e duhur dhe më pas të gjithë segmentet kombinohen në një skedar të vetëm transkriptimi shumë-gjuhësh.

12 shërbime të reja mediatike Azure me inteligjencë artificiale

Transkripti që rezulton është i disponueshëm si pjesë e daljes JSON të Indeksuesit të Videove dhe si skedarë titrash. Transkripti i daljes është gjithashtu i integruar me Azure Search, duke ju lejuar të kërkoni menjëherë segmente të ndryshme gjuhësore në videot tuaja. Përveç kësaj, transkriptimi shumëgjuhësh është i disponueshëm kur punoni me portalin Video Indeksuesi, kështu që mund të shikoni transkriptin dhe gjuhën e identifikuar me kalimin e kohës, ose të hidheni në vende të veçanta në video për secilën gjuhë dhe ta shihni transkriptimin shumëgjuhësh si titra ndërsa videoja luhet. Ju gjithashtu mund ta përktheni tekstin e marrë në cilëndo nga 54 gjuhët e disponueshme përmes portalit dhe API-së.

Mësoni më shumë rreth veçorisë së re të njohjes së përmbajtjes shumëgjuhëshe dhe se si përdoret në Indeksuesin e Videove lexoni dokumentacionin.

Modele shtesë të përditësuara dhe të përmirësuara

Ne po shtojmë gjithashtu modele të reja në Indeksuesin e Videove dhe po përmirësojmë ato ekzistuese, duke përfshirë ato të përshkruara më poshtë.

Nxjerrja e entiteteve të lidhura me njerëz dhe vende

Ne kemi zgjeruar aftësitë tona ekzistuese të zbulimit të markave për të përfshirë emra dhe vendndodhje të njohura, të tilla si Kulla Eifel në Paris dhe Big Ben në Londër. Kur ato shfaqen në transkriptin e gjeneruar ose në ekran duke përdorur njohjen optike të karaktereve (OCR), informacioni përkatës shtohet. Me këtë veçori të re, mund të kërkoni për të gjithë njerëzit, vendet dhe markat që u shfaqën në një video dhe të shikoni detaje rreth tyre, duke përfshirë hapësirat kohore, përshkrimet dhe lidhjet me motorin e kërkimit Bing për më shumë informacion.

12 shërbime të reja mediatike Azure me inteligjencë artificiale

Modeli i zbulimit të kornizës për redaktuesin

Ky funksion i ri shton një grup "etiketash" në meta të dhënat e bashkangjitura në kornizat individuale në detajet JSON për të përfaqësuar llojin e tyre editorial (për shembull, pamje e gjerë, pamje mesatare, nga afër, nga afër, dy poza, shumë njerëz , jashtë, brenda, etj.). Këto karakteristika të llojit të shkrepjes janë të dobishme kur redaktoni video për klipe dhe rimorkio, ose kur kërkoni një stil specifik të shkrepjes për qëllime artistike.

12 shërbime të reja mediatike Azure me inteligjencë artificiale
Mëso më shumë Zbulimi i llojit të kornizës në Indeksuesin e Videos.

Përmirësimi i hollësisë së hartës IPTC

Modeli ynë i zbulimit të temës përcakton temën e një videoje bazuar në transkriptimin, njohjen optike të karaktereve (OCR) dhe personazhet e njohur të zbuluar, edhe nëse tema nuk është e specifikuar në mënyrë eksplicite. Ne i hartojmë këto tema të zbuluara në katër fusha klasifikimi: Wikipedia, Bing, IPTC dhe IAB. Ky përmirësim na lejon të përfshijmë klasifikimin IPTC të nivelit të dytë.
Përfitimi nga këto përmirësime është po aq i lehtë sa të riindeksoni bibliotekën tuaj aktuale të Indeksuesit të Videove.

Funksionalitet i ri i transmetimit të drejtpërdrejtë

Në pamjen paraprake të Shërbimeve të Medias Azure, ne po ofrojmë gjithashtu dy veçori të reja për transmetim të drejtpërdrejtë.

Transkriptimi në kohë reale i fuqizuar nga AI e çon transmetimin e drejtpërdrejtë në nivelin tjetër

Duke përdorur Azure Media Services për transmetim të drejtpërdrejtë, tani mund të merrni një transmetim dalës që përfshin një pjesë teksti të gjeneruar automatikisht përveç përmbajtjes audio dhe video. Teksti është krijuar duke përdorur transkriptimin audio në kohë reale bazuar në inteligjencën artificiale. Teknikat e personalizuara aplikohen para dhe pas konvertimit të fjalës në tekst për të përmirësuar rezultatet. Pjesa e tekstit është e paketuar në IMSC1, TTML ose WebVTT, në varësi të faktit nëse ofrohet në DASH, HLS CMAF ose HLS TS.

Kodimi i linjës në kohë reale për kanalet OTT 24/7

Duke përdorur API-të tona v3, ju mund të krijoni, menaxhoni dhe transmetoni kanale OTT (mbi krye) dhe të përdorni të gjitha veçoritë e tjera të Shërbimeve Mediale Azure, të tilla si video live sipas kërkesës (VOD, video sipas kërkesës), paketimin dhe menaxhimin e të drejtave dixhitale ( DRM, menaxhimi i të drejtave dixhitale).
Për të parë versionet paraprake të këtyre veçorive, vizitoni Komuniteti Azure Media Services.

12 shërbime të reja mediatike Azure me inteligjencë artificiale

Aftësitë e reja të gjenerimit të paketave

Mbështetje për pjesët e përshkrimit audio

Përmbajtja e transmetuar përmes kanaleve të transmetimit shpesh ka një pjesë audio me shpjegime verbale të asaj që po ndodh në ekran, përveç sinjalit të rregullt audio. Kjo i bën programet më të aksesueshme për shikuesit me shikim të dëmtuar, veçanërisht nëse përmbajtja është kryesisht vizuale. I ri funksioni i përshkrimit audio ju lejon të shënoni një nga pjesët audio si një pjesë të përshkrimit audio (AD, përshkrim audio), duke i lejuar lojtarët të vënë në dispozicion pjesën e AD për shikuesit.

Duke futur të dhënat meta ID3

Për të sinjalizuar futjen e reklamave ose ngjarjeve të personalizuara të meta të dhënave te luajtësi i klientit, transmetuesit shpesh përdorin meta të dhëna me kohë të ngulitura në video. Përveç mënyrave të sinjalizimit SCTE-35, ne tani mbështesim gjithashtu ID3v2 dhe skema të tjera me porosi, e përcaktuar nga zhvilluesi i aplikacionit për përdorim nga aplikacioni i klientit.

Partnerët e Microsoft Azure demonstrojnë zgjidhje nga fundi në fund

Bitmovin prezanton Bitmovin Video Encoding dhe Bitmovin Video Player për Microsoft Azure. Klientët tani mund të përdorin këto zgjidhje kodimi dhe luajtjeje në Azure dhe të përfitojnë nga veçoritë e përparuara si kodimi me tre faza, mbështetja e kodeve AV1/VC, titrat shumëgjuhëshe dhe analitika e para-integruar e videove për QoS, reklamat dhe ndjekja e videove.

Evergjente demonstron Platformën e saj të Menaxhimit të Jetës së Përdoruesit në Azure. Si ofruesi kryesor i zgjidhjeve të menaxhimit të të ardhurave dhe ciklit të jetës së klientit, Evergent përdor Azure AI për të ndihmuar ofruesit premium të argëtimit të përmirësojnë blerjen dhe mbajtjen e klientëve duke krijuar paketa shërbimesh dhe oferta të synuara në pikat kritike të ciklit jetësor të klientit.

Haivision do të shfaqë shërbimin e tij inteligjent të rrugëtimit të mediave të bazuara në cloud, SRT Hub, i cili i ndihmon klientët të transformojnë flukset e punës nga fundi në fund duke përdorur Azure Data Box Edge dhe duke transformuar rrjedhat e punës me Hublets nga Avid, Telestream, Wowza, Cinegy dhe Make.tv.

SES ka zhvilluar një grup shërbimesh mediatike të nivelit të transmetimit në platformën Azure për klientët e saj satelitor dhe të menaxhuar të shërbimeve mediatike. SES do të demonstrojë zgjidhje për shërbimet e luajtjes të menaxhuara plotësisht, duke përfshirë luajtjen kryesore, luajtjen e lokalizuar, zbulimin dhe zëvendësimin e reklamave dhe kodimin me shumë kanale 24x7 me cilësi të lartë në kohë reale në Azure.

SyncWords bën të disponueshme në Azure mjete të përshtatshme cloud dhe teknologji të automatizimit të nënshkrimit. Këto oferta do ta bëjnë më të lehtë për organizatat mediatike që të shtojnë automatikisht titrat, duke përfshirë titrat në gjuhë të huaj, në flukset e tyre të punës video të drejtpërdrejta dhe jashtë linje në Azure.
kompani ndërkombëtare Tata Elxsi, një kompani shërbimesh teknologjike, ka integruar platformën e saj OTT SaaS TEPlay në Azure Media Services për të ofruar përmbajtje OTT nga cloud. Tata Elxsi ka sjellë gjithashtu zgjidhjen e saj të monitorimit të përvojës së cilësisë Falcon Eye (QoE) në Microsoft Azure, duke ofruar analitikë dhe metrikë për vendimmarrje.

Verizon Media po e bën platformën e saj të transmetimit të disponueshme në Azure si një version beta. Verizon Media Platform është një zgjidhje OTT e menaxhuar e nivelit të ndërmarrjes që përfshin DRM, futjen e reklamave, seanca të personalizuara një për një, zëvendësimin dinamik të përmbajtjes dhe shpërndarjen e videos. Integrimi thjeshton flukset e punës, mbështetjen dhe shkallën globale, dhe zhbllokon disa nga aftësitë unike që gjenden në Azure.

Burimi: www.habr.com

Shto një koment