12 Nuwe Azure Media Services met AI

Microsoft se missie is om elke persoon en organisasie op die planeet te bemagtig om meer te bereik. Die mediabedryf is 'n goeie voorbeeld om hierdie missie 'n werklikheid te maak. Ons leef in 'n era waar meer inhoud geskep en verbruik word, op meer maniere en op meer toestelle. By IBC 2019 het ons die jongste innovasies gedeel waaraan ons werk en hoe dit kan help om jou media-ervaring te transformeer.
12 Nuwe Azure Media Services met AI
Besonderhede onder die snit!

Hierdie bladsy is aan ons webwerf.

Video Indexer ondersteun nou animasie en veeltalige inhoud

Verlede jaar by IBC het ons ons bekroonde gemaak Azure Media Services Video Indexer, en hierdie jaar het dit selfs beter geword. Video Indexer onttrek outomaties inligting en metadata uit medialêers, soos gesproke woorde, gesigte, emosies, onderwerpe en handelsmerke, en jy hoef nie 'n masjienleerkenner te wees om dit te gebruik nie.

Ons nuutste aanbiedinge sluit in voorskoue van twee uiters gesogte en gedifferensieerde kenmerke—geanimeerde karakterherkenning en veeltalige spraaktranskripsie—asook verskeie toevoegings tot die bestaande modelle wat vandag in Video Indexer beskikbaar is.

Geanimeerde karakterherkenning

12 Nuwe Azure Media Services met AI
Geanimeerde inhoud is een van die gewildste tipes inhoud, maar standaard rekenaarvisiemodelle wat ontwerp is om menslike gesigte te herken, werk nie goed daarmee nie, veral as die inhoud karakters sonder menslike gelaatstrekke bevat. Die nuwe voorskouweergawe kombineer Video Indexer met Microsoft se Azure Custom Vision-diens, wat 'n nuwe stel modelle lewer wat outomaties geanimeerde karakters opspoor en groepeer en dit maklik maak om te etiketteer en te herken met behulp van geïntegreerde pasgemaakte visie-modelle.

Die modelle is in 'n enkele pyplyn geïntegreer, wat enigiemand in staat stel om die diens te gebruik sonder enige masjienleerkennis. Resultate is beskikbaar deur 'n geen-kode Video Indexer-portaal of via 'n REST API vir vinnige integrasie in jou eie toepassings.

Ons het hierdie modelle gebou om met geanimeerde karakters te werk saam met sommige verbruikers wat regte geanimeerde inhoud vir opleiding en toetsing verskaf het. Die waarde van die nuwe funksionaliteit is goed opgesom deur Andy Gutteridge, senior direkteur van ateljeetegnologie en naproduksie by Viacom International Media Networks, wat een van die dataverskaffers was: “Die toevoeging van robuuste KI-aangedrewe geanimeerde inhoudontdekking sal dit moontlik maak ons om vinnig en doeltreffend karaktermetadata van ons biblioteekinhoud te vind en te katalogiseer.

Belangriker nog, dit sal ons kreatiewe spanne die vermoë gee om onmiddellik die inhoud te vind wat hulle nodig het, wat die tyd wat spandeer word aan die bestuur van media verminder en hulle in staat stel om op kreatiwiteit te fokus.”

Jy kan begin om kennis te maak met geanimeerde karakterherkenning met dokumentasie bladsye.

Identifikasie en transkripsie van inhoud in verskeie tale

Sommige mediabronne, soos nuus, kronieke en onderhoude, bevat opnames van mense wat verskillende tale praat. Die meeste bestaande spraak-na-teks-vermoëns vereis dat die oudio-herkenningstaal vooraf gespesifiseer word, wat dit moeilik maak om veeltalige video's te transkribeer.

Ons nuwe outomatiese gesproke taal-identifikasie-funksie vir verskillende soorte inhoud gebruik masjienleertegnologie om tale wat in mediabates voorkom, te identifiseer. Sodra dit opgespoor is, gaan elke taalsegment outomaties deur 'n transkripsieproses in die toepaslike taal, en dan word alle segmente in 'n enkele multi-taal transkripsielêer gekombineer.

12 Nuwe Azure Media Services met AI

Die resulterende transkripsie is beskikbaar as deel van die JSON-uitvoer van die Video Indexer en as onderskriflêers. Die uitvoertranskripsie is ook geïntegreer met Azure Search, sodat jy dadelik na verskillende taalsegmente in jou video's kan soek. Boonop is meertalige transkripsie beskikbaar wanneer jy met die Video Indexer-portaal werk, sodat jy die transkripsie en geïdentifiseerde taal met verloop van tyd kan sien, of na spesifieke plekke in die video vir elke taal kan spring en die veeltalige transkripsie as onderskrifte kan sien terwyl die video speel. U kan ook die ontvangde teks in enige van die 54 beskikbare tale vertaal deur die portaal en API.

Kom meer te wete oor die nuwe veeltalige inhoudherkenningsfunksie en hoe dit in Video-indekseerder gebruik word lees die dokumentasie.

Bykomende bygewerkte en verbeterde modelle

Ons voeg ook nuwe modelle by Video Indexer en verbeter bestaandes, insluitend dié wat hieronder beskryf word.

Onttrekking van entiteite wat met mense en plekke geassosieer word

Ons het ons bestaande handelsmerkontdekkingsvermoëns uitgebrei om bekende name en liggings in te sluit, soos die Eiffeltoring in Parys en Big Ben in Londen. Wanneer hulle in die gegenereerde transkripsie of op die skerm verskyn met behulp van optiese karakterherkenning (OCR), word die relevante inligting bygevoeg. Met hierdie nuwe kenmerk kan jy soek vir al die mense, plekke en handelsmerke wat in 'n video verskyn het en besonderhede daaroor bekyk, insluitend tydgleuwe, beskrywings en skakels na die Bing-soekenjin vir meer inligting.

12 Nuwe Azure Media Services met AI

Raambespeuringsmodel vir redakteur

Hierdie nuwe kenmerk voeg 'n stel "merkers" by die metadata wat aan individuele rame in die JSON-besonderhede geheg is om hul redaksionele tipe voor te stel (byvoorbeeld, wye skoot, medium skoot, naby, uiterste naby, twee skote, veelvuldige mense , buite, binne, ens.). Hierdie skoottipe-eienskappe is nuttig wanneer video vir snitte en sleepwaens geredigeer word, of wanneer jy soek na 'n spesifieke skootstyl vir artistieke doeleindes.

12 Nuwe Azure Media Services met AI
Leer meer Raamtipe opsporing in Video Indexer.

Verbeterde IPTC kartering korreligheid

Ons onderwerpbespeuringsmodel bepaal die onderwerp van 'n video gebaseer op transkripsie, optiese karakterherkenning (OCR) en bespeurde bekendes, selfs al is die onderwerp nie eksplisiet gespesifiseer nie. Ons karteer hierdie bespeurde onderwerpe aan vier klassifikasiegebiede: Wikipedia, Bing, IPTC en IAB. Hierdie verbetering stel ons in staat om tweedevlak IPTC-klassifikasie in te sluit.
Om voordeel te trek uit hierdie verbeterings is so maklik soos om jou huidige Video Indexer-biblioteek te herindekseer.

Nuwe regstreekse stroomfunksie

In Azure Media Services-voorskou bied ons ook twee nuwe kenmerke vir regstreekse stroming.

KI-aangedrewe intydse transkripsie neem regstreekse stroming na die volgende vlak

Deur Azure Media Services vir regstreekse stroming te gebruik, kan jy nou 'n uitsetstroom ontvang wat 'n outomaties gegenereerde tekssnit bykomend tot oudio- en video-inhoud insluit. Die teks word geskep met behulp van intydse oudio-transkripsie gebaseer op kunsmatige intelligensie. Pasgemaakte tegnieke word voor en na spraak-na-teks-omskakeling toegepas om resultate te verbeter. Die tekssnit is verpak in IMSC1, TTML of WebVTT, afhangende van of dit in DASH, HLS CMAF of HLS TS verskaf word.

Intydse lynkodering vir 24/7 OTT-kanale

Deur ons v3 API's te gebruik, kan jy OTT (oor-die-bo) kanale skep, bestuur en uitsaai, en alle ander Azure Media Services-kenmerke soos regstreekse video op aanvraag (VOD, video op aanvraag), verpakking en digitale regtebestuur ( DRM, bestuur van digitale regte).
Om voorskouweergawes van hierdie kenmerke te sien, besoek Azure Media Services-gemeenskap.

12 Nuwe Azure Media Services met AI

Nuwe pakket generasie vermoëns

Ondersteuning vir klankbeskrywingsnitte

Inhoud wat oor uitsaaikanale uitgesaai word, het dikwels 'n oudiosnit met verbale verduidelikings van wat op die skerm gebeur bykomend tot die gewone oudiosein. Dit maak programme meer toeganklik vir siggestremde kykers, veral as die inhoud hoofsaaklik visueel is. Nuut oudio beskrywing funksie laat jou toe om een ​​van die oudiosnitte as 'n oudiobeskrywingsnit (AD, oudiobeskrywing) te annoteer, wat spelers toelaat om die AD-snit aan kykers beskikbaar te stel.

Voeg ID3-metadata in

Om die invoeging van advertensies of pasgemaakte metadata-gebeurtenisse aan die kliënt se speler aan te dui, gebruik uitsaaiers dikwels tydmetadata wat in die video ingebed is. Benewens SCTE-35 seinmodusse, ondersteun ons nou ook ID3v2 en ander pasgemaakte skemas, gedefinieer deur die toepassingsontwikkelaar vir gebruik deur die kliënttoepassing.

Microsoft Azure-vennote demonstreer end-tot-end oplossings

Bitmovin stel Bitmovin Video Encoding en Bitmovin Video Player vir Microsoft Azure bekend. Kliënte kan nou hierdie enkodering- en uitspeeloplossings in Azure benut en voordeel trek uit gevorderde kenmerke soos drie-stadium-kodering, AV1/VC-kodek-ondersteuning, veeltalige onderskrifte en vooraf-geïntegreerde video-analise vir QoS, advertensies en video-nasporing.

Evergent demonstreer sy User Lifecycle Management Platform op Azure. As 'n toonaangewende verskaffer van oplossings vir inkomste- en kliëntelewensiklusbestuur, gebruik Evergent Azure AI om premium vermaaklikheidsverskaffers te help om kliënteverkryging en -behoud te verbeter deur doelgerigte dienspakkette en aanbiedinge op kritieke punte in die kliëntlewensiklus te skep.

Haivision sal sy intelligente wolkgebaseerde mediaroeteringdiens, SRT Hub, ten toon stel wat kliënte help om end-tot-end werkvloeie te transformeer deur Azure Data Box Edge en die transformasie van werkvloeie met Hublets van Avid, Telestream, Wowza, Cinegy en Make.tv.

SES het 'n reeks mediadienste op die Azure-platform vir sy satelliet- en bestuurde mediadienste-kliënte ontwikkel. SES sal oplossings vir ten volle bestuurde uitspeeldienste demonstreer, insluitend meesteruitspeel, gelokaliseerde uitspeel, advertensie-ontdekking en -vervanging, en hoë-gehalte intydse 24x7 multi-kanaal enkodering op Azure.

SyncWords maak gerieflike wolknutsgoed en handtekeningoutomatiseringstegnologie op Azure beskikbaar. Hierdie aanbiedinge sal dit makliker maak vir media-organisasies om outomaties onderskrifte, insluitend vreemdetaal-onderskrifte, by hul regstreekse en vanlyn video-werkvloeie op Azure te voeg.
internasionale maatskappy Tata Elxsi, 'n tegnologiedienstemaatskappy, het sy OTT SaaS-platform TEPlay in Azure Media Services geïntegreer om OTT-inhoud vanaf die wolk te lewer. Tata Elxsi het ook sy Falcon Eye kwaliteit van ervaring (QoE) moniteringsoplossing na Microsoft Azure gebring, wat ontledings en maatstawwe vir besluitneming verskaf.

Verizon Media maak sy stroomplatform beskikbaar op Azure as 'n beta-vrystelling. Verizon Media Platform is 'n onderneming-graad bestuurde OTT-oplossing wat DRM, advertensie-invoeging, een-tot-een gepersonaliseerde sessies, dinamiese inhoudvervanging en video-aflewering insluit. Die integrasie vereenvoudig werkvloeie, globale ondersteuning en skaal, en ontsluit sommige van die unieke vermoëns wat in Azure gevind word.

Bron: will.com

Voeg 'n opmerking