Microsoft se missie is om elke persoon en organisasie op die planeet te bemagtig om meer te bereik. Die mediabedryf is 'n goeie voorbeeld om hierdie missie 'n werklikheid te maak. Ons leef in 'n era waar meer inhoud geskep en verbruik word, op meer maniere en op meer toestelle. By IBC 2019 het ons die jongste innovasies gedeel waaraan ons werk en hoe dit kan help om jou media-ervaring te transformeer.
Besonderhede onder die snit!
Hierdie bladsy is aan
Video Indexer ondersteun nou animasie en veeltalige inhoud
Verlede jaar by IBC het ons ons bekroonde gemaak
Ons nuutste aanbiedinge sluit in voorskoue van twee uiters gesogte en gedifferensieerde kenmerke—geanimeerde karakterherkenning en veeltalige spraaktranskripsie—asook verskeie toevoegings tot die bestaande modelle wat vandag in Video Indexer beskikbaar is.
Geanimeerde karakterherkenning
Geanimeerde inhoud is een van die gewildste tipes inhoud, maar standaard rekenaarvisiemodelle wat ontwerp is om menslike gesigte te herken, werk nie goed daarmee nie, veral as die inhoud karakters sonder menslike gelaatstrekke bevat. Die nuwe voorskouweergawe kombineer Video Indexer met Microsoft se Azure Custom Vision-diens, wat 'n nuwe stel modelle lewer wat outomaties geanimeerde karakters opspoor en groepeer en dit maklik maak om te etiketteer en te herken met behulp van geïntegreerde pasgemaakte visie-modelle.
Die modelle is in 'n enkele pyplyn geïntegreer, wat enigiemand in staat stel om die diens te gebruik sonder enige masjienleerkennis. Resultate is beskikbaar deur 'n geen-kode Video Indexer-portaal of via 'n REST API vir vinnige integrasie in jou eie toepassings.
Ons het hierdie modelle gebou om met geanimeerde karakters te werk saam met sommige verbruikers wat regte geanimeerde inhoud vir opleiding en toetsing verskaf het. Die waarde van die nuwe funksionaliteit is goed opgesom deur Andy Gutteridge, senior direkteur van ateljeetegnologie en naproduksie by Viacom International Media Networks, wat een van die dataverskaffers was: “Die toevoeging van robuuste KI-aangedrewe geanimeerde inhoudontdekking sal dit moontlik maak ons om vinnig en doeltreffend karaktermetadata van ons biblioteekinhoud te vind en te katalogiseer.
Belangriker nog, dit sal ons kreatiewe spanne die vermoë gee om onmiddellik die inhoud te vind wat hulle nodig het, wat die tyd wat spandeer word aan die bestuur van media verminder en hulle in staat stel om op kreatiwiteit te fokus.”
Jy kan begin om kennis te maak met geanimeerde karakterherkenning met
Identifikasie en transkripsie van inhoud in verskeie tale
Sommige mediabronne, soos nuus, kronieke en onderhoude, bevat opnames van mense wat verskillende tale praat. Die meeste bestaande spraak-na-teks-vermoëns vereis dat die oudio-herkenningstaal vooraf gespesifiseer word, wat dit moeilik maak om veeltalige video's te transkribeer.
Ons nuwe outomatiese gesproke taal-identifikasie-funksie vir verskillende soorte inhoud gebruik masjienleertegnologie om tale wat in mediabates voorkom, te identifiseer. Sodra dit opgespoor is, gaan elke taalsegment outomaties deur 'n transkripsieproses in die toepaslike taal, en dan word alle segmente in 'n enkele multi-taal transkripsielêer gekombineer.
Die resulterende transkripsie is beskikbaar as deel van die JSON-uitvoer van die Video Indexer en as onderskriflêers. Die uitvoertranskripsie is ook geïntegreer met Azure Search, sodat jy dadelik na verskillende taalsegmente in jou video's kan soek. Boonop is meertalige transkripsie beskikbaar wanneer jy met die Video Indexer-portaal werk, sodat jy die transkripsie en geïdentifiseerde taal met verloop van tyd kan sien, of na spesifieke plekke in die video vir elke taal kan spring en die veeltalige transkripsie as onderskrifte kan sien terwyl die video speel. U kan ook die ontvangde teks in enige van die 54 beskikbare tale vertaal deur die portaal en API.
Kom meer te wete oor die nuwe veeltalige inhoudherkenningsfunksie en hoe dit in Video-indekseerder gebruik word
Bykomende bygewerkte en verbeterde modelle
Ons voeg ook nuwe modelle by Video Indexer en verbeter bestaandes, insluitend dié wat hieronder beskryf word.
Onttrekking van entiteite wat met mense en plekke geassosieer word
Ons het ons bestaande handelsmerkontdekkingsvermoëns uitgebrei om bekende name en liggings in te sluit, soos die Eiffeltoring in Parys en Big Ben in Londen. Wanneer hulle in die gegenereerde transkripsie of op die skerm verskyn met behulp van optiese karakterherkenning (OCR), word die relevante inligting bygevoeg. Met hierdie nuwe kenmerk kan jy soek vir al die mense, plekke en handelsmerke wat in 'n video verskyn het en besonderhede daaroor bekyk, insluitend tydgleuwe, beskrywings en skakels na die Bing-soekenjin vir meer inligting.
Raambespeuringsmodel vir redakteur
Hierdie nuwe kenmerk voeg 'n stel "merkers" by die metadata wat aan individuele rame in die JSON-besonderhede geheg is om hul redaksionele tipe voor te stel (byvoorbeeld, wye skoot, medium skoot, naby, uiterste naby, twee skote, veelvuldige mense , buite, binne, ens.). Hierdie skoottipe-eienskappe is nuttig wanneer video vir snitte en sleepwaens geredigeer word, of wanneer jy soek na 'n spesifieke skootstyl vir artistieke doeleindes.
Verbeterde IPTC kartering korreligheid
Ons onderwerpbespeuringsmodel bepaal die onderwerp van 'n video gebaseer op transkripsie, optiese karakterherkenning (OCR) en bespeurde bekendes, selfs al is die onderwerp nie eksplisiet gespesifiseer nie. Ons karteer hierdie bespeurde onderwerpe aan vier klassifikasiegebiede: Wikipedia, Bing, IPTC en IAB. Hierdie verbetering stel ons in staat om tweedevlak IPTC-klassifikasie in te sluit.
Om voordeel te trek uit hierdie verbeterings is so maklik soos om jou huidige Video Indexer-biblioteek te herindekseer.
Nuwe regstreekse stroomfunksie
In Azure Media Services-voorskou bied ons ook twee nuwe kenmerke vir regstreekse stroming.
KI-aangedrewe intydse transkripsie neem regstreekse stroming na die volgende vlak
Deur Azure Media Services vir regstreekse stroming te gebruik, kan jy nou 'n uitsetstroom ontvang wat 'n outomaties gegenereerde tekssnit bykomend tot oudio- en video-inhoud insluit. Die teks word geskep met behulp van intydse oudio-transkripsie gebaseer op kunsmatige intelligensie. Pasgemaakte tegnieke word voor en na spraak-na-teks-omskakeling toegepas om resultate te verbeter. Die tekssnit is verpak in IMSC1, TTML of WebVTT, afhangende van of dit in DASH, HLS CMAF of HLS TS verskaf word.
Intydse lynkodering vir 24/7 OTT-kanale
Deur ons v3 API's te gebruik, kan jy OTT (oor-die-bo) kanale skep, bestuur en uitsaai, en alle ander Azure Media Services-kenmerke soos regstreekse video op aanvraag (VOD, video op aanvraag), verpakking en digitale regtebestuur ( DRM, bestuur van digitale regte).
Om voorskouweergawes van hierdie kenmerke te sien, besoek
Nuwe pakket generasie vermoëns
Ondersteuning vir klankbeskrywingsnitte
Inhoud wat oor uitsaaikanale uitgesaai word, het dikwels 'n oudiosnit met verbale verduidelikings van wat op die skerm gebeur bykomend tot die gewone oudiosein. Dit maak programme meer toeganklik vir siggestremde kykers, veral as die inhoud hoofsaaklik visueel is. Nuut
Voeg ID3-metadata in
Om die invoeging van advertensies of pasgemaakte metadata-gebeurtenisse aan die kliënt se speler aan te dui, gebruik uitsaaiers dikwels tydmetadata wat in die video ingebed is. Benewens SCTE-35 seinmodusse, ondersteun ons nou ook
Microsoft Azure-vennote demonstreer end-tot-end oplossings
internasionale maatskappy
Bron: will.com