Hlutverk Microsoft er að styrkja alla einstaklinga og samtök á jörðinni til að ná meira. Fjölmiðlaiðnaðurinn er frábært dæmi um að gera þetta verkefni að veruleika. Við lifum á tímum þar sem meira efni er búið til og neytt, á fleiri vegu og í fleiri tækjum. Á IBC 2019 deildum við nýjustu nýjungum sem við erum að vinna að og hvernig þær geta hjálpað til við að umbreyta fjölmiðlaupplifun þinni.
Upplýsingar undir klippingu!
Þessi síða er á
Video Indexer styður nú hreyfimyndir og fjöltyngt efni
Á síðasta ári hjá IBC gerðum við verðlaunin okkar
Nýjasta tilboð okkar fela í sér forsýningar á tveimur mjög eftirsóttum og aðgreindum eiginleikum—teiknimyndapersónugreiningu og fjöltyngdri ræðuuppskrift—ásamt nokkrum viðbótum við núverandi gerðir sem eru fáanlegar í dag í Video Indexer.
Hreyfimyndapersónaþekking
Hreyfiefni er ein vinsælasta tegund efnis, en venjuleg tölvusjónlíkön sem eru hönnuð til að þekkja andlit manna virka ekki vel með því, sérstaklega ef efnið inniheldur persónur án mannlegra andlitsþátta. Nýja forskoðunarútgáfan sameinar Video Indexer við Azure Custom Vision þjónustu Microsoft, sem skilar nýju setti af gerðum sem skynja sjálfkrafa og flokka hreyfimyndir og auðvelda þeim að merkja og þekkja með samþættum sérsniðnum sjónlíkönum.
Líkönin eru samþætt í eina leiðslu, sem gerir hverjum sem er kleift að nota þjónustuna án nokkurrar vélrænnar þekkingar. Niðurstöður eru fáanlegar í gegnum gáttina fyrir Video Indexer án kóða eða í gegnum REST API fyrir fljótlega samþættingu í eigin forritum.
Við smíðuðum þessi líkön til að vinna með teiknimyndapersónum ásamt sumum neytendum sem útveguðu alvöru hreyfimyndir til þjálfunar og prófunar. Andy Gutteridge, yfirstjóri stúdíótækni og eftirvinnslu hjá Viacom International Media Networks, sem var einn af gagnaveitum, var vel samandreginn af verðmæti nýju virkninnar: „Viðbót á öflugri gervigreind-knúnu hreyfimyndauppgötvun mun leyfa okkur til að finna og skrá persónulýsigögn á fljótlegan og skilvirkan hátt úr efni bókasafnsins okkar.
Mikilvægast er að það mun gefa skapandi teymum okkar getu til að finna samstundis efnið sem þeir þurfa, lágmarka tíma sem varið er í að stjórna fjölmiðlum og leyfa þeim að einbeita sér að sköpunargáfu.“
Þú getur byrjað að kynnast teiknimyndaþekkingu með
Auðkenning og umritun efnis á mörgum tungumálum
Sumir fjölmiðlar, eins og fréttir, annálar og viðtöl, innihalda upptökur af fólki sem talar mismunandi tungumál. Flestir núverandi tal-til-texta getu krefjast þess að hljóðgreiningarmálið sé tilgreint fyrirfram, sem gerir það erfitt að umrita fjöltyngd myndbönd.
Nýi sjálfvirka auðkenningaraðgerðin okkar á töluðu tungumáli fyrir ýmsar tegundir efnis notar vélanámstækni til að bera kennsl á tungumál sem finnast í fjölmiðlaeignum. Þegar það hefur fundist fer hver málhluti sjálfkrafa í gegnum umritunarferli á viðeigandi tungumáli og síðan eru allir hlutir sameinaðir í eina fjöltungumála umritunarskrá.
Afritið sem myndast er fáanlegt sem hluti af JSON-úttakinu á Video Indexer og sem textaskrár. Úttaksafritið er einnig samþætt við Azure Search, sem gerir þér kleift að leita strax að mismunandi tungumálahlutum í myndböndunum þínum. Að auki er fjöltyng umritun í boði þegar unnið er með Video Indexer gáttinni, svo þú getur skoðað afritið og auðkennt tungumál með tímanum, eða hoppað á tiltekna staði í myndbandinu fyrir hvert tungumál og séð fjöltyngda umritunina sem texta þegar myndbandið er spilað. Þú getur líka þýtt móttekinn texta á hvaða 54 tungumál sem er tiltækt í gegnum gáttina og API.
Lærðu meira um nýja fjöltyngda efnisgreiningareiginleikann og hvernig hann er notaður í Video Indexer
Viðbótaruppfærðar og endurbættar gerðir
Við erum líka að bæta nýjum gerðum við Video Indexer og bæta núverandi, þar á meðal þær sem lýst er hér að neðan.
Að draga út einingar sem tengjast fólki og stöðum
Við höfum aukið núverandi vörumerkjauppgötvunargetu okkar til að innihalda þekkt nöfn og staðsetningar, eins og Eiffelturninn í París og Big Ben í London. Þegar þau birtast í mynduðu afritinu eða á skjánum með optískri stafagreiningu (OCR), er viðeigandi upplýsingum bætt við. Með þessum nýja eiginleika geturðu leitað að öllu fólki, stöðum og vörumerkjum sem komu fram í myndbandi og skoðað upplýsingar um þau, þar á meðal tímaramma, lýsingar og tengla á Bing leitarvélina til að fá frekari upplýsingar.
Rammaskynjunarlíkan fyrir ritstjóra
Þessi nýi eiginleiki bætir setti af „merkjum“ við lýsigögnin sem eru fest við einstaka ramma í JSON-upplýsingunum til að tákna ritstjórnargerð þeirra (til dæmis breiðskot, miðlungsmynd, nærmynd, mjög nærmynd, tvær myndir, marga einstaklinga , úti, inni, osfrv.). Þessir myndatökueiginleikar eru gagnlegir þegar verið er að breyta myndbandi fyrir klippur og tengivagna, eða þegar leitað er að ákveðnum skotstíl í listrænum tilgangi.
Aukin nákvæmni IPTC kortlagningar
Efnisgreiningarlíkan okkar ákvarðar efni myndbands byggt á umritun, optískri persónugreiningu (OCR) og greindum frægum einstaklingum, jafnvel þótt efnisatriðið sé ekki sérstaklega tilgreint. Við kortleggjum þessi greindu efni á fjögur flokkunarsvæði: Wikipedia, Bing, IPTC og IAB. Þessi aukning gerir okkur kleift að fela annars stigs IPTC flokkun.
Að nýta sér þessar endurbætur er eins auðvelt og að endurskrá núverandi Video Indexer bókasafnið þitt.
Ný streymivirkni í beinni
Í forskoðun Azure Media Services bjóðum við einnig upp á tvo nýja eiginleika fyrir streymi í beinni.
Rauntímauppskrift knúin gervigreind tekur streymi í beinni á næsta stig
Með því að nota Azure Media Services fyrir streymi í beinni geturðu nú tekið á móti úttaksstraumi sem inniheldur sjálfkrafa myndað textalag auk hljóð- og myndefnis. Textinn er búinn til með rauntíma hljóðuppskrift byggt á gervigreind. Sérsniðnum aðferðum er beitt fyrir og eftir umbreytingu tal í texta til að bæta árangur. Textalagið er pakkað í IMSC1, TTML eða WebVTT, eftir því hvort það er afhent í DASH, HLS CMAF eða HLS TS.
Rauntíma línukóðun fyrir 24/7 OTT rásir
Með því að nota v3 APIs okkar geturðu búið til, stjórnað og útvarpað OTT (over-the-top) rásum og notað alla aðra eiginleika Azure Media Services eins og lifandi myndskeið á eftirspurn (VOD, video on demand), pökkun og stafræn réttindastjórnun ( DRM, stafræn réttindastjórnun).
Til að sjá forskoðunarútgáfur af þessum eiginleikum skaltu fara á
Nýr pakka kynslóð getu
Stuðningur við hljóðlýsingalög
Efni sem sent er út yfir útvarpsrásir hefur oft hljóðrás með munnlegum skýringum á því sem er að gerast á skjánum auk venjulegs hljóðmerkis. Þetta gerir forrit aðgengilegra fyrir sjónskerta áhorfendur, sérstaklega ef efnið er fyrst og fremst sjónrænt. Nýtt
Að setja inn ID3 lýsigögn
Til að gefa til kynna innsetningu auglýsinga eða sérsniðinna lýsigagnaviðburða til spilara viðskiptavinarins nota útvarpsstöðvar oft tímasett lýsigögn sem eru felld inn í myndbandið. Til viðbótar við SCTE-35 merkjastillingar styðjum við nú einnig
Microsoft Azure samstarfsaðilar sýna fram á end-to-end lausnir
alþjóðlegt fyrirtæki
Heimild: www.habr.com