Microsoftin tehtävänä on antaa kaikille planeetan ihmisille ja organisaatioille mahdollisuus saavuttaa enemmän. Mediateollisuus on loistava esimerkki tämän tehtävän toteuttamisesta. Elämme aikakautta, jolloin enemmän sisältöä luodaan ja kulutetaan useammilla tavoilla ja useammilla laitteilla. IBC 2019 -tapahtumassa kerroimme viimeisimmistä innovaatioista, joiden parissa työskentelemme, ja kuinka ne voivat auttaa muuttamaan mediakokemustasi.
Yksityiskohdat leikkauksen alla!
Tämä sivu on päällä
Video Indexer tukee nyt animaatioita ja monikielistä sisältöä
Viime vuonna IBC:ssä teimme palkinnon
Uusimmat tarjouksemme sisältävät esikatselun kahdesta erittäin halutusta ja erottuvasta ominaisuudesta – animoidusta hahmontunnistuksesta ja monikielisestä puheen transkriptiosta – sekä useita lisäyksiä Video Indexerin nykyisiin malleihin.
Animoitujen hahmojen tunnistus
Animoitu sisältö on yksi suosituimmista sisältötyypeistä, mutta tavalliset tietokonenäkömallit, jotka on suunniteltu tunnistamaan ihmiskasvot, eivät toimi hyvin sen kanssa, varsinkin jos sisältö sisältää hahmoja ilman ihmisen kasvonpiirteitä. Uudessa esikatseluversiossa Video Indexer yhdistyy Microsoftin Azure Custom Vision -palveluun. Se tarjoaa uuden mallisarjan, joka tunnistaa ja ryhmittelee animoidut hahmot automaattisesti ja tekee niistä helppo merkitä ja tunnistaa integroitujen mukautettujen visiomallien avulla.
Mallit on integroitu yhdeksi putkilinjaksi, jolloin kuka tahansa voi käyttää palvelua ilman koneoppimistietoa. Tulokset ovat saatavilla ilman koodia sisältävän Video Indexer -portaalin tai REST API:n kautta nopeaa integrointia varten omiin sovelluksiisi.
Rakensimme nämä mallit toimimaan animoitujen hahmojen ja joidenkin kuluttajien kanssa, jotka tarjosivat todellista animoitua sisältöä koulutusta ja testausta varten. Uuden toiminnallisuuden arvon tiivisti hyvin Andy Gutteridge, Viacom International Media Networksin studiotekniikan ja jälkituotannon vanhempi johtaja, joka oli yksi tiedon toimittajista: "Järkeän tekoälyllä toimivan animoidun sisällön löytämisen lisääminen mahdollistaa voimme nopeasti ja tehokkaasti löytää ja luetteloida hahmojen metatiedot kirjastomme sisällöstä.
Mikä tärkeintä, se antaa luoville tiimeillemme mahdollisuuden löytää välittömästi tarvitsemansa sisällön, mikä minimoi median hallintaan kuluvan ajan ja antaa heidän keskittyä luovuuteen."
Voit aloittaa tutustumisen animoituun hahmontunnistukseen
Sisällön tunnistaminen ja transkriptio useilla kielillä
Jotkut mediaresurssit, kuten uutiset, kronikot ja haastattelut, sisältävät tallenteita eri kieliä puhuvista ihmisistä. Useimmat olemassa olevat puheteksti-ominaisuudet edellyttävät, että äänentunnistuskieli on määritettävä etukäteen, mikä vaikeuttaa monikielisten videoiden litteroimista.
Uusi automaattinen puhutun kielen tunnistustoimintomme erityyppisille sisällöille käyttää koneoppimisteknologiaa mediasisällöistä löytyvien kielten tunnistamiseen. Kun jokainen kielisegmentti on tunnistettu, se käy automaattisesti läpi transkriptioprosessin sopivalla kielellä, minkä jälkeen kaikki segmentit yhdistetään yhdeksi monikieliseksi transkriptiotiedostoksi.
Tuloksena oleva transkriptio on saatavilla osana Video Indexerin JSON-lähtöä ja tekstitystiedostoina. Tulostustranskriptio on myös integroitu Azure Searchiin, joten voit etsiä välittömästi eri kielisegmenttejä videoistasi. Lisäksi monikielinen transkriptio on käytettävissä, kun työskentelet Video Indexer -portaalin kanssa, joten voit tarkastella litteraattia ja tunnistettua kieltä ajan mittaan tai hypätä tiettyihin paikkoihin videossa kullekin kielelle ja nähdä monikielisen transkription tekstityksenä videon toiston aikana. Voit myös kääntää vastaanotetun tekstin mille tahansa 54:stä saatavilla olevasta kielestä portaalin ja API:n kautta.
Lue lisää uudesta monikielisestä sisällöntunnistusominaisuudesta ja sen käytöstä Video Indexerissä
Lisää päivitettyjä ja parannettuja malleja
Lisäämme myös uusia malleja Video Indexeriin ja parannamme olemassa olevia malleja, mukaan lukien alla kuvatut.
Poimitaan ihmisiin ja paikkoihin liittyviä kokonaisuuksia
Olemme laajentaneet olemassa olevia tuotemerkkien etsintäkykyämme kattamaan tunnettuja nimiä ja paikkoja, kuten Pariisin Eiffel-tornin ja Lontoon Big Benin. Kun ne näkyvät luodussa transkriptiossa tai näytöllä optisen merkintunnistuksen (OCR) avulla, asiaankuuluvat tiedot lisätään. Tämän uuden ominaisuuden avulla voit etsiä kaikkia videossa esiintyneitä ihmisiä, paikkoja ja brändejä ja tarkastella tietoja niistä, mukaan lukien aikavälit, kuvaukset ja linkit Bing-hakukoneeseen lisätietojen saamiseksi.
Kehysten tunnistusmalli editorille
Tämä uusi ominaisuus lisää joukon "tunnisteita" metatietoihin, jotka on liitetty yksittäisiin kehyksiin JSON-tiedoissa edustamaan niiden toimituksellista tyyppiä (esimerkiksi laajakuva, keskikuva, lähikuva, äärimmäinen lähikuva, kaksi kuvaa, useita ihmisiä , ulkona, sisällä jne.). Nämä otostyypin ominaisuudet ovat hyödyllisiä, kun editoidaan videota leikkeitä ja trailereita varten tai kun etsit tiettyä kuvaustyyliä taiteellisiin tarkoituksiin.
Parannettu IPTC-kartoituksen tarkkuus
Aiheentunnistusmallimme määrittää videon aiheen transkription, optisen merkintunnistuksen (OCR) ja havaittujen kuuluisuuksien perusteella, vaikka aihetta ei ole erikseen määritelty. Kartoitamme nämä havaitut aiheet neljään luokitusalueeseen: Wikipedia, Bing, IPTC ja IAB. Tämän parannuksen ansiosta voimme sisällyttää toisen tason IPTC-luokituksen.
Näiden parannusten hyödyntäminen on yhtä helppoa kuin nykyisen Video Indexer -kirjastosi uudelleenindeksointi.
Uusi suoratoistotoiminto
Azure Media Services -esikatselussa tarjoamme myös kaksi uutta ominaisuutta suoratoistoon.
Tekoälyllä toimiva reaaliaikainen transkriptio vie suoratoiston uudelle tasolle
Käyttämällä Azure Media Services -palvelua suoratoistoon, voit nyt vastaanottaa ulostulovirran, joka sisältää automaattisesti luodun tekstiraidan ääni- ja videosisällön lisäksi. Teksti on luotu tekoälyyn perustuvalla reaaliaikaisella audiotranskriptiolla. Mukautettuja tekniikoita käytetään ennen ja jälkeen puheen tekstiksi muuntamisen tulosten parantamiseksi. Tekstiraita on pakattu IMSC1-, TTML- tai WebVTT-muotoon riippuen siitä, toimitetaanko se DASH-, HLS CMAF- vai HLS TS -muodossa.
Reaaliaikainen linjakoodaus 24/7 OTT-kanaville
V3-sovellusliittymiemme avulla voit luoda, hallita ja lähettää OTT-kanavia (over-the-top) ja käyttää kaikkia muita Azure Media Services -ominaisuuksia, kuten suoraa tilausvideota (VOD, video on demand), pakkausta ja digitaalisten oikeuksien hallintaa ( DRM, digitaalisten oikeuksien hallinta).
Näet näiden ominaisuuksien esikatseluversiot osoitteessa
Uudet pakettien luontiominaisuudet
Äänikuvausraitojen tuki
Lähetyskanavien kautta lähetettävässä sisällössä on tavallisen äänisignaalin lisäksi usein ääniraita, jossa on sanallisia selityksiä siitä, mitä ruudulla tapahtuu. Tämä tekee ohjelmista helpommin näkövammaisten katsojien saatavilla, varsinkin jos sisältö on ensisijaisesti visuaalista. Uusi
Lisätään ID3-metatietoja
Lähetystoiminnan harjoittajat käyttävät usein videoon upotettua ajastettua metadataa viestittääkseen mainosten tai mukautettujen metatietotapahtumien lisäämisestä asiakkaan soittimelle. SCTE-35-signalointitilojen lisäksi tuemme nyt myös
Microsoft Azure -kumppanit esittelevät päästä päähän -ratkaisuja
kansainvälinen yritys
Lähde: will.com