12 nei Azure Media Services mat kënschtlecher Intelligenz

Dem Microsoft seng Missioun ass all Persoun an Organisatioun um Planéit z'erméiglechen fir méi z'erreechen. D'Medienindustrie ass e super Beispill fir dës Missioun eng Realitéit ze maachen. Mir liewen an enger Ära wou méi Inhalt erstallt a verbraucht gëtt, op méi Weeër an op méi Apparater. Um IBC 2019 hu mir déi lescht Innovatiounen gedeelt op déi mir schaffen a wéi se hëllefe kënnen Är Medienerfarung transforméieren.
12 nei Azure Media Services mat kënschtlecher Intelligenz
Detailer ënner dem Schnëtt!

Dës Säit ass op eiser Websäit.

Video Indexer ënnerstëtzt elo Animatioun a méisproocheg Inhalt

D'lescht Joer bei IBC hu mir eise Präis-Gewënner gemaach Azure Media Services Video Indexer, an dëst Joer gouf et nach besser. Video Indexer extrahéiert automatesch Informatioun a Metadaten aus Mediendateien, sou wéi geschwat Wierder, Gesiichter, Emotiounen, Themen a Marken, an Dir musst kee Maschinnléierexpert sinn fir se ze benotzen.

Eis lescht Offeren enthalen Virschau vun zwee ganz gesichte an differenzéiert Features - animéiert Charaktererkennung a méisproocheg Riedtranskriptioun - souwéi verschidde Ergänzunge fir déi existent Modeller déi haut am Video Indexer verfügbar sinn.

Animéiert Charaktererkennung

12 nei Azure Media Services mat kënschtlecher Intelligenz
Animéierten Inhalt, Cartoons, sinn eng vun de populäersten Aarte vun Inhalt, awer Standard Computervisiounsmodeller, déi entwéckelt sinn fir mënschlech Gesiichter ze erkennen, funktionnéieren net ganz gutt domat, besonnesch wann den Inhalt Charaktere enthält ouni mënschlech Gesiichtsmerkmale. Déi nei Virschau Versioun kombinéiert Video Indexer mam Microsoft's Azure Custom Vision Service, wat zu engem neie Set vu Modeller resultéiert déi automatesch animéiert Charaktere erkennen a gruppéieren an se einfach maachen ze markéieren an ze erkennen mat integréierte personaliséierte Visiounsmodeller.

D'Modeller sinn an enger eenzeger Pipeline integréiert, wat jidderengem erlaabt de Service ouni Maschinnléierwëssen ze benotzen. D'Resultater si verfügbar iwwer e No-Code Video Indexer Portal oder iwwer e REST API fir séier Integratioun an Ären eegenen Uwendungen.

Mir hunn dës Modeller gebaut fir mat animéierten Charakteren zesumme mat e puer Konsumenten ze schaffen, déi richteg animéierten Inhalt fir Training an Tester geliwwert hunn. De Wäert vun der neier Funktionalitéit gouf gutt zesummegefaasst vum Andy Gutteridge, Senior Direkter vun der Studiotechnologie a Postproduktioun bei Viacom International Media Networks, deen ee vun den Dateprovider war: "D'Zousatz vun robusten AI-ugedriwwener animéierten Inhalt Entdeckung wäert erlaben eis fir séier an effizient Charakter Metadaten aus eisem Bibliothéik Inhalt ze fannen an ze katalogiséieren.

Virun allem wäert et eise kreativen Teams d'Fäegkeet ginn direkt den Inhalt ze fannen deen se brauchen, d'Zäit ze minimiséieren déi d'Medien verwalten an et hinnen erlaabt op Kreativitéit ze fokusséieren.

Dir kënnt mat animéierten Charakter Unerkennung kennt ufänken mat Dokumentatioun Säiten.

Identifikatioun an Transkriptioun vum Inhalt a ville Sproochen

E puer Medienressourcen, wéi Neiegkeeten, Chroniken an Interviewen, enthalen Opzeechnunge vu Leit déi verschidde Sprooche schwätzen. Déi meescht existent Ried-zu-Text Fäegkeeten erfuerderen datt d'Audioerkennungssprooch am Viraus spezifizéiert gëtt, wat et schwéier mécht méisproocheg Videoen ze transkriéieren.

Eis nei Automatesch Geschwat Sprooch Identifikatioun Feature fir verschidden Aarte vun Inhalt benotzt Maschinn Léieren Technologie fir Sproochen ze identifizéieren déi a Medienverméigen fonnt ginn. Eemol festgestallt, geet all Sproochesegment automatesch duerch en Transkriptiounsprozess an der entspriechender Sprooch, an da ginn all Segmenter an eng eenzeg Multi-Sprooch Transkriptiounsdatei kombinéiert.

12 nei Azure Media Services mat kënschtlecher Intelligenz

De resultéierende Transkript ass verfügbar als Deel vum JSON Output vum Video Indexer an als Ënnertiteldateien. Den Output Transkript ass och integréiert mat Azure Search, wat Iech erlaabt Iech direkt no verschiddene Sproochesegmenter an Äre Videoen ze sichen. Zousätzlech ass méisproocheg Transkriptioun verfügbar wann Dir mam Video Indexer Portal schafft, sou datt Dir d'Transkriptioun an d'identifizéiert Sprooch iwwer Zäit kuckt, oder op spezifesch Plazen am Video fir all Sprooch sprangen an déi méisproocheg Transkriptioun als Ënnerschrëfte gesinn wéi de Video spillt. Dir kënnt och den erhalenen Text an eng vun de 54 verfügbare Sproochen iwwer de Portal an API iwwersetzen.

Léiert méi iwwer déi nei méisproocheg Inhalterkennungsfunktioun a wéi et am Video Indexer benotzt gëtt liesen d'Dokumentatioun.

Zousätzlech aktualiséiert a verbessert Modeller

Mir addéieren och nei Modeller zum Video Indexer a verbesseren déi existent, och déi hei ënnen beschriwwen.

Extrait vun Entitéite verbonne mat Leit a Plazen

Mir hunn eis existent Markentdeckungsfäegkeeten erweidert fir bekannt Nimm a Plazen ze enthalen, sou wéi den Eiffeltuerm zu Paräis an de Big Ben zu London. Wann se am generéierten Transkript oder um Bildschierm mat opteschen Charaktererkennung (OCR) erscheinen, gëtt déi relevant Informatioun bäigefüügt. Mat dëser neier Feature kënnt Dir all d'Leit, Plazen a Marken sichen, déi an engem Video opgetaucht sinn, an Detailer iwwer si kucken, inklusiv Zäitplazen, Beschreiwungen a Linken op d'Bing Sichmotor fir méi Informatioun.

12 nei Azure Media Services mat kënschtlecher Intelligenz

Frame Detektiounsmodell fir Redakter

Dës nei Feature füügt e Set vun "Tags" un d'Metadaten, déi un eenzel Rummen an den JSON-Detailer verbonne sinn, fir hiren redaktionnellen Typ ze representéieren (zum Beispill Breetshot, Medium Shot, Close-up, Extreme Close-up, zwee Schëss, verschidde Leit , dobaussen, dobannen, etc.). Dës Schéisstyp Charakteristiken sinn nëtzlech wann Dir Video fir Clips an Trailer ännert, oder wann Dir no engem spezifesche Schéissstil fir artistesch Zwecker sicht.

12 nei Azure Media Services mat kënschtlecher Intelligenz
Léier méi Frame Typ Detektioun am Video Indexer.

Verbesserte IPTC Mapping Granularity

Eist Thema Detektiounsmodell bestëmmt d'Thema vun engem Video baséiert op Transkriptioun, optesch Charaktererkennung (OCR), an entdeckte Promi, och wann d'Thema net explizit spezifizéiert ass. Mir kartéieren dës entdeckt Themen op véier Klassifikatiounsberäicher: Wikipedia, Bing, IPTC an IAB. Dës Verbesserung erlaabt eis zweet-Niveau IPTC Klassifikatioun abegraff.
Virdeel vun dëse Verbesserungen ass sou einfach wéi Är aktuell Video Indexer Bibliothéik nei ze indexéieren.

Nei Live Streaming Funktionalitéit

An der Preview vun Azure Media Services bidde mir och zwee nei Features fir Live Streaming.

AI-ugedriwwen Echtzäit Transkriptioun hëlt Live Streaming op den nächsten Niveau

Mat Azure Media Services fir Live Streaming kënnt Dir elo en Output Stream kréien, deen en automatesch generéierten Texttrack zousätzlech zum Audio- a Videoinhalt enthält. Den Text gëtt erstallt mat Echtzäit Audio Transkriptioun baséiert op kënschtlecher Intelligenz. Benotzerdefinéiert Technike gi virun an no Ried-zu-Text Konversioun applizéiert fir Resultater ze verbesseren. D'Textstreck ass an IMSC1, TTML oder WebVTT verpackt, ofhängeg ob et an DASH, HLS CMAF oder HLS TS geliwwert gëtt.

Echtzäit Linn Kodéierung fir 24/7 OTT Kanäl

Mat eise v3 APIen kënnt Dir OTT (Over-the-Top) Kanäl erstellen, verwalten an iwwerdroen, an all aner Azure Media Services Features benotzen wéi Live Video on Demand (VOD, Video on demand), Verpackung an Digital Rechter Gestioun ( DRM, Digital Rights Management).
Fir Virschau Versioune vun dëse Funktiounen ze gesinn, besicht Azure Media Services Gemeinschaft.

12 nei Azure Media Services mat kënschtlecher Intelligenz

Nei Package Generatioun Fäegkeeten

Ënnerstëtzung fir Audio Beschreiwung Bunnen

Inhalter Sendung iwwer Broadcast Channels huet dacks eng Audiostreck mat verbal Erklärungen iwwer wat um Bildschierm geschitt nieft dem normale Audiosignal. Dëst mécht Programmer méi zougänglech fir sehbehënnerte Zuschauer, besonnesch wann den Inhalt haaptsächlech visuell ass. Nei Audio Beschreiwung Funktioun erlaabt Iech eng vun den Audio Tracks als Audio Beschreiwung Streck ze annotéieren (AD, Audio Beschreiwung), erlaabt Spiller d'AD Streck fir Zuschauer ze maachen.

ID3 Metadaten aginn

Fir d'Insertioun vu Reklammen oder personaliséierte Metadaten-Evenementer dem Client säi Spiller ze signaliséieren, benotzen d'Sender dacks Zäit-Metadaten, déi am Video agebonne sinn. Zousätzlech zu SCTE-35 Signaliséierungsmodi, ënnerstëtzen mir elo och ID3v2 an aner personaliséiert Schemaen, definéiert vum Applikatiounsentwéckler fir vun der Clientapplikatioun ze benotzen.

Microsoft Azure Partner demonstréieren end-to-end Léisungen

Bitmovin stellt Bitmovin Video Encoding a Bitmovin Video Player fir Microsoft Azure vir. D'Clientë kënnen elo dës Kodéierungs- a Playout-Léisungen an Azure profitéieren a profitéiere vu fortgeschratten Features wéi Dräi-Etapp Kodéierung, AV1 / VC Codec Support, méisproocheg Ënnertitelen, a pre-integréiert Videoanalytik fir QoS, Reklammen a Video Tracking.

Evergent weist seng User Lifecycle Management Plattform op Azure. Als e féierende Fournisseur vun Einnahmen a Client Lifecycle Management Léisunge benotzt Evergent Azure AI fir Premium Entertainment Ubidder ze hëllefen d'Client Acquisitioun a Retention ze verbesseren andeems geziilte Service Packagen an Offeren op kritesche Punkten am Client Lifecycle kreéieren.

Haivision wäert säin intelligenten Cloud-baséierten Medien Routing Service, SRT Hub, weisen, deen de Clienten hëlleft end-to-end Workflows ze transforméieren Azure Data Box Edge an transforméiert Workflows mat Hublets vu Avid, Telestream, Wowza, Cinegy a Make.tv.

SES huet eng Suite vu Broadcast-grade Medienservicer op der Azure Plattform fir seng Satelliten- a verwaltete Medienservicer Clienten entwéckelt. SES wäert Léisunge fir voll geréiert Playout Servicer demonstréieren, dorënner Master Playout, lokaliséierter Playout, Annonce Entdeckung an Ersatz, a qualitativ héichwäerteg Echtzäit 24x7 Multi-Channel Kodéierung op Azure.

SyncWords mécht praktesch Cloud Tools an Ënnerschrëft Automatisatiounstechnologie op Azure verfügbar. Dës Offere maachen et méi einfach fir Medienorganisatiounen automatesch Ënnertitelen, dorënner Friemsproochen Ënnertitelen, an hir Live an offline Video Workflows op Azure ze addéieren.
international Firma Tata Elxsi, eng Technologie Servicer Firma, huet seng OTT SaaS Plattform TEPlay an Azure Media Services integréiert fir OTT Inhalt aus der Wollek ze liwweren. Tata Elxsi huet och seng Falcon Eye Qualitéit vun der Erfahrung (QoE) Iwwerwaachungsléisung op Microsoft Azure bruecht, Analyse a Metriken fir Entscheedungsprozess.

Verizon Media mécht seng Streaming Plattform op Azure als Beta Verëffentlechung verfügbar. Verizon Media Plattform ass eng Enterprise-grade geréiert OTT-Léisung déi DRM, Ad-Insertion, een-zu-een personaliséiert Sessiounen, dynamesch Inhaltsersatz a Videoliwwerung enthält. D'Integratioun vereinfacht Workflows, global Ënnerstëtzung a Skala, a spärt e puer vun den eenzegaartege Fäegkeeten op, déi an Azure fonnt ginn.

Source: will.com

Setzt e Commentaire