🥇12 Nove funzioni di Azure Media Services cù AI

A missione di Microsoft hè di empower ogni persona è urganizazione in u pianeta per ottene più. L'industria di i media hè un grande esempiu di fà sta missione una realità. Vivemu in una era induve più cuntenutu hè creatu è cunsumatu, in più manere è in più dispusitivi. À l'IBC 2019, avemu spartutu l'ultime innovazioni chì avemu travagliatu è cumu ponu aiutà à trasfurmà a vostra sperienza media.

Dettagli sottu u cut!

Sta pagina hè nantu u nostru situ web.

Video Indexer supporta avà animazione è cuntenutu multilingue

L'annu passatu à IBC avemu fattu u nostru premiatu Azure Media Services Video Indexer, è questu annu hè ancu megliu. Video Indexer estrae automaticamente l'infurmazioni è i metadati da i fugliali media, cum'è e parolle parlate, facce, emozioni, temi è marche, è ùn avete micca bisognu di esse un espertu d'apprendimentu di macchina per aduprà.

E nostre ultime offerte includenu anteprima di duie funzioni assai ricercate è differenziate - ricunniscenza di caratteri animati è trascrizzione di parlà multilingue - è ancu parechje aghjunte à i mudelli esistenti dispunibili oghje in Video Indexer.

Ricunniscenza di caratteri animati

U cuntenutu animatu hè unu di i tipi di cuntenutu più populari, ma i mudelli di visione di l'informatica standard cuncepiti per ricunnosce e facce umane ùn funzionanu micca bè cun ellu, soprattuttu se u cuntenutu cuntene caratteri senza caratteristiche faciale umane. A nova versione di anteprima combina Video Indexer cù u serviziu Azure Custom Vision di Microsoft, offrendu un novu set di mudelli chì rilevanu automaticamente è raggruppanu caratteri animati è facenu facili da etichettare è ricunnosce cù mudelli di visione persunalizati integrati.

I mudelli sò integrati in una sola pipeline, chì permette à qualcunu di utilizà u serviziu senza alcuna cunniscenza di l'apprendimentu automaticu. I risultati sò dispunibuli attraversu un portale Video Indexer senza codice o via una API REST per una integrazione rapida in e vostre propiu applicazioni.

Avemu custruitu questi mudelli per travaglià cù caratteri animati cù certi cunsumatori chì furnianu un cuntenutu animatu veru per a furmazione è a prova. U valore di a nova funziunalità hè stata ben riassunta da Andy Gutteridge, direttore senior di tecnulugia di studio è post-produzione in Viacom International Media Networks, chì era unu di i fornitori di dati: "L'aghjunzione di una robusta scuperta di cuntenutu animatu alimentatu da AI permetterà. noi per truvà rapidamente è in modu efficiente i metadati di caratteri da u nostru cuntenutu di a biblioteca.

U più impurtante, darà à i nostri squadre creativi a capacità di truvà istantaneamente u cuntenutu chì anu bisognu, minimizendu u tempu passatu à gestisce i media è permettenu di fucalizza nantu à a creatività ".

Pudete principià à cunnosce u ricunniscenza di caratteri animati cù pagine di documentazione.

Identificazione è trascrizzione di cuntenutu in parechje lingue

Certi risorse media, cum'è nutizie, cronache è interviste, cuntenenu registrazioni di persone chì parlanu lingue diverse. A maiò parte di e capacità esistenti di discorsu à testu necessitanu chì a lingua di ricunniscenza audio sia specificata in anticipu, rendendu difficiule di trascrive video multilingue.

A nostra nova funzione d'identificazione automatica di a lingua parlata per vari tipi di cuntenutu usa a tecnulugia di apprendimentu automaticu per identificà e lingue truvate in l'assi media. Una volta rilevatu, ogni segmentu di lingua passa automaticamente per un prucessu di trascrizzione in a lingua apprupriata, è dopu tutti i segmenti sò cumminati in un unicu schedariu di trascrizzione multilingua.

A trascrizione risultante hè dispunibule cum'è parte di l'output JSON di u Video Indexer è cum'è schedarii di subtitulos. A trascrizione di output hè ancu integrata cù Azure Search, chì vi permette di circà immediatamente diversi segmenti di lingua in i vostri video. Inoltre, a trascrizione multilingue hè dispunibule quandu travagliate cù u portale Video Indexer, cusì pudete vede a trascrizione è a lingua identificata cù u tempu, o saltà à lochi specifichi in u video per ogni lingua è vede a trascrizione multilingue cum'è didascalia cum'è u video ghjucatu. Pudete ancu traduce u testu ricevutu in qualsiasi di e 54 lingue dispunibili attraversu u portale è l'API.

Sapete più nantu à a nova funzione di ricunniscenza di cuntenutu multilingue è cumu si usa in Video Indexer leghje a documentazione.

Modelli supplementari aghjurnati è migliurati

Avemu ancu aghjunghje novi mudelli à Video Indexer è migliurà quelli esistenti, cumpresi quelli descritti quì sottu.

Estrazione di entità assuciate cù persone è lochi

Avemu allargatu e nostre capacità di scuperta di marca esistenti per include nomi è locu famosi, cum'è a Torre Eiffel in Parigi è u Big Ben in Londra. Quandu si prisentanu in a trascrizione generata o nantu à u screnu utilizendu ricunniscenza otticu di caratteri (OCR), l'infurmazioni pertinenti sò aghjuntu. Cù sta nova funzione, pudete cercà tutte e persone, i lochi è i marchi chì apparsu in un video è vede i dettagli nantu à elli, cumprese slot di tempu, descrizioni è ligami à u mutore di ricerca Bing per più infurmazione.

Mudellu di rilevazione di frames per editore

Questa nova funzione aghjusta un inseme di "tags" à i metadati attaccati à i frames individuali in i dettagli JSON per rapprisintà u so tipu editoriale (per esempiu, largu, medium shot, close-up, estremu close-up, dui colpi, parechje persone. , fora, interni, etc.). Queste caratteristiche di tippu di tippu sò utili à l'edità di video per clips è trailers, o quandu cercate un stile di scattu specificu per scopi artistici.

Sapè ne di più Rilevazione di tippu di frame in Video Indexer.

Granularità di mapping IPTC rinfurzata

U nostru mudellu di rilevazione di u tema determina u tema di un video basatu nantu à a trascrizione, u ricunniscenza otticu di caratteri (OCR) è i celebrità rilevati, ancu s'ellu ùn hè micca specificatu esplicitamente u tema. Mapemu questi temi rilevati à quattru aree di classificazione: Wikipedia, Bing, IPTC è IAB. Questa rinfurzà ci permette di includà a classificazione IPTC di u sicondu livellu.
Apprufittannu di sti migliuramentu hè cusì faciule cum'è re-indexing a vostra biblioteca attuale Video Indexer.

Nova funziunalità di streaming live

In l'anteprima di Azure Media Services, offremu ancu duie funzioni novi per u streaming live.

A trascrizione in tempu reale alimentata da AI porta u live streaming à u prossimu livellu

Utilizendu Azure Media Services per u live streaming, pudete avà riceve un flussu di output chì include una traccia di testu generata automaticamente in più di u cuntenutu audio è video. U testu hè creatu aduprendu a trascrizzione audio in tempu reale basatu annantu à l'intelligenza artificiale. I tecnichi persunalizati sò applicati prima è dopu a cunversione di voce à testu per migliurà i risultati. A traccia di testu hè imballata in IMSC1, TTML o WebVTT, secondu s'ellu hè furnitu in DASH, HLS CMAF o HLS TS.

Codificazione di linea in tempu reale per i canali OTT 24/7

Utilizendu e nostre API v3, pudete creà, gestisce è trasmette canali OTT (over-the-top), è aduprà tutte l'altri funziunalità di Azure Media Services cum'è video live on demand (VOD, video on demand), imballaggio è gestione di diritti digitali ( DRM, gestione di diritti digitali).
Per vede versioni in anteprima di sti funziunalità, visitate A cumunità di Azure Media Services.

Nuvelle capacità di generazione di pacchetti

Supportu per i brani di descrizzione audio

U cuntenutu broadcast over broadcast channels spessu hà una pista audio cù spiegazioni verbali di ciò chì succede nantu à u screnu in più di u signale audio regular. Questu rende i prugrammi più accessibili per i visori visualmente, soprattuttu se u cuntenutu hè principalmente visuale. Novu funzione di descrizzione audio permette di annotà una di e piste audio cum'è una traccia di discrizzione audio (AD, descrizione audio), chì permette à i ghjucatori di rende a traccia AD dispunibule per i televidenti.

Inserzione di metadati ID3

Per signalà l'inserimentu di publicità o eventi di metadati persunalizati à u lettore di u cliente, i broadcasters spessu usanu metadati cronometrati incrustati in u video. In più di i modi di signalazione SCTE-35, avemu avà ancu supportu ID3v2 è altri schemi persunalizati, definitu da u sviluppatore di l'applicazione per l'usu di l'applicazione cliente.

I partenarii di Microsoft Azure dimostranu soluzioni end-to-end

Bitmovin presenta Bitmovin Video Encoding è Bitmovin Video Player per Microsoft Azure. I clienti ponu avà sfruttà queste soluzioni di codificazione è playout in Azure è prufittà di funzioni avanzate cum'è codificazione in trè fasi, supportu di codec AV1/VC, sottotitoli multilingue è analisi video pre-integrate per QoS, publicità è seguimentu di video.

Evergent dimostra a so Piattaforma di Gestione di u Ciclu di Vita di l'Usuariu in Azure. Cum'è un fornitore principale di soluzioni di gestione di u ciclu di vita di i rivenuti è di i clienti, Evergent usa Azure AI per aiutà i fornitori di divertimentu premium à migliurà l'acquisizione è a retenzioni di i clienti creendu pacchetti di servizii è offerte mirati in punti critichi in u ciclu di vita di i clienti.

Haivision mostrarà u so serviziu di routing di media intelligente basatu in nuvola, SRT Hub, chì aiuta i clienti à trasfurmà i flussi di travagliu end-to-end usendu Azure Data Box Edge è trasfurmà i flussi di travagliu cù Hublets da Avid, Telestream, Wowza, Cinegy è Make.tv.

SES hà sviluppatu una suite di servizii di media di qualità broadcast nantu à a piattaforma Azure per i so clienti di servizii di media satellitari è gestiti. SES dimostrarà suluzioni per i servizii di playout gestiti cumplettamente, cumprese playout master, playout localizatu, scuperta di publicità è rimpiazzamentu, è codificazione multicanale in tempu reale 24x7 di alta qualità in Azure.

SyncWords rende dispunibili strumenti di nuvola convenienti è tecnulugia di automatizazione di firma in Azure. Queste offerte renderanu più faciule per l'urganisazioni media per aghjunghje automaticamente sottotitoli, cumpresi sottotitoli in lingua straniera, à i so flussi di travagliu video live è offline in Azure.
cumpagnia internaziunale Tata Elxsi, una cumpagnia di servizii di tecnulugia, hà integratu a so plataforma OTT SaaS TEPlay in Azure Media Services per furnisce u cuntenutu OTT da u nuvulu. Tata Elxsi hà ancu purtatu a so soluzione di monitoraghju di qualità di l'esperienza (QoE) Falcon Eye à Microsoft Azure, furnisce analitiche è metriche per a decisione.

Verizon Media rende a so piattaforma di streaming dispunibule nantu à Azure cum'è versione beta. Verizon Media Platform hè una soluzione OTT gestita di qualità di l'impresa chì include DRM, inserimentu di publicità, sessioni persunalizate unu à unu, rimpiazzamentu dinamicu di cuntenutu è consegna video. L'integrazione simplifica i flussi di travagliu, u supportu globale è scala, è sblocca alcune di e capacità uniche truvate in Azure.

Source: www.habr.com

12 Novi servizii Azure Media cù AI