A missione di Microsoft hè di empower ogni persona è urganizazione in u pianeta per ottene più. L'industria di i media hè un grande esempiu di fà sta missione una realità. Vivemu in una era induve più cuntenutu hè creatu è cunsumatu, in più manere è in più dispusitivi. À l'IBC 2019, avemu spartutu l'ultime innovazioni chì avemu travagliatu è cumu ponu aiutà à trasfurmà a vostra sperienza media.
Dettagli sottu u cut!
Sta pagina hè nantu
Video Indexer supporta avà animazione è cuntenutu multilingue
L'annu passatu à IBC avemu fattu u nostru premiatu
E nostre ultime offerte includenu anteprima di duie funzioni assai ricercate è differenziate - ricunniscenza di caratteri animati è trascrizzione di parlà multilingue - è ancu parechje aghjunte à i mudelli esistenti dispunibili oghje in Video Indexer.
Ricunniscenza di caratteri animati
U cuntenutu animatu hè unu di i tipi di cuntenutu più populari, ma i mudelli di visione di l'informatica standard cuncepiti per ricunnosce e facce umane ùn funzionanu micca bè cun ellu, soprattuttu se u cuntenutu cuntene caratteri senza caratteristiche faciale umane. A nova versione di anteprima combina Video Indexer cù u serviziu Azure Custom Vision di Microsoft, offrendu un novu set di mudelli chì rilevanu automaticamente è raggruppanu caratteri animati è facenu facili da etichettare è ricunnosce cù mudelli di visione persunalizati integrati.
I mudelli sò integrati in una sola pipeline, chì permette à qualcunu di utilizà u serviziu senza alcuna cunniscenza di l'apprendimentu automaticu. I risultati sò dispunibuli attraversu un portale Video Indexer senza codice o via una API REST per una integrazione rapida in e vostre propiu applicazioni.
Avemu custruitu questi mudelli per travaglià cù caratteri animati cù certi cunsumatori chì furnianu un cuntenutu animatu veru per a furmazione è a prova. U valore di a nova funziunalità hè stata ben riassunta da Andy Gutteridge, direttore senior di tecnulugia di studio è post-produzione in Viacom International Media Networks, chì era unu di i fornitori di dati: "L'aghjunzione di una robusta scuperta di cuntenutu animatu alimentatu da AI permetterà. noi per truvà rapidamente è in modu efficiente i metadati di caratteri da u nostru cuntenutu di a biblioteca.
U più impurtante, darà à i nostri squadre creativi a capacità di truvà istantaneamente u cuntenutu chì anu bisognu, minimizendu u tempu passatu à gestisce i media è permettenu di fucalizza nantu à a creatività ".
Pudete principià à cunnosce u ricunniscenza di caratteri animati cù
Identificazione è trascrizzione di cuntenutu in parechje lingue
Certi risorse media, cum'è nutizie, cronache è interviste, cuntenenu registrazioni di persone chì parlanu lingue diverse. A maiò parte di e capacità esistenti di discorsu à testu necessitanu chì a lingua di ricunniscenza audio sia specificata in anticipu, rendendu difficiule di trascrive video multilingue.
A nostra nova funzione d'identificazione automatica di a lingua parlata per vari tipi di cuntenutu usa a tecnulugia di apprendimentu automaticu per identificà e lingue truvate in l'assi media. Una volta rilevatu, ogni segmentu di lingua passa automaticamente per un prucessu di trascrizzione in a lingua apprupriata, è dopu tutti i segmenti sò cumminati in un unicu schedariu di trascrizzione multilingua.
A trascrizione risultante hè dispunibule cum'è parte di l'output JSON di u Video Indexer è cum'è schedarii di subtitulos. A trascrizione di output hè ancu integrata cù Azure Search, chì vi permette di circà immediatamente diversi segmenti di lingua in i vostri video. Inoltre, a trascrizione multilingue hè dispunibule quandu travagliate cù u portale Video Indexer, cusì pudete vede a trascrizione è a lingua identificata cù u tempu, o saltà à lochi specifichi in u video per ogni lingua è vede a trascrizione multilingue cum'è didascalia cum'è u video ghjucatu. Pudete ancu traduce u testu ricevutu in qualsiasi di e 54 lingue dispunibili attraversu u portale è l'API.
Sapete più nantu à a nova funzione di ricunniscenza di cuntenutu multilingue è cumu si usa in Video Indexer
Modelli supplementari aghjurnati è migliurati
Avemu ancu aghjunghje novi mudelli à Video Indexer è migliurà quelli esistenti, cumpresi quelli descritti quì sottu.
Estrazione di entità assuciate cù persone è lochi
Avemu allargatu e nostre capacità di scuperta di marca esistenti per include nomi è locu famosi, cum'è a Torre Eiffel in Parigi è u Big Ben in Londra. Quandu si prisentanu in a trascrizione generata o nantu à u screnu utilizendu ricunniscenza otticu di caratteri (OCR), l'infurmazioni pertinenti sò aghjuntu. Cù sta nova funzione, pudete cercà tutte e persone, i lochi è i marchi chì apparsu in un video è vede i dettagli nantu à elli, cumprese slot di tempu, descrizioni è ligami à u mutore di ricerca Bing per più infurmazione.
Mudellu di rilevazione di frames per editore
Questa nova funzione aghjusta un inseme di "tags" à i metadati attaccati à i frames individuali in i dettagli JSON per rapprisintà u so tipu editoriale (per esempiu, largu, medium shot, close-up, estremu close-up, dui colpi, parechje persone. , fora, interni, etc.). Queste caratteristiche di tippu di tippu sò utili à l'edità di video per clips è trailers, o quandu cercate un stile di scattu specificu per scopi artistici.
Granularità di mapping IPTC rinfurzata
U nostru mudellu di rilevazione di u tema determina u tema di un video basatu nantu à a trascrizione, u ricunniscenza otticu di caratteri (OCR) è i celebrità rilevati, ancu s'ellu ùn hè micca specificatu esplicitamente u tema. Mapemu questi temi rilevati à quattru aree di classificazione: Wikipedia, Bing, IPTC è IAB. Questa rinfurzà ci permette di includà a classificazione IPTC di u sicondu livellu.
Apprufittannu di sti migliuramentu hè cusì faciule cum'è re-indexing a vostra biblioteca attuale Video Indexer.
Nova funziunalità di streaming live
In l'anteprima di Azure Media Services, offremu ancu duie funzioni novi per u streaming live.
A trascrizione in tempu reale alimentata da AI porta u live streaming à u prossimu livellu
Utilizendu Azure Media Services per u live streaming, pudete avà riceve un flussu di output chì include una traccia di testu generata automaticamente in più di u cuntenutu audio è video. U testu hè creatu aduprendu a trascrizzione audio in tempu reale basatu annantu à l'intelligenza artificiale. I tecnichi persunalizati sò applicati prima è dopu a cunversione di voce à testu per migliurà i risultati. A traccia di testu hè imballata in IMSC1, TTML o WebVTT, secondu s'ellu hè furnitu in DASH, HLS CMAF o HLS TS.
Codificazione di linea in tempu reale per i canali OTT 24/7
Utilizendu e nostre API v3, pudete creà, gestisce è trasmette canali OTT (over-the-top), è aduprà tutte l'altri funziunalità di Azure Media Services cum'è video live on demand (VOD, video on demand), imballaggio è gestione di diritti digitali ( DRM, gestione di diritti digitali).
Per vede versioni in anteprima di sti funziunalità, visitate
Nuvelle capacità di generazione di pacchetti
Supportu per i brani di descrizzione audio
U cuntenutu broadcast over broadcast channels spessu hà una pista audio cù spiegazioni verbali di ciò chì succede nantu à u screnu in più di u signale audio regular. Questu rende i prugrammi più accessibili per i visori visualmente, soprattuttu se u cuntenutu hè principalmente visuale. Novu
Inserzione di metadati ID3
Per signalà l'inserimentu di publicità o eventi di metadati persunalizati à u lettore di u cliente, i broadcasters spessu usanu metadati cronometrati incrustati in u video. In più di i modi di signalazione SCTE-35, avemu avà ancu supportu
I partenarii di Microsoft Azure dimostranu soluzioni end-to-end
cumpagnia internaziunale
Source: www.habr.com