Misi Microsoft yaiku kanggo nguatake saben wong lan organisasi ing planet iki kanggo entuk luwih akeh. Industri media minangka conto sing apik kanggo nggawe misi iki dadi kasunyatan. Kita manggon ing jaman sing luwih akeh konten digawe lan dikonsumsi, kanthi cara sing luwih akeh lan ing piranti liyane. Ing IBC 2019, kita nuduhake inovasi paling anyar sing lagi ditindakake lan kepiye carane bisa mbantu ngowahi pengalaman media sampeyan.
Rincian ing ngisor potong!
Kaca iki aktif
Video Indexer saiki ndhukung animasi lan konten multibasa
Taun kepungkur ing IBC, kita entuk penghargaan
Penawaran paling anyar kalebu pratinjau saka rong fitur sing digoleki lan dibedakake - pangenalan karakter animasi lan transkripsi wicara multibasa - uga sawetara tambahan kanggo model sing ana saiki kasedhiya ing Video Indexer.
Pangenalan Karakter Animasi
Konten animasi minangka salah sawijining jinis konten sing paling populer, nanging model visi komputer standar sing dirancang kanggo ngenali pasuryan manungsa ora bisa digunakake, utamane yen konten kasebut ngemot karakter tanpa fitur rai manungsa. Versi pratinjau anyar nggabungake Video Indexer karo layanan Microsoft Azure Custom Vision, ngirimake model anyar sing kanthi otomatis ndeteksi lan ngelompokake karakter animasi lan nggawe label lan ngenali kanthi gampang nggunakake model visi khusus terpadu.
Model kasebut digabungake dadi pipa tunggal, ngidini sapa wae nggunakake layanan kasebut tanpa kawruh babagan mesin sinau. Asil kasedhiya liwat portal Video Indexer tanpa kode utawa liwat REST API kanggo integrasi cepet menyang aplikasi sampeyan dhewe.
Kita mbangun model iki kanggo nggarap karakter animasi bebarengan karo sawetara konsumen sing nyedhiyakake konten animasi nyata kanggo latihan lan tes. Nilai fungsi anyar kasebut disimpulake kanthi apik dening Andy Gutteridge, direktur senior teknologi studio lan pasca produksi ing Viacom International Media Networks, sing dadi salah sawijining panyedhiya data: "Tambahan panemuan konten animasi sing kuat AI bakal ngidini kita kanthi cepet lan efisien nemokake lan katalog metadata karakter saka isi perpustakaan kita.
Sing paling penting, iki bakal menehi tim kreatif kita kanthi cepet nemokake konten sing dibutuhake, nyilikake wektu kanggo ngatur media lan ngidini dheweke fokus ing kreatifitas.
Sampeyan bisa miwiti njaluk kenalan karo pangenalan karakter animasi karo
Identifikasi lan transkripsi isi ing pirang-pirang basa
Sawetara sumber media, kayata warta, babad lan wawancara, ngemot rekaman wong sing nganggo basa sing beda-beda. Umume kapabilitas wicara-kanggo-teks sing ana mbutuhake basa pangenalan audio kasebut sadurunge, dadi angel kanggo nerjemahake video multibasa.
Fitur Identifikasi Basa Lisan Otomatis anyar kanggo macem-macem jinis konten nggunakake teknologi pembelajaran mesin kanggo ngenali basa sing ditemokake ing aset media. Sawise dideteksi, saben bagean basa kanthi otomatis ngliwati proses transkripsi ing basa sing cocog, banjur kabeh bagean digabung dadi file transkripsi multi-basa.
Transkrip asil kasedhiya minangka bagΓ©an saka output JSON saka Video Indexer lan minangka file subtitle. Transkrip output uga digabungake karo Azure Search, ngidini sampeyan langsung nelusuri segmen basa sing beda ing video sampeyan. Kajaba iku, transkripsi multibasa kasedhiya nalika nggarap portal Video Indexer, supaya sampeyan bisa ndeleng transkrip lan basa sing diidentifikasi liwat wektu, utawa mlumpat menyang panggonan tartamtu ing video kanggo saben basa lan ndeleng transkripsi multibasa minangka katrangan nalika video diputer. Sampeyan uga bisa nerjemahake teks sing ditampa menyang salah siji saka 54 basa sing kasedhiya liwat portal lan API.
Sinau luwih lengkap babagan fitur pangenalan konten multibasa anyar lan cara digunakake ing Video Indexer
Model tambahan sing dianyari lan apik
Kita uga nambah model anyar menyang Video Indexer lan nambah model sing wis ana, kalebu sing diterangake ing ngisor iki.
Ekstrak entitas sing ana gandhengane karo wong lan papan
Kita wis nggedhekake kapabilitas panemuan merek sing wis ana kanggo nyakup jeneng lan lokasi sing kondhang, kayata Menara Eiffel ing Paris lan Big Ben ing London. Nalika katon ing transkrip sing digawe utawa ing layar nggunakake pangenalan karakter optik (OCR), informasi sing cocog ditambahake. Kanthi fitur anyar iki, sampeyan bisa nggoleki kabeh wong, panggonan, lan merek sing muncul ing video lan ndeleng rincian babagan, kalebu slot wektu, deskripsi, lan pranala menyang mesin telusur Bing kanggo informasi luwih lengkap.
Model deteksi bingkai kanggo editor
Fitur anyar iki nambahake sakumpulan "tag" menyang metadata sing dipasang ing pigura individu ing rincian JSON kanggo makili jinis editorial (contone, shot lebar, shot medium, close-up, close-up ekstrem, rong gambar, akeh wong. , njaba, njero, lsp). Karakteristik jinis tembakan iki migunani nalika nyunting video kanggo klip lan trailer, utawa nalika nggoleki gaya tembakan khusus kanggo tujuan seni.
Enhanced IPTC pemetaan granularity
Model deteksi topik kita nemtokake topik video adhedhasar transkripsi, pangenalan karakter optik (OCR), lan selebriti sing dideteksi, sanajan topik kasebut ora ditemtokake kanthi jelas. We peta topik sing dideteksi iki menyang papat wilayah klasifikasi: Wikipedia, Bing, IPTC, lan IAB. Peningkatan iki ngidini kita nyakup klasifikasi IPTC tingkat kapindho.
Njupuk kauntungan saka dandan iki gampang kaya ngindeks maneh perpustakaan Video Indexer saiki.
Fungsi live streaming anyar
Ing pratinjau Azure Media Services, kita uga nawakake rong fitur anyar kanggo streaming langsung.
Transkripsi wektu nyata sing didhukung AI njupuk streaming langsung menyang level sabanjure
Nggunakake Azure Media Services kanggo live streaming, saiki sampeyan bisa nampa stream output sing kalebu trek teks sing digawe kanthi otomatis saliyane konten audio lan video. Teks kasebut digawe nggunakake transkripsi audio wektu nyata adhedhasar intelijen buatan. Teknik khusus ditrapake sadurunge lan sawise konversi wicara-kanggo-teks kanggo nambah asil. Trek teks wis rangkep ing IMSC1, TTML utawa WebVTT, gumantung apa iku diwenehake ing DASH, HLS CMAF utawa HLS TS.
Encoding baris wektu nyata kanggo saluran OTT 24/7
Nggunakake API v3, sampeyan bisa nggawe, ngatur lan nyiarake saluran OTT (over-the-top), lan nggunakake kabeh fitur Layanan Media Azure liyane kayata video live on demand (VOD, video on demand), kemasan lan manajemen hak digital ( DRM, manajemen hak digital).
Kanggo ndeleng versi pratinjau fitur kasebut, bukak
Kapabilitas generasi paket anyar
Dhukungan kanggo trek deskripsi audio
Siaran konten liwat saluran siaran asring duwe trek audio kanthi panjelasan lisan babagan apa sing kedadeyan ing layar saliyane sinyal audio biasa. Iki ndadekake program luwih gampang diakses dening pamirsa sing tunanetra, utamane yen konten utamane visual. Anyar
Nglebokake metadata ID3
Kanggo menehi tandha sisipan iklan utawa acara metadata khusus menyang pamuter klien, penyiar asring nggunakake metadata wektu sing dipasang ing video kasebut. Saliyane mode sinyal SCTE-35, saiki kita uga ndhukung
Mitra Microsoft Azure nduduhake solusi end-to-end
perusahaan internasional
Source: www.habr.com