12 Perkhidmatan Media Azure baharu dengan kecerdasan buatan

Misi Microsoft adalah untuk memperkasakan setiap orang dan organisasi di planet ini untuk mencapai lebih banyak lagi. Industri media adalah contoh yang baik untuk menjadikan misi ini satu realiti. Kita hidup dalam era di mana lebih banyak kandungan sedang dibuat dan digunakan, dalam lebih banyak cara dan pada lebih banyak peranti. Di IBC 2019, kami berkongsi inovasi terkini yang sedang kami usahakan dan cara ia boleh membantu mengubah pengalaman media anda.
12 Perkhidmatan Media Azure baharu dengan kecerdasan buatan
Butiran di bawah potongan!

Halaman ini dihidupkan laman web kami.

Video Indexer kini menyokong animasi dan kandungan berbilang bahasa

Tahun lepas di IBC kami telah memenangi anugerah kami Pengindeks Video Perkhidmatan Media Azure, dan tahun ini ia menjadi lebih baik. Pengindeks Video secara automatik mengekstrak maklumat dan metadata daripada fail media, seperti perkataan yang dituturkan, wajah, emosi, topik dan jenama, dan anda tidak perlu menjadi pakar pembelajaran mesin untuk menggunakannya.

Tawaran terbaru kami termasuk pratonton dua ciri yang sangat dicari dan dibezakanβ€”pengecaman aksara animasi dan transkripsi pertuturan berbilang bahasaβ€”serta beberapa tambahan kepada model sedia ada yang tersedia hari ini dalam Pengindeks Video.

Pengecaman Watak Animasi

12 Perkhidmatan Media Azure baharu dengan kecerdasan buatan
Kandungan animasi ialah salah satu jenis kandungan yang paling popular, tetapi model penglihatan komputer standard yang direka untuk mengecam wajah manusia tidak berfungsi dengan baik, terutamanya jika kandungan mengandungi aksara tanpa ciri wajah manusia. Versi pratonton baharu menggabungkan Pengindeks Video dengan perkhidmatan Azure Custom Vision Microsoft, memberikan satu set model baharu yang secara automatik mengesan dan mengumpulkan watak animasi dan menjadikannya mudah dilabel dan dikenali menggunakan model penglihatan tersuai bersepadu.

Model-model tersebut disepadukan ke dalam satu saluran paip, membolehkan sesiapa sahaja menggunakan perkhidmatan tersebut tanpa sebarang pengetahuan pembelajaran mesin. Keputusan tersedia melalui portal Pengindeks Video tanpa kod atau melalui API REST untuk penyepaduan pantas ke dalam aplikasi anda sendiri.

Kami membina model ini untuk berfungsi dengan watak animasi bersama-sama dengan beberapa pengguna yang menyediakan kandungan animasi sebenar untuk latihan dan ujian. Nilai fungsi baharu itu dirumuskan dengan baik oleh Andy Gutteridge, pengarah kanan teknologi studio dan pasca produksi di Viacom International Media Networks, yang merupakan salah satu penyedia data: β€œPenambahan penemuan kandungan animasi bertenaga AI yang mantap akan membolehkan kami dengan cepat dan cekap mencari dan mengkatalog metadata aksara daripada kandungan perpustakaan kami.

Paling penting, ia akan memberikan pasukan kreatif kami keupayaan untuk mencari kandungan yang mereka perlukan serta-merta, meminimumkan masa yang dihabiskan untuk mengurus media dan membolehkan mereka menumpukan pada kreativiti.”

Anda boleh mula berkenalan dengan pengecaman watak animasi dengan halaman dokumentasi.

Pengenalpastian dan transkripsi kandungan dalam pelbagai bahasa

Beberapa sumber media, seperti berita, kronik dan wawancara, mengandungi rakaman orang yang bercakap bahasa yang berbeza. Kebanyakan keupayaan pertuturan-ke-teks sedia ada memerlukan bahasa pengecaman audio ditentukan terlebih dahulu, menjadikannya sukar untuk menyalin video berbilang bahasa.

Ciri Pengenalan Bahasa Pertuturan Automatik kami yang baharu untuk pelbagai jenis kandungan menggunakan teknologi pembelajaran mesin untuk mengenal pasti bahasa yang terdapat dalam aset media. Setelah dikesan, setiap segmen bahasa secara automatik melalui proses transkripsi dalam bahasa yang sesuai, dan kemudian semua segmen digabungkan menjadi satu fail transkripsi berbilang bahasa.

12 Perkhidmatan Media Azure baharu dengan kecerdasan buatan

Transkrip yang dihasilkan tersedia sebagai sebahagian daripada output JSON Pengindeks Video dan sebagai fail sari kata. Transkrip output juga disepadukan dengan Carian Azure, membolehkan anda mencari dengan segera segmen bahasa yang berbeza dalam video anda. Selain itu, transkripsi berbilang bahasa tersedia apabila bekerja dengan portal Pengindeks Video, jadi anda boleh melihat transkrip dan bahasa yang dikenal pasti dari semasa ke semasa, atau melompat ke tempat tertentu dalam video untuk setiap bahasa dan melihat transkripsi berbilang bahasa sebagai kapsyen semasa video dimainkan. Anda juga boleh menterjemah teks yang diterima ke dalam mana-mana 54 bahasa yang tersedia melalui portal dan API.

Ketahui lebih lanjut tentang ciri pengecaman kandungan berbilang bahasa baharu dan cara ia digunakan dalam Pengindeks Video baca dokumentasi.

Model tambahan yang dikemas kini dan dipertingkatkan

Kami juga menambah model baharu pada Pengindeks Video dan menambah baik model sedia ada, termasuk yang diterangkan di bawah.

Mengekstrak entiti yang dikaitkan dengan orang dan tempat

Kami telah mengembangkan keupayaan penemuan jenama sedia ada kami untuk memasukkan nama dan lokasi yang terkenal, seperti Menara Eiffel di Paris dan Big Ben di London. Apabila ia muncul dalam transkrip yang dijana atau pada skrin menggunakan pengecaman aksara optik (OCR), maklumat yang berkaitan ditambah. Dengan ciri baharu ini, anda boleh mencari semua orang, tempat dan jenama yang muncul dalam video dan melihat butiran tentang mereka, termasuk slot masa, penerangan dan pautan ke enjin carian Bing untuk mendapatkan maklumat lanjut.

12 Perkhidmatan Media Azure baharu dengan kecerdasan buatan

Model pengesanan bingkai untuk editor

Ciri baharu ini menambahkan satu set "teg" pada metadata yang dilampirkan pada bingkai individu dalam butiran JSON untuk mewakili jenis editorialnya (contohnya, tangkapan lebar, tangkapan sederhana, dekat, dekat melampau, dua tangkapan, berbilang orang , luar, dalam, dsb.). Ciri jenis tangkapan ini berguna apabila mengedit video untuk klip dan treler, atau apabila mencari gaya tangkapan tertentu untuk tujuan artistik.

12 Perkhidmatan Media Azure baharu dengan kecerdasan buatan
Ketahui lebih lanjut Pengesanan jenis bingkai dalam Pengindeks Video.

Kebutiran pemetaan IPTC yang dipertingkatkan

Model pengesanan topik kami menentukan topik video berdasarkan transkripsi, pengecaman aksara optik (OCR) dan selebriti yang dikesan, walaupun topik itu tidak dinyatakan secara eksplisit. Kami memetakan topik yang dikesan ini kepada empat bidang pengelasan: Wikipedia, Bing, IPTC dan IAB. Peningkatan ini membolehkan kami memasukkan klasifikasi IPTC peringkat kedua.
Mengambil kesempatan daripada peningkatan ini semudah mengindeks semula pustaka Pengindeks Video semasa anda.

Fungsi penstriman langsung baharu

Dalam pratonton Azure Media Services, kami turut menawarkan dua ciri baharu untuk penstriman langsung.

Transkripsi masa nyata berkuasa AI membawa penstriman langsung ke tahap seterusnya

Menggunakan Perkhidmatan Media Azure untuk penstriman langsung, anda kini boleh menerima strim output yang termasuk trek teks yang dijana secara automatik sebagai tambahan kepada kandungan audio dan video. Teks dibuat menggunakan transkripsi audio masa nyata berdasarkan kecerdasan buatan. Teknik tersuai digunakan sebelum dan selepas penukaran pertuturan ke teks untuk meningkatkan hasil. Trek teks dibungkus dalam IMSC1, TTML atau WebVTT, bergantung pada sama ada ia dibekalkan dalam DASH, HLS CMAF atau HLS TS.

Pengekodan talian masa nyata untuk saluran OTT 24/7

Menggunakan API v3 kami, anda boleh mencipta, mengurus dan menyiarkan saluran OTT (over-the-top) dan menggunakan semua ciri Perkhidmatan Media Azure yang lain seperti video atas permintaan secara langsung (VOD, video atas permintaan), pembungkusan dan pengurusan hak digital ( DRM, pengurusan hak digital).
Untuk melihat versi pratonton ciri ini, lawati Komuniti Azure Media Services.

12 Perkhidmatan Media Azure baharu dengan kecerdasan buatan

Keupayaan penjanaan pakej baharu

Sokongan untuk trek penerangan audio

Kandungan yang disiarkan melalui saluran penyiaran selalunya mempunyai trek audio dengan penjelasan lisan tentang perkara yang berlaku pada skrin sebagai tambahan kepada isyarat audio biasa. Ini menjadikan program lebih mudah diakses oleh penonton cacat penglihatan, terutamanya jika kandungannya adalah visual. Baru fungsi penerangan audio membolehkan anda menganotasi salah satu trek audio sebagai trek penerangan audio (AD, perihalan audio), membolehkan pemain menjadikan trek AD tersedia kepada penonton.

Memasukkan metadata ID3

Untuk menandakan pemasukan iklan atau acara metadata tersuai kepada pemain pelanggan, penyiar sering menggunakan metadata bermasa yang dibenamkan dalam video. Sebagai tambahan kepada mod isyarat SCTE-35, kami kini turut menyokong ID3v2 dan skim tersuai lain, ditakrifkan oleh pembangun aplikasi untuk digunakan oleh aplikasi klien.

Rakan kongsi Microsoft Azure menunjukkan penyelesaian hujung ke hujung

Bitmovin memperkenalkan Pengekodan Video Bitmovin dan Pemain Video Bitmovin untuk Microsoft Azure. Pelanggan kini boleh memanfaatkan penyelesaian pengekodan dan main keluar ini dalam Azure dan mendapat manfaat daripada ciri lanjutan seperti pengekodan tiga peringkat, sokongan codec AV1/VC, sari kata berbilang bahasa dan analitik video prasepadu untuk QoS, pengiklanan dan penjejakan video.

Evergent menunjukkan Platform Pengurusan Kitaran Hayat Penggunanya pada Azure. Sebagai penyedia penyelesaian pengurusan hasil dan kitaran hayat pelanggan yang terkemuka, Evergent menggunakan Azure AI untuk membantu penyedia hiburan premium meningkatkan pemerolehan dan pengekalan pelanggan dengan mencipta pakej perkhidmatan dan tawaran yang disasarkan pada titik kritikal dalam kitaran hayat pelanggan.

Havision akan mempamerkan perkhidmatan penghalaan media berasaskan awan pintarnya, SRT Hub, yang membantu pelanggan mengubah aliran kerja hujung ke hujung menggunakan Tepi Kotak Data Azure dan mengubah aliran kerja dengan Hublets daripada Avid, Telestream, Wowza, Cinegy dan Make.tv.

SES telah membangunkan satu set perkhidmatan media gred penyiaran pada platform Azure untuk satelit dan pelanggan perkhidmatan media terurusnya. SES akan menunjukkan penyelesaian untuk perkhidmatan main terurus sepenuhnya, termasuk main main, main setempat, penemuan dan penggantian iklan serta pengekodan berbilang saluran masa nyata 24x7 berkualiti tinggi pada Azure.

SyncWords menjadikan alatan awan yang mudah dan teknologi automasi tandatangan tersedia pada Azure. Tawaran ini akan memudahkan organisasi media menambah sari kata secara automatik, termasuk sari kata bahasa asing, pada aliran kerja video langsung dan luar talian mereka di Azure.
syarikat antarabangsa Tata Elxsi, sebuah syarikat perkhidmatan teknologi, telah menyepadukan platform OTT SaaS TEPlaynya ke dalam Azure Media Services untuk menyampaikan kandungan OTT daripada awan. Tata Elxsi juga telah membawa penyelesaian pemantauan kualiti pengalaman (QoE) Falcon Eye kepada Microsoft Azure, menyediakan analitik dan metrik untuk membuat keputusan.

Verizon Media sedang membuat platform penstrimannya tersedia di Azure sebagai keluaran beta. Verizon Media Platform ialah penyelesaian OTT terurus gred perusahaan yang merangkumi DRM, sisipan iklan, sesi diperibadikan satu sama satu, penggantian kandungan dinamik dan penghantaran video. Penyepaduan ini memudahkan aliran kerja, sokongan dan skala global serta membuka kunci beberapa keupayaan unik yang terdapat dalam Azure.

Sumber: www.habr.com

Tambah komen