Microsoftun missiyası planetdəki hər bir insana və təşkilata daha çox nail olmaq üçün səlahiyyət verməkdir. Media sənayesi bu missiyanı reallığa çevirmək üçün gözəl nümunədir. Biz daha çox məzmunun daha çox üsulla və daha çox cihazda yaradıldığı və istehlak edildiyi bir dövrdə yaşayırıq. IBC 2019-da biz üzərində işlədiyimiz ən son yenilikləri və onların media təcrübənizi dəyişməyə necə kömək edə biləcəyini paylaşdıq.
Detallar kəsim altında!
Bu səhifə aktivdir
Video Indexer indi animasiya və çoxdilli məzmunu dəstəkləyir
Keçən il IBC-də biz mükafat qazandıq
Bizim ən son təkliflərimizə iki çox axtarılan və fərqləndirilmiş funksiyaların – animasiya xarakterli personajların tanınması və çoxdilli nitq transkripsiyası – eləcə də bu gün Video Indexer-də mövcud olan mövcud modellərə bir neçə əlavənin ilkin baxışları daxildir.
Animasiya xarakterli tanınması
Animasiya məzmunu ən populyar məzmun növlərindən biridir, lakin insan üzlərini tanımaq üçün nəzərdə tutulmuş standart kompüter görmə modelləri onunla yaxşı işləmir, xüsusən məzmunda insan üz cizgiləri olmayan simvollar varsa. Yeni önizləmə versiyası Video İndeksləyicisini Microsoft-un Azure Xüsusi Vision xidməti ilə birləşdirərək, cizgi personajlarını avtomatik aşkarlayan və qruplaşdıran və inteqrasiya edilmiş fərdi görmə modellərindən istifadə edərək onların etiketlənməsini və tanınmasını asanlaşdıran yeni modellər dəstini təqdim edir.
Modellər tək boru kəmərinə inteqrasiya olunub və hər kəsə maşın öyrənmə biliyi olmadan xidmətdən istifadə etməyə imkan verir. Nəticələr kodsuz Video Indexer portalı və ya öz tətbiqlərinizə sürətli inteqrasiya üçün REST API vasitəsilə əldə edilə bilər.
Biz bu modelləri təlim və sınaq üçün real animasiya məzmunu təqdim edən bəzi istehlakçılarla birlikdə cizgi personajları ilə işləmək üçün yaratdıq. Yeni funksionallığın dəyəri məlumat təminatçılarından biri olan Viacom Beynəlxalq Media Şəbəkələrinin studiya texnologiyaları və post-istehsal üzrə baş direktoru Endi Qutteric tərəfindən yaxşı yekunlaşdırılıb: “Süni intellektlə işləyən güclü cizgi məzmun kəşfinin əlavə edilməsi imkan verəcək. kitabxana məzmunumuzdan xarakter metadatasını tez və səmərəli şəkildə tapmaq və kataloqlaşdırmaq.
Ən əsası odur ki, bu, yaradıcı komandalarımıza lazım olan məzmunu dərhal tapmaq imkanı verəcək, medianın idarə edilməsinə sərf olunan vaxtı minimuma endirəcək və onların diqqətini yaradıcılığa yönəltməyə imkan verəcək”.
ilə cizgi xarakterinin tanınması ilə tanış olmağa başlaya bilərsiniz
Çoxlu dillərdə məzmunun identifikasiyası və transkripsiyası
Xəbərlər, xronikalar və müsahibələr kimi bəzi media resurslarında müxtəlif dillərdə danışan insanların qeydləri var. Mövcud nitqdən mətnə qədər imkanların əksəriyyəti audio tanınma dilinin əvvəlcədən dəqiqləşdirilməsini tələb edir və bu, çoxdilli videoların transkripsiyasını çətinləşdirir.
Müxtəlif məzmun növləri üçün yeni Avtomatik Danışıq Dili İdentifikasiyası funksiyamız media aktivlərində olan dilləri müəyyən etmək üçün maşın öyrənmə texnologiyasından istifadə edir. Aşkar edildikdən sonra hər bir dil seqmenti avtomatik olaraq müvafiq dildə transkripsiya prosesindən keçir və sonra bütün seqmentlər vahid çoxdilli transkripsiya faylında birləşdirilir.
Nəticə transkript Video İndeksatorun JSON çıxışının bir hissəsi və altyazı faylları kimi mövcuddur. Çıxış transkripti həmçinin Azure Axtarış ilə inteqrasiya olunub və bu, videolarınızda dərhal müxtəlif dil seqmentlərini axtarmağa imkan verir. Əlavə olaraq, Video Indexer portalı ilə işləyərkən çoxdilli transkripsiya mövcuddur, beləliklə, siz zamanla transkripsiyaya və müəyyən edilmiş dilə baxa və ya hər bir dil üçün videoda xüsusi yerlərə keçə və video oynadıqca çoxdilli transkripsiyaya başlıqlar kimi baxa bilərsiniz. Siz həmçinin portal və API vasitəsilə alınan mətni 54 mövcud dildən hər hansı birinə tərcümə edə bilərsiniz.
Yeni çoxdilli məzmunun tanınması funksiyası və onun Video İndeksləyicisində necə istifadə edildiyi haqqında ətraflı məlumat əldə edin
Əlavə yenilənmiş və təkmilləşdirilmiş modellər
Biz həmçinin Video Indexer-ə yeni modellər əlavə edirik və aşağıda təsvir olunanlar da daxil olmaqla, mövcud modelləri təkmilləşdiririk.
İnsanlar və yerlərlə əlaqəli obyektlərin çıxarılması
Biz mövcud brend kəşf imkanlarımızı Parisdəki Eyfel qülləsi və Londondakı Big Ben kimi tanınmış adları və yerləri daxil etmək üçün genişləndirdik. Onlar yaradılan transkriptdə və ya optik simvol tanınması (OCR) istifadə edərək ekranda göründükdə, müvafiq məlumat əlavə edilir. Bu yeni funksiya ilə siz videoda görünən bütün insanları, yerləri və brendləri axtara və əlavə məlumat üçün vaxt intervalları, təsvirlər və Bing axtarış sisteminə keçidlər daxil olmaqla, onlar haqqında təfərrüata baxa bilərsiniz.
Redaktor üçün çərçivə aşkarlama modeli
Bu yeni funksiya onların redaksiya növünü (məsələn, geniş kadr, orta çəkiliş, yaxın plan, ekstremal yaxın plan, iki çəkiliş, çoxsaylı insan) təmsil etmək üçün JSON detallarında fərdi çərçivələrə əlavə edilmiş metadata bir sıra "teqlər" əlavə edir. , açıq, qapalı və s.). Bu çəkiliş tipi xüsusiyyətləri kliplər və treylerlər üçün videonu redaktə edərkən və ya bədii məqsədlər üçün xüsusi çəkiliş üslubu axtararkən faydalıdır.
Təkmilləşdirilmiş IPTC xəritəçəkmə qranularlığı
Mövzu aşkarlama modelimiz, hətta mövzu açıq şəkildə göstərilməsə belə, transkripsiya, optik xarakter tanınması (OCR) və aşkar edilmiş məşhurlara əsaslanaraq videonun mövzusunu müəyyən edir. Biz aşkar edilmiş bu mövzuları dörd təsnifat sahəsinə uyğunlaşdırırıq: Wikipedia, Bing, IPTC və IAB. Bu təkmilləşdirmə bizə ikinci səviyyəli IPTC təsnifatını daxil etməyə imkan verir.
Bu təkmilləşdirmələrdən istifadə etmək cari Video İndeksator kitabxananızı yenidən indeksləşdirmək qədər asandır.
Yeni canlı yayım funksiyası
Azure Media Xidmətlərinin önizləməsində biz həmçinin canlı yayım üçün iki yeni funksiya təklif edirik.
Süni intellektlə işləyən real vaxt transkripsiyası canlı yayımı növbəti səviyyəyə aparır
Canlı yayım üçün Azure Media Xidmətlərindən istifadə edərək, indi audio və video məzmuna əlavə olaraq avtomatik yaradılan mətn trekini ehtiva edən çıxış axını qəbul edə bilərsiniz. Mətn süni intellektə əsaslanan real vaxt rejimində audio transkripsiyadan istifadə etməklə yaradılıb. Nəticələri təkmilləşdirmək üçün nitqdən mətnə çevrilmədən əvvəl və sonra xüsusi üsullar tətbiq edilir. Mətn treki DASH, HLS CMAF və ya HLS TS-də təmin edilib-edilməməsindən asılı olaraq IMSC1, TTML və ya WebVTT-də qablaşdırılır.
24/7 OTT kanalları üçün real vaxt xətt kodlaması
Bizim v3 API-lərimizdən istifadə edərək, siz OTT (üstdən yüksək) kanallar yarada, idarə edə və yayımlaya, tələb olunan canlı video (VOD, tələb olunan video), qablaşdırma və rəqəmsal hüquqların idarə edilməsi kimi bütün digər Azure Media Xidmətlərindən istifadə edə bilərsiniz. DRM, rəqəmsal hüquqların idarə edilməsi).
Bu funksiyaların önizləmə versiyalarına baxmaq üçün ziyarət edin
Yeni paket yaratmaq imkanları
Audio təsvir parçaları üçün dəstək
Yayım kanalları üzərindən yayımlanan məzmunda tez-tez adi səs siqnalına əlavə olaraq ekranda baş verənlərin şifahi izahı olan audio trek olur. Bu, proqramları görmə qabiliyyəti zəif olan tamaşaçılar üçün daha əlçatan edir, xüsusən də məzmun ilk növbədə vizualdırsa. Yeni
ID3 metadatası daxil edilir
Müştərinin pleyerinə reklamların və ya fərdi metadata hadisələrinin daxil edilməsini bildirmək üçün yayımçılar tez-tez videoya daxil edilmiş vaxt təyin edilmiş metadatadan istifadə edirlər. SCTE-35 siqnal rejimlərinə əlavə olaraq, biz indi də dəstəkləyirik
Microsoft Azure partnyorları uç-to-end həllər nümayiş etdirir
beynəlxalq şirkət
Mənbə: www.habr.com