Il-missjoni ta' Microsoft hija li tagħti s-setgħa lil kull persuna u organizzazzjoni fuq il-pjaneta biex tikseb aktar. L-industrija tal-midja hija eżempju mill-aqwa kif din il-missjoni ssir realtà. Aħna ngħixu f'era fejn qed jinħoloq u jiġi kkunsmat aktar kontenut, b'aktar modi u fuq aktar apparati. Fl-IBC 2019, qsamna l-aħħar innovazzjonijiet li qed naħdmu fuqhom u kif jistgħu jgħinu fit-trasformazzjoni tal-esperjenza tal-midja tiegħek.
Dettalji taħt il-qatgħa!
Din il-paġna tinsab fuq
Video Indexer issa jappoġġja animazzjoni u kontenut multilingwi
Is-sena li għaddiet fl-IBC għamilna l-premju tagħna
L-aħħar offerti tagħna jinkludu previews ta’ żewġ karatteristiċi ferm imfittxija u differenzjati—rikonoxximent ta’ karattri animati u traskrizzjoni ta’ diskors multilingwi—kif ukoll diversi żidiet għall-mudelli eżistenti disponibbli llum fil-Video Indexer.
Rikonoxximent tal-Karattri Animati
Il-kontenut animat huwa wieħed mit-tipi l-aktar popolari ta 'kontenut, iżda mudelli standard ta' viżjoni bil-kompjuter iddisinjati biex jirrikonoxxu uċuħ umani ma jaħdmux tajjeb miegħu, speċjalment jekk il-kontenut ikun fih karattri mingħajr karatteristiċi tal-wiċċ tal-bniedem. Il-verżjoni ta’ preview il-ġdida tgħaqqad Video Indexer mas-servizz Azure Custom Vision ta’ Microsoft, li twassal sett ġdid ta’ mudelli li awtomatikament jiskopru u jiġbru karattri animati u jagħmluhom faċli biex jiġu ttikkettjati u rikonoxxuti bl-użu ta’ mudelli ta’ viżjoni personalizzata integrati.
Il-mudelli huma integrati f'pipeline wieħed, li jippermetti lil kulħadd juża s-servizz mingħajr ebda għarfien tat-tagħlim tal-magni. Ir-riżultati huma disponibbli permezz ta' portal Video Indexer bla kodiċi jew permezz ta' REST API għal integrazzjoni rapida fl-applikazzjonijiet tiegħek stess.
Bnejna dawn il-mudelli biex naħdmu ma 'karattri animati flimkien ma' xi konsumaturi li pprovdew kontenut animat reali għat-taħriġ u l-ittestjar. Il-valur tal-funzjonalità l-ġdida ġie mqassar sew minn Andy Gutteridge, direttur anzjan tat-teknoloġija tal-istudjo u l-post-produzzjoni f’Viacom International Media Networks, li kien wieħed mill-fornituri tad-dejta: “Iż-żieda ta’ skoperta robusta ta’ kontenut animat imħaddem bl-AI se tippermetti lilna biex insibu malajr u b'mod effiċjenti metadejta tal-karattri mill-kontenut tal-librerija tagħna.
L-aktar importanti, se jagħti lit-timijiet kreattivi tagħna l-abbiltà li jsibu istantanjament il-kontenut li jeħtieġu, jimminimizzaw il-ħin imqatta’ biex jimmaniġġjaw il-midja u jippermettilhom jiffokaw fuq il-kreattività.”
Tista 'tibda ssir familjari ma' rikonoxximent ta 'karattri animati
Identifikazzjoni u traskrizzjoni tal-kontenut f'diversi lingwi
Xi riżorsi tal-midja, bħal aħbarijiet, kronaki u intervisti, fihom reġistrazzjonijiet ta’ nies li jitkellmu lingwi differenti. Il-biċċa l-kbira tal-kapaċitajiet eżistenti ta' diskors għal test jeħtieġu li l-lingwa ta' rikonoxximent tal-awdjo tiġi speċifikata minn qabel, u b'hekk ikun diffiċli li jiġu traskritti vidjows multilingwi.
Il-karatteristika l-ġdida tagħna ta’ Identifikazzjoni Awtomatika tal-Lingwa Mitkellma għal diversi tipi ta’ kontenut tuża t-teknoloġija tat-tagħlim tal-magni biex tidentifika lingwi li jinsabu fl-assi tal-midja. Ladarba jinstab, kull segment tal-lingwa awtomatikament jgħaddi minn proċess ta 'traskrizzjoni fil-lingwa xierqa, u mbagħad is-segmenti kollha jingħaqdu f'fajl wieħed ta' traskrizzjoni b'ħafna lingwi.
It-traskrizzjoni li tirriżulta hija disponibbli bħala parti mill-output JSON tal-Video Indexer u bħala fajls tas-sottotitoli. It-traskrizzjoni tal-output hija integrata wkoll ma 'Azure Search, li tippermettilek tfittex immedjatament għal segmenti ta' lingwa differenti fil-vidjows tiegħek. Barra minn hekk, traskrizzjoni multilingwi hija disponibbli meta taħdem mal-portal Video Indexer, sabiex tkun tista’ tara t-traskrizzjoni u l-lingwa identifikata maż-żmien, jew taqbeż għal postijiet speċifiċi fil-video għal kull lingwa u tara t-traskrizzjoni multilingwi bħala sottotitli hekk kif il-video jindaqq. Tista' wkoll tittraduċi t-test riċevut fi kwalunkwe mill-54 lingwa disponibbli permezz tal-portal u l-API.
Tgħallem aktar dwar il-karatteristika l-ġdida ta’ rikonoxximent tal-kontenut multilingwi u kif tintuża f’Video Indexer
Mudelli addizzjonali aġġornati u mtejba
Qed inżidu wkoll mudelli ġodda għal Video Indexer u ntejbu dawk eżistenti, inklużi dawk deskritti hawn taħt.
Entitajiet ta 'estrazzjoni assoċjati ma' nies u postijiet
Espandejna l-kapaċitajiet eżistenti tagħna ta’ skoperta tal-marki biex jinkludu ismijiet u postijiet magħrufa sew, bħat-Torri Eiffel f’Pariġi u l-Big Ben f’Londra. Meta jidhru fit-traskrizzjoni ġġenerata jew fuq l-iskrin bl-użu tar-rikonoxximent ottiku tal-karattri (OCR), tiżdied l-informazzjoni rilevanti. B'din il-karatteristika ġdida, tista' tfittex in-nies, il-postijiet, u l-marki kollha li dehru f'vidjow u tara d-dettalji dwarhom, inklużi l-islots tal-ħin, id-deskrizzjonijiet, u l-links għall-magna tat-tiftix Bing għal aktar informazzjoni.
Mudell ta 'skoperta tal-qafas għall-editur
Din il-karatteristika ġdida żżid sett ta' "tags" mal-metadejta mehmuża ma' frejms individwali fid-dettalji JSON biex tirrappreżenta t-tip editorjali tagħhom (pereżempju, shot wiesa', shot medju, close-up, close-up estrem, żewġ shots, nies multipli , barra, ġewwa, eċċ.). Dawn il-karatteristiċi tat-tip shot huma utli meta editjar vidjo għal klipps u karrijiet, jew meta tfittex stil ta 'sparatura speċifika għal skopijiet artistiċi.
Granularità mtejba tal-immappjar tal-IPTC
Il-mudell tagħna ta 'skoperta tas-suġġett jiddetermina s-suġġett ta' vidjo bbażat fuq traskrizzjoni, rikonoxximent ottiku tal-karattri (OCR), u ċelebritajiet misjuba, anke jekk is-suġġett mhuwiex speċifikat b'mod espliċitu. Aħna nimmappaw dawn is-suġġetti misjuba għal erba 'oqsma ta' klassifikazzjoni: Wikipedija, Bing, IPTC, u IAB. Dan it-titjib jippermettilna li ninkludu klassifikazzjoni IPTC tat-tieni livell.
Li tieħu vantaġġ minn dan it-titjib huwa faċli daqs l-indiċjar mill-ġdid tal-librerija attwali tiegħek tal-Indiċjar tal-Vidjo.
Funzjonalità ġdida ta' streaming live
Fil-preview Azure Media Services, qed noffru wkoll żewġ karatteristiċi ġodda għall-istrimjar dirett.
It-traskrizzjoni f'ħin reali mħaddma bl-AI tieħu streaming live għal-livell li jmiss
Bl-użu ta' Azure Media Services għal live streaming, issa tista' tirċievi fluss ta' output li jinkludi track ta' test iġġenerat awtomatikament flimkien mal-kontenut awdjo u vidjo. It-test huwa maħluq bl-użu ta 'traskrizzjoni awdjo f'ħin reali bbażata fuq intelliġenza artifiċjali. Tekniki personalizzati huma applikati qabel u wara l-konverżjoni ta 'diskors għal test biex itejbu r-riżultati. It-track tat-test huwa ppakkjat f'IMSC1, TTML jew WebVTT, skont jekk huwiex fornut f'DASH, HLS CMAF jew HLS TS.
Kodifikazzjoni tal-linja f'ħin reali għal kanali OTT 24/7
Bl-użu tal-APIs v3 tagħna, tista' toħloq, timmaniġġja u xxandar kanali OTT (over-the-top), u tuża l-karatteristiċi l-oħra kollha ta' Azure Media Services bħal video live on demand (VOD, video on demand), imballaġġ u ġestjoni tad-drittijiet diġitali ( DRM, ġestjoni tad-drittijiet diġitali).
Biex tara verżjonijiet ta' preview ta' dawn il-karatteristiċi, żur
Kapaċitajiet ġodda ta 'ġenerazzjoni ta' pakketti
Appoġġ għal binarji ta 'deskrizzjoni awdjo
Kontenut imxandar fuq kanali tax-xandir spiss ikollu track awdjo bi spjegazzjonijiet verbali ta 'dak li qed jiġri fuq l-iskrin minbarra s-sinjal awdjo regolari. Dan jagħmel il-programmi aktar aċċessibbli għal telespettaturi neqsin mid-dawl, speċjalment jekk il-kontenut huwa primarjament viżwali. Ġdid
Daħħal metadata ID3
Biex jindikaw l-inserzjoni ta 'reklami jew avvenimenti ta' metadejta personalizzati lill-plejer tal-klijent, ix-xandara ħafna drabi jużaw metadejta f'waqtha inkorporata fil-vidjo. Minbarra l-modi ta 'sinjalazzjoni SCTE-35, issa nappoġġjaw ukoll
L-imsieħba ta’ Microsoft Azure juru soluzzjonijiet minn tarf sa tarf
kumpanija internazzjonali
Sors: www.habr.com