Cenhadaeth Microsoft yw grymuso pob person a sefydliad ar y blaned i gyflawni mwy. Mae diwydiant y cyfryngau yn enghraifft wych o wireddu'r genhadaeth hon. Rydym yn byw mewn oes lle mae mwy o gynnwys yn cael ei greu a'i ddefnyddio, mewn mwy o ffyrdd ac ar fwy o ddyfeisiau. Yn IBC 2019, fe wnaethon ni rannu'r datblygiadau arloesol diweddaraf rydyn ni'n gweithio arnyn nhw a sut y gallant helpu i drawsnewid eich profiad cyfryngau.
Manylion o dan y toriad!
Mae'r dudalen hon ymlaen
Mae Video Indexer bellach yn cefnogi animeiddio a chynnwys amlieithog
Y llynedd yn IBC fe wnaethon ni ennill gwobrau
Mae ein cynigion diweddaraf yn cynnwys rhagflas o ddwy nodwedd wahaniaethol y mae galw mawr amdanynt - adnabod cymeriad animeiddiedig a thrawsgrifio lleferydd amlieithog - yn ogystal Γ’ sawl ychwanegiad at y modelau presennol sydd ar gael heddiw yn Video Indexer.
Cydnabod Cymeriad Animeiddiedig
Cynnwys animeiddiedig yw un o'r mathau mwyaf poblogaidd o gynnwys, ond nid yw modelau gweledigaeth cyfrifiadurol safonol sydd wedi'u cynllunio i adnabod wynebau dynol yn gweithio'n dda ag ef, yn enwedig os yw'r cynnwys yn cynnwys cymeriadau heb nodweddion wyneb dynol. Mae'r fersiwn rhagolwg newydd yn cyfuno Video Indexer Γ’ gwasanaeth Azure Custom Vision Microsoft, gan gyflwyno set newydd o fodelau sy'n canfod ac yn grwpio cymeriadau animeiddiedig yn awtomatig ac yn eu gwneud yn hawdd eu labelu a'u hadnabod gan ddefnyddio modelau gweledigaeth arferiad integredig.
Mae'r modelau wedi'u hintegreiddio i un biblinell, gan ganiatΓ‘u i unrhyw un ddefnyddio'r gwasanaeth heb unrhyw wybodaeth ddysgu peiriant. Mae canlyniadau ar gael trwy borth Mynegeiwr Fideo heb god neu drwy API REST i'w hintegreiddio'n gyflym i'ch cymwysiadau eich hun.
Fe wnaethom adeiladu'r modelau hyn i weithio gyda chymeriadau animeiddiedig ynghyd Γ’ rhai defnyddwyr a ddarparodd gynnwys animeiddiedig go iawn ar gyfer hyfforddi a phrofi. Crynhowyd gwerth y swyddogaeth newydd yn dda gan Andy Gutteridge, uwch gyfarwyddwr technoleg stiwdio ac Γ΄l-gynhyrchu yn Viacom International Media Networks, a oedd yn un oβr darparwyr data: βBydd darganfod cynnwys animeiddiedig cadarn wediβi bweru gan AI yn caniatΓ‘u i ni ganfod a chatalogio metadata cymeriadau o gynnwys ein llyfrgell yn gyflym ac yn effeithlon.
Yn bwysicaf oll, bydd yn rhoiβr gallu iβn timau creadigol ddod o hyd iβr cynnwys sydd ei angen arnynt ar unwaith, gan leihauβr amser a dreulir yn rheoli cyfryngau a chaniatΓ‘u iddynt ganolbwyntio ar greadigrwydd.β
Gallwch chi ddechrau dod yn gyfarwydd ag adnabod cymeriad animeiddiedig Γ’
Adnabod a thrawsgrifio cynnwys mewn sawl iaith
Mae rhai adnoddau cyfryngol, megis newyddion, croniclau a chyfweliadau, yn cynnwys recordiadau o bobl yn siarad ieithoedd gwahanol. Mae'r rhan fwyaf o alluoedd lleferydd-i-destun presennol yn gofyn am nodi'r iaith adnabod sain ymlaen llaw, gan ei gwneud hi'n anodd trawsgrifio fideos amlieithog.
Mae ein nodwedd Adnabod Iaith Lafar Awtomatig newydd ar gyfer gwahanol fathau o gynnwys yn defnyddio technoleg dysgu peirianyddol i nodi ieithoedd a geir mewn asedau cyfryngau. Unwaith y cΓ’nt eu canfod, mae pob segment iaith yn mynd trwy broses drawsgrifio yn yr iaith briodol yn awtomatig, ac yna caiff pob segment ei gyfuno'n un ffeil trawsgrifio aml-iaith.
Mae'r trawsgrifiad canlyniadol ar gael fel rhan o allbwn JSON o'r Mynegai Fideo ac fel ffeiliau isdeitl. Mae'r trawsgrifiad allbwn hefyd wedi'i integreiddio ag Azure Search, sy'n eich galluogi i chwilio ar unwaith am wahanol segmentau iaith yn eich fideos. Yn ogystal, mae trawsgrifiad amlieithog ar gael wrth weithio gyda'r porth Mynegai Fideo, felly gallwch weld y trawsgrifiad a'r iaith a nodwyd dros amser, neu neidio i fannau penodol yn y fideo ar gyfer pob iaith a gweld y trawsgrifiad amlieithog fel capsiynau wrth i'r fideo chwarae. Gallwch hefyd gyfieithu'r testun a dderbyniwyd i unrhyw un o'r 54 o ieithoedd sydd ar gael trwy'r porth a'r API.
Dysgwch fwy am y nodwedd adnabod cynnwys amlieithog newydd a sut mae'n cael ei ddefnyddio yn Video Indexer
Modelau ychwanegol wedi'u diweddaru a'u gwella
Rydym hefyd yn ychwanegu modelau newydd at Fynegai Fideo ac yn gwella'r rhai presennol, gan gynnwys y rhai a ddisgrifir isod.
Echdynnu endidau sy'n gysylltiedig Γ’ phobl a lleoedd
Rydym wedi ehangu ein galluoedd darganfod brand presennol i gynnwys enwau a lleoliadau adnabyddus, megis TΕ΅r Eiffel ym Mharis a Big Ben yn Llundain. Pan fyddant yn ymddangos yn y trawsgrifiad a gynhyrchir neu ar y sgrin gan ddefnyddio adnabod nodau optegol (OCR), ychwanegir y wybodaeth berthnasol. Gyda'r nodwedd newydd hon, gallwch chwilio am yr holl bobl, lleoedd, a brandiau a ymddangosodd mewn fideo a gweld manylion amdanynt, gan gynnwys slotiau amser, disgrifiadau, a dolenni i beiriant chwilio Bing am ragor o wybodaeth.
Model canfod ffrΓ’m ar gyfer golygydd
Mae'r nodwedd newydd hon yn ychwanegu set o "dagiau" i'r metadata sydd ynghlwm wrth fframiau unigol yn y manylion JSON i gynrychioli eu math golygyddol (er enghraifft, saethiad llydan, saethiad canolig, agos, agos iawn, dau saethiad, pobl lluosog , awyr agored, dan do, ac ati). Mae'r nodweddion math hyn o ergyd yn ddefnyddiol wrth olygu fideo ar gyfer clipiau a rhaghysbysebion, neu wrth chwilio am arddull saethu benodol at ddibenion artistig.
Gwell ronynnedd mapio IPTC
Mae ein model canfod pwnc yn pennu pwnc fideo yn seiliedig ar drawsgrifio, adnabod nodau optegol (OCR), ac enwogion a ganfuwyd, hyd yn oed os nad yw'r pwnc wedi'i nodi'n benodol. Rydym yn mapio'r pynciau canfyddedig hyn i bedwar maes dosbarthu: Wikipedia, Bing, IPTC, ac IAB. Mae'r gwelliant hwn yn ein galluogi i gynnwys dosbarthiad IPTC ail lefel.
Mae manteisio ar y gwelliannau hyn mor hawdd ag ail-fynegeio eich llyfrgell Mynegeiwr Fideo cyfredol.
Swyddogaeth ffrydio byw newydd
Yn rhagolwg Azure Media Services, rydym hefyd yn cynnig dwy nodwedd newydd ar gyfer ffrydio byw.
Mae trawsgrifiad amser real wedi'i bweru gan AI yn mynd Γ’ ffrydio byw i'r lefel nesaf
Gan ddefnyddio Azure Media Services ar gyfer ffrydio byw, gallwch nawr dderbyn ffrwd allbwn sy'n cynnwys trac testun a gynhyrchir yn awtomatig yn ogystal Γ’ chynnwys sain a fideo. Mae'r testun yn cael ei greu gan ddefnyddio trawsgrifiad sain amser real yn seiliedig ar ddeallusrwydd artiffisial. Defnyddir technegau personol cyn ac ar Γ΄l trosi lleferydd-i-destun i wella canlyniadau. Mae'r trac testun wedi'i becynnu yn IMSC1, TTML neu WebVTT, yn dibynnu a yw'n cael ei gyflenwi yn DASH, HLS CMAF neu HLS TS.
Amgodio llinell amser real ar gyfer sianeli OTT 24/7
Gan ddefnyddio ein APIs v3, gallwch greu, rheoli a darlledu sianeli OTT (dros ben llestri), a defnyddio holl nodweddion Gwasanaethau Cyfryngau Azure eraill fel fideo byw ar alw (VOD, fideo ar alw), pecynnu a rheoli hawliau digidol ( DRM, rheoli hawliau digidol).
I weld fersiynau rhagolwg o'r nodweddion hyn, ewch i
Galluoedd cynhyrchu pecyn newydd
Cefnogaeth i draciau disgrifiad sain
Yn aml mae gan gynnwys a ddarlledir dros sianeli darlledu drac sain gydag esboniadau llafar o'r hyn sy'n digwydd ar y sgrin yn ogystal Γ’'r signal sain rheolaidd. Mae hyn yn gwneud rhaglenni'n fwy hygyrch i wylwyr Γ’ nam ar eu golwg, yn enwedig os yw'r cynnwys yn bennaf yn weledol. Newydd
Wrthi'n mewnosod metadata ID3
Er mwyn rhoi arwydd o fewnosod hysbysebion neu ddigwyddiadau metadata personol i chwaraewr y cleient, mae darlledwyr yn aml yn defnyddio metadata wedi'i amseru sydd wedi'i fewnosod yn y fideo. Yn ogystal Γ’ dulliau signalau SCTE-35, rydym bellach hefyd yn cefnogi
Mae partneriaid Microsoft Azure yn dangos atebion diwedd-i-ddiwedd
cwmni rhyngwladol
Ffynhonnell: hab.com