12 նոր Azure Media Services արհեստական ​​ինտելեկտով

Microsoft-ի առաքելությունն է հզորացնել մոլորակի յուրաքանչյուր մարդու և կազմակերպության՝ ավելիին հասնելու համար: Մեդիա ինդուստրիան այս առաքելությունն իրականություն դարձնելու հիանալի օրինակ է: Մենք ապրում ենք մի դարաշրջանում, որտեղ ավելի շատ բովանդակություն է ստեղծվում և սպառվում՝ ավելի շատ ձևերով և ավելի շատ սարքերով: IBC 2019-ում մենք կիսվեցինք վերջին նորամուծություններով, որոնց վրա աշխատում ենք, և թե ինչպես դրանք կարող են օգնել վերափոխել ձեր մեդիա փորձը:
12 նոր Azure Media Services արհեստական ​​ինտելեկտով
Մանրամասները կտրվածքի տակ։

Այս էջը միացված է մեր կայքը.

Video Indexer-ն այժմ աջակցում է անիմացիան և բազմալեզու բովանդակությունը

Անցյալ տարի IBC-ում մենք դարձանք մեր մրցանակակիրը Azure Media Services Video Indexer, իսկ այս տարի այն էլ ավելի լավացավ։ Video Indexer-ը ավտոմատ կերպով քաղում է տեղեկատվություն և մետատվյալներ մեդիա ֆայլերից, ինչպիսիք են ասված բառերը, դեմքերը, զգացմունքները, թեմաները և ապրանքանիշերը, և այն օգտագործելու համար ձեզ հարկավոր չէ լինել մեքենայական ուսուցման փորձագետ:

Մեր վերջին առաջարկները ներառում են երկու շատ պահանջված և տարբերվող գործառույթների նախադիտումներ՝ անիմացիոն կերպարների ճանաչում և բազմալեզու խոսքի տառադարձում, ինչպես նաև մի քանի հավելումներ առկա մոդելներին, որոնք այսօր հասանելի են Video Indexer-ում:

Անիմացիոն կերպարների ճանաչում

12 նոր Azure Media Services արհեստական ​​ինտելեկտով
Անիմացիոն բովանդակությունը՝ մուլտֆիլմերը, բովանդակության ամենահայտնի տեսակներից են, սակայն համակարգչային տեսողության ստանդարտ մոդելները, որոնք նախատեսված են մարդկանց դեմքերը ճանաչելու համար, լավ չեն աշխատում դրա հետ, հատկապես, եթե բովանդակությունը պարունակում է առանց մարդու դեմքի կերպարներ: Նախադիտման նոր տարբերակը համատեղում է Video Indexer-ը Microsoft-ի Azure Custom Vision ծառայության հետ, ինչի արդյունքում ստեղծվում է մոդելների նոր հավաքածու, որոնք ավտոմատ կերպով հայտնաբերում և խմբավորում են անիմացիոն կերպարները  և հեշտացնում են դրանք պիտակավորելու և ճանաչելու ինտեգրված հատուկ տեսողության մոդելների միջոցով:

Մոդելները ինտեգրված են մեկ խողովակաշարի մեջ՝ թույլ տալով բոլորին օգտվել ծառայությունից՝ առանց մեքենայական ուսուցման որևէ գիտելիքների: Արդյունքները հասանելի են առանց կոդերի Video Indexer պորտալի կամ REST API-ի միջոցով՝ ձեր սեփական հավելվածներին արագ ինտեգրվելու համար:

Մենք ստեղծել ենք այս մոդելները՝ աշխատելու անիմացիոն կերպարների հետ որոշ սպառողների հետ, ովքեր իրական անիմացիոն բովանդակություն են տրամադրել վերապատրաստման և փորձարկման համար: Նոր ֆունկցիոնալության արժեքը լավ ամփոփեց Էնդի Գուտերիջը՝ Viacom International Media Networks-ի ստուդիայի տեխնոլոգիաների և հետարտադրության ավագ տնօրենը, որը տվյալների մատակարարներից մեկն էր. մեզ արագ և արդյունավետ կերպով գտնել և ցուցակագրել գրանշանների մետատվյալները մեր գրադարանի բովանդակությունից:

Ամենակարևորը, դա մեր ստեղծագործական թիմերին հնարավորություն կտա անմիջապես գտնել իրենց անհրաժեշտ բովանդակությունը՝ նվազագույնի հասցնելով լրատվամիջոցների կառավարման վրա ծախսվող ժամանակը և թույլ տալով նրանց կենտրոնանալ ստեղծագործության վրա»:

Դուք կարող եք սկսել ծանոթանալ անիմացիոն կերպարների ճանաչման հետ փաստաթղթերի էջեր.

Բովանդակության նույնականացում և արտագրում մի քանի լեզուներով

Որոշ լրատվամիջոցներ, ինչպիսիք են լուրերը, քրոնիկները և հարցազրույցները, պարունակում են տարբեր լեզուներով խոսող մարդկանց ձայնագրություններ: Խոսքի տեքստի փոխանցման գոյություն ունեցող հնարավորությունների մեծ մասը պահանջում է աուդիո ճանաչման լեզուն նախապես նշել, ինչը դժվարացնում է բազմալեզու տեսանյութերի տառադարձումը:

Մեր նոր ավտոմատ խոսակցական լեզվի նույնականացման գործառույթը տարբեր տեսակի բովանդակության համար օգտագործում է մեքենայական ուսուցման տեխնոլոգիա՝ մեդիա ակտիվներում հայտնաբերված լեզուները նույնականացնելու համար: Հայտնաբերվելուց հետո յուրաքանչյուր լեզվական հատված ավտոմատ կերպով անցնում է համապատասխան լեզվով տառադարձման գործընթաց, այնուհետև բոլոր հատվածները միավորվում են մեկ բազմալեզու տառադարձման ֆայլում:

12 նոր Azure Media Services արհեստական ​​ինտելեկտով

Ստացված տառադարձությունը հասանելի է որպես Video Indexer-ի JSON ելքի մաս և որպես ենթագրերի ֆայլեր: Արդյունքների սղագրությունը նաև ինտեգրված է Azure Search-ի հետ, ինչը թույլ է տալիս անմիջապես որոնել ձեր տեսանյութերում տարբեր լեզուների հատվածներ: Բացի այդ, Video Indexer պորտալի հետ աշխատելիս հասանելի է բազմալեզու տառադարձում, այնպես որ դուք կարող եք ժամանակի ընթացքում դիտել տառադարձությունը և նույնականացված լեզուն, կամ ցատկել տեսանյութի որոշակի վայրեր յուրաքանչյուր լեզվի համար և տեսնել բազմալեզու տառադարձությունը որպես ենթագրեր, երբ տեսանյութը նվագարկվում է: Դուք կարող եք նաև թարգմանել ստացված տեքստը պորտալի և API-ի միջոցով հասանելի 54 լեզուներից որևէ մեկով:

Իմացեք ավելին բազմալեզու բովանդակության ճանաչման նոր գործառույթի և այն մասին, թե ինչպես է այն օգտագործվում Video Indexer-ում կարդալ փաստաթղթերը.

Լրացուցիչ թարմացված և բարելավված մոդելներ

Մենք նաև նոր մոդելներ ենք ավելացնում Video Indexer-ում և բարելավում գոյություն ունեցողները, ներառյալ ստորև նկարագրվածները:

Մարդկանց և վայրերի հետ կապված սուբյեկտների արդյունահանում

Մենք ընդլայնել ենք մեր գոյություն ունեցող ապրանքանիշերի հայտնաբերման հնարավորությունները՝ ներառելով հայտնի անուններ և վայրեր, ինչպիսիք են Փարիզի Էյֆելյան աշտարակը և Լոնդոնի Բիգ Բենը: Երբ դրանք հայտնվում են գեներացված տառադարձում կամ էկրանին, օգտագործելով օպտիկական նիշերի ճանաչումը (OCR), ավելացվում է համապատասխան տեղեկատվությունը: Այս նոր գործառույթի միջոցով դուք կարող եք որոնել բոլոր մարդկանց, վայրերին և ապրանքանիշերին, որոնք հայտնվել են տեսանյութում և դիտել դրանց մասին մանրամասները, ներառյալ ժամային հատվածները, նկարագրությունները և Bing որոնման համակարգի հղումները՝ լրացուցիչ տեղեկությունների համար:

12 նոր Azure Media Services արհեստական ​​ինտելեկտով

Շրջանակի հայտնաբերման մոդելը խմբագրի համար

Այս նոր ֆունկցիան ավելացնում է մի շարք «պիտակներ» JSON մանրամասների առանձին կադրերին կցված մետատվյալներին՝ ներկայացնելու դրանց խմբագրական տեսակը (օրինակ՝ լայն կադր, միջին կադր, մոտ պլան, էքստրեմալ մոտիկից, երկու կադր, բազմաթիվ մարդիկ։ , բացօթյա, փակ և այլն): Կադրերի տիպի այս բնութագրերը օգտակար են հոլովակների և թրեյլերների համար տեսահոլովակ խմբագրելիս կամ գեղարվեստական ​​նպատակներով հատուկ նկարահանման ոճ փնտրելիս:

12 նոր Azure Media Services արհեստական ​​ինտելեկտով
Իմացեք ավելին Շրջանակի տիպի հայտնաբերում Video Indexer-ում:

Ընդլայնված IPTC քարտեզագրման հատիկություն

Թեմայի հայտնաբերման մեր մոդելը որոշում է տեսանյութի թեման՝ հիմնված տառադարձման, օպտիկական նիշերի ճանաչման (OCR) և հայտնաբերված հայտնի մարդկանց վրա, նույնիսկ եթե թեման հստակորեն նշված չէ: Մենք քարտեզագրում ենք այս հայտնաբերված թեմաները չորս դասակարգման ոլորտներում՝ Wikipedia, Bing, IPTC և IAB: Այս բարելավումը թույլ է տալիս մեզ ներառել երկրորդ մակարդակի IPTC դասակարգումը:
Այս բարելավումներից օգտվելը նույնքան հեշտ է, որքան ձեր ընթացիկ Video Indexer գրադարանի վերաինդեքսավորումը:

Ուղիղ հեռարձակման նոր գործառույթ

Azure Media Services-ի նախադիտման մեջ մենք նաև առաջարկում ենք երկու նոր հնարավորություն ուղիղ հեռարձակման համար:

AI-ով աշխատող իրական ժամանակի տառադարձումը ուղիղ հեռարձակումը տեղափոխում է հաջորդ մակարդակ

Օգտագործելով Azure Media Services-ը ուղիղ հեռարձակման համար, այժմ կարող եք ստանալ ելքային հոսք, որը ներառում է ավտոմատ ստեղծվող տեքստային հետքեր՝ ի լրումն աուդիո և վիդեո բովանդակության: Տեքստը ստեղծվել է իրական ժամանակի աուդիո տառադարձման միջոցով՝ հիմնված արհեստական ​​ինտելեկտի վրա: Հատուկ տեխնիկան կիրառվում է խոսքից տեքստ փոխակերպումից առաջ և հետո՝ արդյունքները բարելավելու համար: Տեքստային ուղին փաթեթավորված է IMSC1, TTML կամ WebVTT՝ կախված նրանից, թե արդյոք այն մատակարարվում է DASH, HLS CMAF կամ HLS TS:

Իրական ժամանակի գծի կոդավորում 24/7 OTT ալիքների համար

Օգտագործելով մեր v3 API-ները՝ դուք կարող եք ստեղծել, կառավարել և հեռարձակել OTT (ավելի քան վերև) ալիքներ և օգտագործել Azure Media Services-ի բոլոր այլ գործառույթները, ինչպիսիք են՝ կենդանի տեսանյութը ըստ պահանջի (VOD, տեսանյութ ըստ պահանջի), փաթեթավորում և թվային իրավունքների կառավարում ( DRM, թվային իրավունքների կառավարում):
Այս գործառույթների նախադիտման տարբերակները տեսնելու համար այցելեք Azure Media Services համայնք.

12 նոր Azure Media Services արհեստական ​​ինտելեկտով

Փաթեթների արտադրության նոր հնարավորություններ

Աջակցություն աուդիո նկարագրության հետքերի համար

Հեռարձակվող ալիքներով հեռարձակվող բովանդակությունը հաճախ ունենում է աուդիո հետքեր՝ բանավոր բացատրություններով, թե ինչ է կատարվում էկրանին, ի հավելումն սովորական ձայնային ազդանշանի: Սա ծրագրերն ավելի հասանելի է դարձնում տեսողության խնդիրներ ունեցող դիտողների համար, հատկապես, եթե բովանդակությունը հիմնականում տեսողական է: Նոր աուդիո նկարագրության գործառույթ թույլ է տալիս ծանոթագրել աուդիո հետքերից մեկը որպես աուդիո նկարագրության հետքեր (AD, աուդիո նկարագրություն), ինչը թույլ է տալիս խաղացողներին հասանելի դարձնել AD-ի հետքերը դիտողներին:

ID3 մետատվյալների տեղադրում

Հաճախորդի նվագարկիչին գովազդի կամ հատուկ մետատվյալների իրադարձությունների տեղադրումն ազդարարելու համար հեռարձակողները հաճախ օգտագործում են տեսանյութում ներկառուցված ժամանակի մետատվյալներ: Բացի SCTE-35 ազդանշանային ռեժիմներից, մենք այժմ նաև աջակցում ենք ID3v2 և այլ մաքսային սխեմաներ, սահմանված է հավելվածի մշակողի կողմից՝ հաճախորդի հավելվածի կողմից օգտագործելու համար:

Microsoft Azure-ի գործընկերները ցուցադրում են վերջնական լուծումներ

Bitmovin ներկայացնում է Bitmovin Video Encoding-ը և Bitmovin Video Player-ը Microsoft Azure-ի համար: Հաճախորդներն այժմ կարող են օգտագործել այս կոդավորման և նվագարկման լուծումները Azure-ում և օգտվել առաջադեմ հնարավորություններից, ինչպիսիք են եռաստիճան կոդավորումը, AV1/VC կոդեկի աջակցությունը, բազմալեզու ենթագրերը և նախնական ինտեգրված վիդեո վերլուծությունը QoS-ի, գովազդի և տեսանյութերի հետագծման համար:

Էվերգենտ ցուցադրում է իր Օգտագործողի կյանքի ցիկլի կառավարման պլատֆորմը Azure-ում: Որպես եկամուտների և հաճախորդների կյանքի ցիկլի կառավարման լուծումների առաջատար մատակարար՝ Evergent-ն օգտագործում է Azure AI-ն՝ օգնելու պրեմիում ժամանցի մատակարարներին բարելավել հաճախորդների ձեռքբերումն ու պահպանումը՝ ստեղծելով թիրախային ծառայությունների փաթեթներ և առաջարկներ հաճախորդների կյանքի ցիկլի կարևոր կետերում:

Haivision- ը կցուցադրի իր խելացի ամպի վրա հիմնված մեդիա երթուղային ծառայությունը՝ SRT Hub, որն օգնում է հաճախորդներին վերափոխել վերջից ծայր աշխատանքային հոսքերը՝ օգտագործելով Azure Data Box Edge և փոխակերպելով աշխատանքային հոսքերը Hublets-ի հետ Avid-ից, Telestream-ից, Wowza-ից, Cinegy-ից և Make.tv-ից:

SES- ը մշակել է հեռարձակման կարգի մեդիա ծառայությունների փաթեթ Azure հարթակում իր արբանյակային և կառավարվող մեդիա ծառայությունների հաճախորդների համար: SES-ը կցուցադրի լուծումներ ամբողջությամբ կառավարվող playout ծառայությունների համար, ներառյալ հիմնական նվագարկումը, տեղայնացված նվագարկումը, գովազդի հայտնաբերումը և փոխարինումը և բարձրորակ իրական ժամանակում 24x7 բազմալիք կոդավորումը Azure-ում:

SyncWords Azure-ում հասանելի է դարձնում հարմար ամպային գործիքները և ստորագրության ավտոմատացման տեխնոլոգիան: Այս առաջարկները կհեշտացնեն մեդիա կազմակերպություններին ավտոմատ կերպով ենթագրեր ավելացնելը, ներառյալ օտարալեզու ենթագրերը, իրենց կենդանի և օֆլայն վիդեո աշխատանքի հոսքերին Azure-ում:
միջազգային ընկերություն Tata Elxsi- նՏեխնոլոգիական ծառայություններ մատուցող ընկերությունն իր OTT SaaS պլատֆորմը ինտեգրել է TEPlay Azure Media Services-ին՝ ամպից OTT բովանդակություն տրամադրելու համար: Tata Elxsi-ն նաև ներկայացրել է իր Falcon Eye որակի փորձի մոնիտորինգի լուծումը Microsoft Azure-ին՝ տրամադրելով վերլուծություններ և չափումներ որոշումների կայացման համար:

Verizon Media- ն իր հոսքային հարթակը հասանելի է դարձնում Azure-ում որպես բետա թողարկում: Verizon Media Platform-ը ձեռնարկության մակարդակի կառավարվող OTT լուծում է, որը ներառում է DRM, գովազդի տեղադրում, անհատականացված սեանսներ, դինամիկ բովանդակության փոխարինում և տեսանյութերի առաքում: Ինտեգրումը հեշտացնում է աշխատանքային հոսքերը, գլոբալ աջակցությունն ու մասշտաբը, ինչպես նաև բացում է Azure-ում հայտնաբերված որոշ եզակի հնարավորություններ:

Source: www.habr.com

Добавить комментарий