Microsoft-ի առաքելությունն է հզորացնել մոլորակի յուրաքանչյուր մարդու և կազմակերպության՝ ավելիին հասնելու համար: Մեդիա ինդուստրիան այս առաքելությունն իրականություն դարձնելու հիանալի օրինակ է: Մենք ապրում ենք մի դարաշրջանում, որտեղ ավելի շատ բովանդակություն է ստեղծվում և սպառվում՝ ավելի շատ ձևերով և ավելի շատ սարքերով: IBC 2019-ում մենք կիսվեցինք վերջին նորամուծություններով, որոնց վրա աշխատում ենք, և թե ինչպես դրանք կարող են օգնել վերափոխել ձեր մեդիա փորձը:
Մանրամասները կտրվածքի տակ։
Այս էջը միացված է
Video Indexer-ն այժմ աջակցում է անիմացիան և բազմալեզու բովանդակությունը
Անցյալ տարի IBC-ում մենք դարձանք մեր մրցանակակիրը
Մեր վերջին առաջարկները ներառում են երկու շատ պահանջված և տարբերվող գործառույթների նախադիտումներ՝ անիմացիոն կերպարների ճանաչում և բազմալեզու խոսքի տառադարձում, ինչպես նաև մի քանի հավելումներ առկա մոդելներին, որոնք այսօր հասանելի են Video Indexer-ում:
Անիմացիոն կերպարների ճանաչում
Անիմացիոն բովանդակությունը՝ մուլտֆիլմերը, բովանդակության ամենահայտնի տեսակներից են, սակայն համակարգչային տեսողության ստանդարտ մոդելները, որոնք նախատեսված են մարդկանց դեմքերը ճանաչելու համար, լավ չեն աշխատում դրա հետ, հատկապես, եթե բովանդակությունը պարունակում է առանց մարդու դեմքի կերպարներ: Նախադիտման նոր տարբերակը համատեղում է Video Indexer-ը Microsoft-ի Azure Custom Vision ծառայության հետ, ինչի արդյունքում ստեղծվում է մոդելների նոր հավաքածու, որոնք ավտոմատ կերպով հայտնաբերում և խմբավորում են անիմացիոն կերպարները և հեշտացնում են դրանք պիտակավորելու և ճանաչելու ինտեգրված հատուկ տեսողության մոդելների միջոցով:
Մոդելները ինտեգրված են մեկ խողովակաշարի մեջ՝ թույլ տալով բոլորին օգտվել ծառայությունից՝ առանց մեքենայական ուսուցման որևէ գիտելիքների: Արդյունքները հասանելի են առանց կոդերի Video Indexer պորտալի կամ REST API-ի միջոցով՝ ձեր սեփական հավելվածներին արագ ինտեգրվելու համար:
Մենք ստեղծել ենք այս մոդելները՝ աշխատելու անիմացիոն կերպարների հետ որոշ սպառողների հետ, ովքեր իրական անիմացիոն բովանդակություն են տրամադրել վերապատրաստման և փորձարկման համար: Նոր ֆունկցիոնալության արժեքը լավ ամփոփեց Էնդի Գուտերիջը՝ Viacom International Media Networks-ի ստուդիայի տեխնոլոգիաների և հետարտադրության ավագ տնօրենը, որը տվյալների մատակարարներից մեկն էր. մեզ արագ և արդյունավետ կերպով գտնել և ցուցակագրել գրանշանների մետատվյալները մեր գրադարանի բովանդակությունից:
Ամենակարևորը, դա մեր ստեղծագործական թիմերին հնարավորություն կտա անմիջապես գտնել իրենց անհրաժեշտ բովանդակությունը՝ նվազագույնի հասցնելով լրատվամիջոցների կառավարման վրա ծախսվող ժամանակը և թույլ տալով նրանց կենտրոնանալ ստեղծագործության վրա»:
Դուք կարող եք սկսել ծանոթանալ անիմացիոն կերպարների ճանաչման հետ
Բովանդակության նույնականացում և արտագրում մի քանի լեզուներով
Որոշ լրատվամիջոցներ, ինչպիսիք են լուրերը, քրոնիկները և հարցազրույցները, պարունակում են տարբեր լեզուներով խոսող մարդկանց ձայնագրություններ: Խոսքի տեքստի փոխանցման գոյություն ունեցող հնարավորությունների մեծ մասը պահանջում է աուդիո ճանաչման լեզուն նախապես նշել, ինչը դժվարացնում է բազմալեզու տեսանյութերի տառադարձումը:
Մեր նոր ավտոմատ խոսակցական լեզվի նույնականացման գործառույթը տարբեր տեսակի բովանդակության համար օգտագործում է մեքենայական ուսուցման տեխնոլոգիա՝ մեդիա ակտիվներում հայտնաբերված լեզուները նույնականացնելու համար: Հայտնաբերվելուց հետո յուրաքանչյուր լեզվական հատված ավտոմատ կերպով անցնում է համապատասխան լեզվով տառադարձման գործընթաց, այնուհետև բոլոր հատվածները միավորվում են մեկ բազմալեզու տառադարձման ֆայլում:
Ստացված տառադարձությունը հասանելի է որպես Video Indexer-ի JSON ելքի մաս և որպես ենթագրերի ֆայլեր: Արդյունքների սղագրությունը նաև ինտեգրված է Azure Search-ի հետ, ինչը թույլ է տալիս անմիջապես որոնել ձեր տեսանյութերում տարբեր լեզուների հատվածներ: Բացի այդ, Video Indexer պորտալի հետ աշխատելիս հասանելի է բազմալեզու տառադարձում, այնպես որ դուք կարող եք ժամանակի ընթացքում դիտել տառադարձությունը և նույնականացված լեզուն, կամ ցատկել տեսանյութի որոշակի վայրեր յուրաքանչյուր լեզվի համար և տեսնել բազմալեզու տառադարձությունը որպես ենթագրեր, երբ տեսանյութը նվագարկվում է: Դուք կարող եք նաև թարգմանել ստացված տեքստը պորտալի և API-ի միջոցով հասանելի 54 լեզուներից որևէ մեկով:
Իմացեք ավելին բազմալեզու բովանդակության ճանաչման նոր գործառույթի և այն մասին, թե ինչպես է այն օգտագործվում Video Indexer-ում
Լրացուցիչ թարմացված և բարելավված մոդելներ
Մենք նաև նոր մոդելներ ենք ավելացնում Video Indexer-ում և բարելավում գոյություն ունեցողները, ներառյալ ստորև նկարագրվածները:
Մարդկանց և վայրերի հետ կապված սուբյեկտների արդյունահանում
Մենք ընդլայնել ենք մեր գոյություն ունեցող ապրանքանիշերի հայտնաբերման հնարավորությունները՝ ներառելով հայտնի անուններ և վայրեր, ինչպիսիք են Փարիզի Էյֆելյան աշտարակը և Լոնդոնի Բիգ Բենը: Երբ դրանք հայտնվում են գեներացված տառադարձում կամ էկրանին, օգտագործելով օպտիկական նիշերի ճանաչումը (OCR), ավելացվում է համապատասխան տեղեկատվությունը: Այս նոր գործառույթի միջոցով դուք կարող եք որոնել բոլոր մարդկանց, վայրերին և ապրանքանիշերին, որոնք հայտնվել են տեսանյութում և դիտել դրանց մասին մանրամասները, ներառյալ ժամային հատվածները, նկարագրությունները և Bing որոնման համակարգի հղումները՝ լրացուցիչ տեղեկությունների համար:
Շրջանակի հայտնաբերման մոդելը խմբագրի համար
Այս նոր ֆունկցիան ավելացնում է մի շարք «պիտակներ» JSON մանրամասների առանձին կադրերին կցված մետատվյալներին՝ ներկայացնելու դրանց խմբագրական տեսակը (օրինակ՝ լայն կադր, միջին կադր, մոտ պլան, էքստրեմալ մոտիկից, երկու կադր, բազմաթիվ մարդիկ։ , բացօթյա, փակ և այլն): Կադրերի տիպի այս բնութագրերը օգտակար են հոլովակների և թրեյլերների համար տեսահոլովակ խմբագրելիս կամ գեղարվեստական նպատակներով հատուկ նկարահանման ոճ փնտրելիս:
Ընդլայնված IPTC քարտեզագրման հատիկություն
Թեմայի հայտնաբերման մեր մոդելը որոշում է տեսանյութի թեման՝ հիմնված տառադարձման, օպտիկական նիշերի ճանաչման (OCR) և հայտնաբերված հայտնի մարդկանց վրա, նույնիսկ եթե թեման հստակորեն նշված չէ: Մենք քարտեզագրում ենք այս հայտնաբերված թեմաները չորս դասակարգման ոլորտներում՝ Wikipedia, Bing, IPTC և IAB: Այս բարելավումը թույլ է տալիս մեզ ներառել երկրորդ մակարդակի IPTC դասակարգումը:
Այս բարելավումներից օգտվելը նույնքան հեշտ է, որքան ձեր ընթացիկ Video Indexer գրադարանի վերաինդեքսավորումը:
Ուղիղ հեռարձակման նոր գործառույթ
Azure Media Services-ի նախադիտման մեջ մենք նաև առաջարկում ենք երկու նոր հնարավորություն ուղիղ հեռարձակման համար:
AI-ով աշխատող իրական ժամանակի տառադարձումը ուղիղ հեռարձակումը տեղափոխում է հաջորդ մակարդակ
Օգտագործելով Azure Media Services-ը ուղիղ հեռարձակման համար, այժմ կարող եք ստանալ ելքային հոսք, որը ներառում է ավտոմատ ստեղծվող տեքստային հետքեր՝ ի լրումն աուդիո և վիդեո բովանդակության: Տեքստը ստեղծվել է իրական ժամանակի աուդիո տառադարձման միջոցով՝ հիմնված արհեստական ինտելեկտի վրա: Հատուկ տեխնիկան կիրառվում է խոսքից տեքստ փոխակերպումից առաջ և հետո՝ արդյունքները բարելավելու համար: Տեքստային ուղին փաթեթավորված է IMSC1, TTML կամ WebVTT՝ կախված նրանից, թե արդյոք այն մատակարարվում է DASH, HLS CMAF կամ HLS TS:
Իրական ժամանակի գծի կոդավորում 24/7 OTT ալիքների համար
Օգտագործելով մեր v3 API-ները՝ դուք կարող եք ստեղծել, կառավարել և հեռարձակել OTT (ավելի քան վերև) ալիքներ և օգտագործել Azure Media Services-ի բոլոր այլ գործառույթները, ինչպիսիք են՝ կենդանի տեսանյութը ըստ պահանջի (VOD, տեսանյութ ըստ պահանջի), փաթեթավորում և թվային իրավունքների կառավարում ( DRM, թվային իրավունքների կառավարում):
Այս գործառույթների նախադիտման տարբերակները տեսնելու համար այցելեք
Փաթեթների արտադրության նոր հնարավորություններ
Աջակցություն աուդիո նկարագրության հետքերի համար
Հեռարձակվող ալիքներով հեռարձակվող բովանդակությունը հաճախ ունենում է աուդիո հետքեր՝ բանավոր բացատրություններով, թե ինչ է կատարվում էկրանին, ի հավելումն սովորական ձայնային ազդանշանի: Սա ծրագրերն ավելի հասանելի է դարձնում տեսողության խնդիրներ ունեցող դիտողների համար, հատկապես, եթե բովանդակությունը հիմնականում տեսողական է: Նոր
ID3 մետատվյալների տեղադրում
Հաճախորդի նվագարկիչին գովազդի կամ հատուկ մետատվյալների իրադարձությունների տեղադրումն ազդարարելու համար հեռարձակողները հաճախ օգտագործում են տեսանյութում ներկառուցված ժամանակի մետատվյալներ: Բացի SCTE-35 ազդանշանային ռեժիմներից, մենք այժմ նաև աջակցում ենք
Microsoft Azure-ի գործընկերները ցուցադրում են վերջնական լուծումներ
միջազգային ընկերություն
Source: www.habr.com