මයික්රොසොෆ්ට් හි මෙහෙවර වන්නේ ග්රහලෝකයේ සිටින සෑම පුද්ගලයෙකුටම සහ සංවිධානයකට වැඩි යමක් ලබා ගැනීමට බලගැන්වීමයි. මෙම මෙහෙවර යථාර්ථයක් බවට පත්කිරීමට මාධ්ය කර්මාන්තය කදිම නිදසුනකි. අපි ජීවත් වන්නේ වැඩි ක්රමවලින් සහ තවත් උපාංගවල වැඩි අන්තර්ගතයක් නිර්මාණය කර පරිභෝජනය කරන යුගයක ය. IBC 2019 හිදී, අපි වැඩ කරමින් සිටින නවතම නවෝත්පාදනයන් සහ ඒවා ඔබේ මාධ්ය අත්දැකීම පරිවර්තනය කිරීමට උපකාරී වන ආකාරය බෙදා ගත්තෙමු.
කප්පාදුව යටතේ විස්තර!
මෙම පිටුව ක්රියාත්මකයි
වීඩියෝ දර්ශක දැන් සජීවිකරණ සහ බහුභාෂා අන්තර්ගතයට සහය දක්වයි
පසුගිය වසරේ IBC හි අපි අපගේ සම්මානලාභී විය
අපගේ නවතම පිරිනැමීම්වලට ඉහළ ඉල්ලුමක් ඇති සහ වෙනස් වූ විශේෂාංග දෙකක පෙරදසුන් ඇතුළත් වේ—සජීවිකරණ අක්ෂර හඳුනාගැනීම සහ බහුභාෂා කථන පිටපත් කිරීම—එමෙන්ම වීඩියෝ දර්ශක තුළ අද පවතින මාදිලිවලට එකතු කිරීම් කිහිපයක්.
සජීවිකරණ චරිත හඳුනාගැනීම
සජීවිකරණ අන්තර්ගතය යනු වඩාත් ජනප්රිය අන්තර්ගත වර්ගයකි, නමුත් මිනිස් මුහුණු හඳුනා ගැනීමට නිර්මාණය කර ඇති සම්මත පරිගණක දෘෂ්ඨි ආකෘති එය සමඟ හොඳින් ක්රියා නොකරයි, විශේෂයෙන්ම අන්තර්ගතයේ මිනිස් මුහුණේ ලක්ෂණ නොමැති අක්ෂර තිබේ නම්. නව පෙරදසුන් අනුවාදය Microsoft හි Azure Custom Vision සේවාව සමඟ වීඩියෝ දර්ශක ඒකාබද්ධ කරයි, සජීවිකරණ අක්ෂර ස්වයංක්රීයව හඳුනාගෙන සමූහගත කරන සහ ඒකාබද්ධ අභිරුචි දර්ශන ආකෘති භාවිතයෙන් ලේබල් කිරීමට සහ හඳුනා ගැනීමට පහසු කරන නව මාදිලි කට්ටලයක් ලබා දෙයි.
මාදිලි තනි නල මාර්ගයකට ඒකාබද්ධ කර ඇති අතර, ඕනෑම කෙනෙකුට යන්ත්ර ඉගෙනීමේ දැනුමකින් තොරව සේවාව භාවිතා කිරීමට ඉඩ සලසයි. ප්රතිඵල කේත රහිත වීඩියෝ දර්ශක ද්වාරයක් හරහා හෝ REST API හරහා ඔබේම යෙදුම් වෙත ඉක්මන් ඒකාබද්ධ කිරීම සඳහා ලබා ගත හැක.
පුහුණු කිරීම සහ පරීක්ෂා කිරීම සඳහා සැබෑ සජීවිකරණ අන්තර්ගතයන් ලබා දුන් සමහර පාරිභෝගිකයින් සමඟ සජීවිකරණ අක්ෂර සමඟ වැඩ කිරීමට අපි මෙම ආකෘති ගොඩනඟා ඇත්තෙමු. දත්ත සපයන්නන්ගෙන් එක් අයෙකු වූ Viacom International Media Networks හි චිත්රාගාර තාක්ෂණ හා පශ්චාත් නිෂ්පාදන ජ්යෙෂ්ඨ අධ්යක්ෂ Andy Gutterridge විසින් නව ක්රියාකාරීත්වයේ වටිනාකම මනාව සාරාංශ කර ඇත: “ශක්තිමත් AI බලයෙන් ක්රියාත්මක වන සජීවිකරණ අන්තර්ගත සොයාගැනීම් එකතු කිරීම ඉඩ සලසයි. අපගේ පුස්තකාල අන්තර්ගතයෙන් අක්ෂර පාර-දත්ත ඉක්මනින් හා කාර්යක්ෂමව සොයා ගැනීමට සහ ලැයිස්තුගත කිරීමට අපට.
වැදගත්ම දෙය නම්, එය අපගේ නිර්මාණශීලී කණ්ඩායම්වලට ඔවුන්ට අවශ්ය අන්තර්ගතය ක්ෂණිකව සොයා ගැනීමේ හැකියාව ලබා දීම, මාධ්ය කළමනාකරණය කිරීමට ගතවන කාලය අවම කිරීම සහ නිර්මාණශීලීත්වය කෙරෙහි අවධානය යොමු කිරීමට ඔවුන්ට ඉඩ සලසයි.
ඔබට සජීවිකරණ චරිත හඳුනාගැනීම සමඟ දැන හඳුනා ගැනීම ආරම්භ කළ හැකිය
බහු භාෂාවලින් අන්තර්ගත හඳුනා ගැනීම සහ පිටපත් කිරීම
ප්රවෘත්ති, වංශකතා සහ සම්මුඛ සාකච්ඡා වැනි සමහර මාධ්ය සම්පත්වල විවිධ භාෂා කතා කරන පුද්ගලයින්ගේ පටිගත කිරීම් අඩංගු වේ. පවතින බොහෝ කථනයෙන් පෙළ හැකියාවන් සඳහා ශ්රව්ය හඳුනාගැනීමේ භාෂාව කල්තියා නියම කිරීම අවශ්ය වන අතර, එය බහුභාෂා වීඩියෝ පිටපත් කිරීම දුෂ්කර කරයි.
විවිධ වර්ගයේ අන්තර්ගත සඳහා අපගේ නව ස්වයංක්රීය කථන භාෂා හඳුනාගැනීමේ විශේෂාංගය මාධ්ය වත්කම්වල ඇති භාෂා හඳුනා ගැනීමට යන්ත්ර ඉගෙනුම් තාක්ෂණය භාවිත කරයි. අනාවරණය කරගත් පසු, සෑම භාෂා ඛණ්ඩයක්ම සුදුසු භාෂාවෙන් පිටපත් කිරීමේ ක්රියාවලියක් හරහා ස්වයංක්රීයව ගමන් කරයි, පසුව සියලුම කොටස් තනි බහු භාෂා පිටපත් කිරීමේ ගොනුවකට ඒකාබද්ධ වේ.
ප්රතිඵලයක් ලෙස ලැබෙන පිටපත වීඩියෝ දර්ශකයේ JSON ප්රතිදානයේ කොටසක් ලෙස සහ උපසිරැසි ගොනු ලෙස ලබා ගත හැක. ප්රතිදාන පිටපත Azure Search සමඟ ද ඒකාබද්ධ කර ඇති අතර, ඔබේ වීඩියෝවල විවිධ භාෂා කොටස් සඳහා වහාම සෙවීමට ඔබට ඉඩ සලසයි. මීට අමතරව, වීඩියෝ දර්ශක ද්වාරය සමඟ වැඩ කරන විට බහුභාෂා පිටපත් කිරීම ලබා ගත හැකිය, එබැවින් ඔබට කාලයත් සමඟ පිටපත සහ හඳුනාගත් භාෂාව බැලීමට හැකිය, නැතහොත් එක් එක් භාෂාව සඳහා වීඩියෝවේ නිශ්චිත ස්ථාන වෙත ගොස් වීඩියෝව වාදනය වන විට සිරස්තල ලෙස බහුභාෂා පිටපත් කිරීම බලන්න. ඔබට ලැබුණු පෙළ ද්වාරය සහ API හරහා පවතින භාෂා 54 න් ඕනෑම එකකට පරිවර්තනය කළ හැකිය.
නව බහුභාෂා අන්තර්ගත හඳුනාගැනීමේ විශේෂාංගය සහ එය Video Indexer හි භාවිත වන ආකාරය ගැන තව දැන ගන්න
අතිරේක යාවත්කාලීන සහ වැඩිදියුණු කළ ආකෘති
අපි වීඩියෝ දර්ශක වෙත නව මාදිලි එකතු කරන අතර පහත විස්තර කර ඇති ඒවා ඇතුළුව පවතින ඒවා වැඩිදියුණු කරන්නෙමු.
පුද්ගලයන් සහ ස්ථාන හා සම්බන්ධ ආයතන උපුටා ගැනීම
පැරිසියේ අයිෆල් කුළුණ සහ ලන්ඩනයේ බිග් බෙන් වැනි සුප්රසිද්ධ නම් සහ ස්ථාන ඇතුළත් කිරීමට අපි අපගේ පවතින සන්නාම සොයාගැනීමේ හැකියාවන් පුළුල් කර ඇත්තෙමු. ඒවා ජනනය කරන ලද පිටපතෙහි හෝ දෘශ්ය අක්ෂර හඳුනාගැනීම (OCR) භාවිතයෙන් තිරය මත දිස්වන විට, අදාළ තොරතුරු එකතු වේ. මෙම නව විශේෂාංගය සමඟින්, ඔබට වීඩියෝවක දිස් වූ සියලුම පුද්ගලයින්, ස්ථාන සහ වෙළඳ නාම සෙවීමට සහ වැඩි විස්තර සඳහා Bing සෙවුම් යන්ත්රය වෙත කාල පරාසයන්, විස්තර සහ සබැඳි ඇතුළුව ඒවා පිළිබඳ විස්තර බැලීමට හැකිය.
සංස්කාරක සඳහා රාමු හඳුනාගැනීමේ ආකෘතිය
මෙම නව විශේෂාංගය ඔවුන්ගේ කතුවැකි වර්ගය (උදාහරණයක් ලෙස, පුළුල් වෙඩි තැබීම, මධ්යම වෙඩි තැබීම, සමීප වීම, අතිශය සමීප වීම, වෙඩි තැබීම් දෙකක්, බහු පුද්ගලයින්) නියෝජනය කිරීම සඳහා JSON විස්තරවල තනි රාමුවලට අමුණා ඇති පාරදත්ත වෙත "ටැග්" කට්ටලයක් එක් කරයි. , එළිමහන්, ගෘහස්ථ, ආදිය). ක්ලිප් සහ ට්රේලර් සඳහා වීඩියෝ සංස්කරණය කිරීමේදී හෝ කලාත්මක අරමුණු සඳහා නිශ්චිත වෙඩි තැබීමේ විලාසයක් සොයන විට මෙම වෙඩි වර්ග ලක්ෂණ ප්රයෝජනවත් වේ.
වැඩි දියුණු කළ IPTC සිතියම් කැටිති
අපගේ මාතෘකා හඳුනාගැනීමේ ආකෘතිය, මාතෘකාව පැහැදිලිව සඳහන් කර නොමැති වුවද, පිටපත් කිරීම, දෘශ්ය අක්ෂර හඳුනාගැනීම (OCR) සහ අනාවරණය කරගත් ප්රසිද්ධ පුද්ගලයින් මත පදනම්ව වීඩියෝවක මාතෘකාව තීරණය කරයි. අපි මෙම අනාවරණය කරගත් මාතෘකා වර්ගීකරණ ක්ෂේත්ර හතරකට සිතියම්ගත කරමු: Wikipedia, Bing, IPTC, සහ IAB. මෙම වැඩිදියුණු කිරීම අපට දෙවන මට්ටමේ IPTC වර්ගීකරණය ඇතුළත් කිරීමට ඉඩ සලසයි.
මෙම වැඩිදියුණු කිරීම් වලින් ප්රයෝජන ගැනීම ඔබගේ වත්මන් වීඩියෝ දර්ශක පුස්තකාලය නැවත සුචිගත කිරීම තරම් පහසු වේ.
නව සජීවී ප්රවාහ ක්රියාකාරිත්වය
Azure Media Services පෙරදසුන තුළ, අපි සජීවී ප්රවාහය සඳහා නව විශේෂාංග දෙකක් ද පිරිනමන්නෙමු.
AI බලයෙන් ක්රියාත්මක වන තත්ය කාලීන පිටපත් කිරීම සජීවී ප්රවාහය ඊළඟ මට්ටමට ගෙන යයි
සජීවී ප්රවාහය සඳහා Azure මාධ්ය සේවා භාවිතා කරමින්, ඔබට දැන් ශ්රව්ය සහ දෘශ්ය අන්තර්ගතයට අමතරව ස්වයංක්රීයව ජනනය කරන ලද පෙළ පථයක් ඇතුළත් ප්රතිදාන ප්රවාහයක් ලබා ගත හැකිය. කෘතිම බුද්ධිය මත පදනම් වූ තත්ය කාලීන ශ්රව්ය පිටපත් කිරීම භාවිතයෙන් පෙළ නිර්මාණය කර ඇත. ප්රතිඵල වැඩි දියුණු කිරීම සඳහා කථනයෙන් පෙළට පරිවර්තනය කිරීමට පෙර සහ පසු අභිරුචි ශිල්පීය ක්රම යොදනු ලැබේ. පෙළ ධාවන පථය DASH, HLS CMAF හෝ HLS TS හි සපයන්නේද යන්න මත පදනම්ව, IMSC1, TTML හෝ WebVTT ඇසුරුම් කර ඇත.
24/7 OTT නාලිකා සඳහා තත්ය කාලීන රේඛා කේතනය
අපගේ v3 API භාවිතා කරමින්, ඔබට OTT (ඉහළින්) නාලිකා නිර්මාණය කිරීමට, කළමනාකරණය කිරීමට සහ විකාශනය කිරීමට සහ ඉල්ලුම මත සජීවී වීඩියෝ (VOD, ඉල්ලුම මත වීඩියෝ), ඇසුරුම්කරණය සහ ඩිජිටල් හිමිකම් කළමනාකරණය වැනි අනෙකුත් සියලුම Azure මාධ්ය සේවා විශේෂාංග භාවිතා කළ හැක ( DRM, ඩිජිටල් හිමිකම් කළමනාකරණය).
මෙම විශේෂාංගවල පෙරදසුන් අනුවාද බැලීමට, පිවිසෙන්න
නව පැකේජ උත්පාදන හැකියාවන්
ශ්රව්ය විස්තර ඛණ්ඩ සඳහා සහාය
විකාශන නාලිකා හරහා විකාශනය වන අන්තර්ගත විකාශනය බොහෝ විට සාමාන්ය ශ්රව්ය සංඥාවට අමතරව තිරය මත සිදුවන දේ පිළිබඳ වාචික පැහැදිලි කිරීම් සහිත ශ්රව්ය පථයක් ඇත. මෙය දෘශ්යාබාධිත නරඹන්නන්ට වැඩසටහන් වඩාත් ප්රවේශ විය හැකි කරයි, විශේෂයෙන් අන්තර්ගතය මූලික වශයෙන් දෘශ්ය නම්. අලුත්
ID3 පාරදත්ත ඇතුල් කරමින්
සේවාලාභියාගේ ප්ලේයර් වෙත වෙළඳ දැන්වීම් හෝ අභිරුචි පාරදත්ත සිදුවීම් ඇතුළත් කිරීම සංඥා කිරීම සඳහා, විකාශකයින් බොහෝ විට වීඩියෝවේ කාවැදී ඇති කාලානුරූපී පාර-දත්ත භාවිතා කරයි. SCTE-35 සංඥා මාදිලි වලට අමතරව, අපි දැන් සහය දෙමු
Microsoft Azure හවුල්කරුවන් අවසානයේ සිට අවසානය දක්වා විසඳුම් පෙන්වයි
ජාත්යන්තර සමාගම
මූලාශ්රය: www.habr.com