12 نيون Azure ميڊيا خدمتون مصنوعي ذهانت سان

Microsoft جو مشن هر ماڻهو ۽ تنظيم کي سيارو تي وڌيڪ حاصل ڪرڻ لاء بااختيار بڻائڻ آهي. ميڊيا انڊسٽري هن مشن کي حقيقت بڻائڻ جو هڪ بهترين مثال آهي. اسان هڪ دور ۾ رهون ٿا جتي وڌيڪ مواد ٺاهي ۽ استعمال ڪيو پيو وڃي، وڌيڪ طريقن سان ۽ وڌيڪ ڊوائيسز تي. IBC 2019 تي، اسان شيئر ڪري رهيا آهيون جديد جدت جنهن تي اسان ڪم ڪري رهيا آهيون ۽ اهي ڪيئن توهان جي ميڊيا جي تجربي کي تبديل ڪرڻ ۾ مدد ڪري سگهن ٿيون.
12 نيون Azure ميڊيا خدمتون مصنوعي ذهانت سان
ڪٽ جي هيٺان تفصيل!

هي صفحو تي آهي اسان جي ويب سائيٽ.

وڊيو Indexer ھاڻي متحرڪ ۽ گھڻ لساني مواد کي سپورٽ ڪري ٿو

گذريل سال IBC تي اسان اسان جو انعام کٽيو Azure ميڊيا سروسز ويڊيو انڊيڪسر، ۽ هن سال اهو اڃا به بهتر ٿي چڪو آهي. وڊيو انڊيڪسر خودڪار طريقي سان ميڊيا فائلن مان معلومات ۽ ميٽا ڊيٽا ڪڍي ٿو، جهڙوڪ ڳالهايل لفظ، چهرا، جذبات، موضوع ۽ برانڊز، ۽ ان کي استعمال ڪرڻ لاءِ توهان کي مشين لرننگ ماهر ٿيڻ جي ضرورت ناهي.

اسان جي تازي پيشڪش ۾ ٻه انتهائي گهربل ۽ مختلف خصوصيتن جا ڏيک شامل آهن- متحرڪ ڪردار جي سڃاڻپ ۽ گهڻ لساني تقرير جي نقل- سان گڏوگڏ موجوده ماڊلز ۾ ڪيترائي اضافا جيڪي اڄ موجود آهن وڊيو انڊيڪسر ۾.

متحرڪ ڪردار جي سڃاڻپ

12 نيون Azure ميڊيا خدمتون مصنوعي ذهانت سان
متحرڪ مواد مواد جي سڀ کان مشهور قسمن مان هڪ آهي، پر انساني چهرن کي سڃاڻڻ لاءِ ٺاهيل معياري ڪمپيوٽر ويزن ماڊل ان سان سٺو ڪم نه ٿا ڪن، خاص طور تي جيڪڏهن مواد انساني چهري جي خاصيتن کان سواءِ ڪردارن تي مشتمل هجي. نئون پريويو ورزن ويڊيو انڊيڪسر کي Microsoft جي Azure Custom Vision سروس سان گڏ ڪري ٿو، ماڊلز جو هڪ نئون سيٽ مهيا ڪري ٿو جيڪو پاڻمرادو ڳولي ٿو ۽ متحرڪ ڪردارن کي گروپ ڪري ٿو ۽ انٽيگريٽيڊ ڪسٽم ويزن ماڊل استعمال ڪندي انهن کي ليبل ڪرڻ ۽ سڃاڻڻ آسان بڻائي ٿو.

ماڊل هڪ واحد پائپ لائن ۾ ضم ٿيل آهن، ڪنهن کي ڪنهن به مشين جي سکيا جي ڄاڻ کان سواء خدمت استعمال ڪرڻ جي اجازت ڏئي ٿي. نتيجا دستياب آهن بغير ڪوڊ ويڊيو انڊيڪسر پورٽل يا REST API ذريعي توهان جي پنهنجي ايپليڪيشنن ۾ جلدي انضمام لاءِ.

اسان اهي ماڊل ٺاهيا آهن متحرڪ ڪردارن سان گڏ ڪم ڪرڻ لاءِ ڪجهه صارفين سان جيڪي تربيت ۽ جاچ لاءِ حقيقي متحرڪ مواد مهيا ڪن ٿا. نئين ڪارڪردگيءَ جو قدر چڱيءَ طرح بيان ڪيو ويو اينڊي گٽيرج، اسٽوڊيو ٽيڪنالاجي جي سينئر ڊائريڪٽر ۽ پوسٽ پروڊڪشن Viacom انٽرنيشنل ميڊيا نيٽ ورڪ تي، جيڪو ڊيٽا فراهم ڪندڙن مان هڪ هو: ”مضبوط AI-طاقتور متحرڪ مواد دريافت ڪرڻ جي اجازت ڏيندو. اسان کي اسان جي لائبريري مواد مان جلدي ۽ موثر طريقي سان ڪردار ميٽا ڊيٽا کي ڳولڻ ۽ فهرست ڪرڻ لاء.

سڀ کان وڌيڪ اهم، اهو اسان جي تخليقي ٽيمن کي فوري طور تي مواد ڳولڻ جي صلاحيت ڏيندو جنهن کي انهن جي ضرورت آهي، ميڊيا کي منظم ڪرڻ ۽ انهن کي تخليقيت تي ڌيان ڏيڻ جي اجازت ڏيڻ جي وقت کي گھٽائڻ.

توهان سان گڏ متحرڪ ڪردار جي سڃاڻپ سان واقف ٿيڻ شروع ڪري سگهو ٿا دستاويزي صفحا.

ڪيترن ئي ٻولين ۾ مواد جي سڃاڻپ ۽ ٽرانسپشن

ميڊيا جا ڪجهه وسيلا، جهڙوڪ خبرون، تاريخون ۽ انٽرويو، مختلف ٻوليون ڳالهائيندڙ ماڻهن جي رڪارڊنگ تي مشتمل آهي. گهڻيون موجود اسپيچ-ٽو-ٽيڪسٽ صلاحيتن لاءِ آواز جي سڃاڻپ جي ٻولي کي اڳ ۾ بيان ڪرڻ جي ضرورت آهي، ان کي گهڻ لساني وڊيوز کي نقل ڪرڻ ڏکيو بڻائي ٿو.

مختلف قسم جي مواد لاءِ اسان جي نئين خودڪار ڳالهائيندڙ ٻولي جي سڃاڻپ جي خاصيت ميڊيا اثاثن ۾ مليل ٻولين کي سڃاڻڻ لاءِ مشين لرننگ ٽيڪنالاجي استعمال ڪري ٿي. هڪ دفعو معلوم ٿئي ٿو، هر ٻولي جو ڀاڱو خودڪار طريقي سان مناسب ٻولي ۾ ٽرانسپشن جي عمل مان گذري ٿو، ۽ پوء سڀني حصن کي هڪ واحد گھڻ-ٻولي ٽرانسپشن فائل ۾ گڏ ڪيو ويو آهي.

12 نيون Azure ميڊيا خدمتون مصنوعي ذهانت سان

نتيجو وارو ٽرانسڪرپٽ وڊيو انڊيڪسر جي JSON آئوٽ جي حصي طور ۽ ذيلي عنوان فائلن جي طور تي دستياب آهي. آئوٽ پٽ ٽرانسڪرپٽ پڻ Azure ڳولا سان ضم ٿيل آهي، توهان کي فوري طور تي توهان جي وڊيوز ۾ مختلف ٻولين جي حصن کي ڳولڻ جي اجازت ڏئي ٿي. اضافي طور تي، گهڻ لساني ٽرانسڪرپشن موجود آهي جڏهن وڊيو انڊيڪسر پورٽل سان ڪم ڪري رهيا آهيو، تنهنڪري توهان ٽرانسڪرپٽ ۽ سڃاڻپ واري ٻولي کي وقت سان ڏسي سگهو ٿا، يا هر ٻوليءَ لاءِ وڊيو ۾ مخصوص هنڌن تي وڃو ۽ گهڻ لساني ٽرانسڪرپشن کي ڪيپشن طور ڏسو جيئن وڊيو هلندي آهي. توهان پورٹل ۽ API ذريعي حاصل ڪيل متن کي 54 دستياب ٻولين مان ڪنهن به ۾ ترجمو ڪري سگهو ٿا.

نئين گهڻ لساني مواد جي سڃاڻپ جي خصوصيت بابت وڌيڪ سکو ۽ وڊيو انڊيڪسر ۾ اهو ڪيئن استعمال ٿئي ٿو دستاويز پڙهو.

اضافي اپڊيٽ ۽ بهتر ماڊل

اسان وڊيو انڊيڪسر ۾ نوان ماڊل پڻ شامل ڪري رهيا آهيون ۽ موجوده ماڊلز کي بهتر ڪري رهيا آهيون، جنهن ۾ هيٺ بيان ڪيل شامل آهن.

ماڻهن ۽ جڳهن سان لاڳاپيل ادارن کي ڪڍڻ

اسان اسان جي موجوده برانڊ دريافت ڪرڻ جي صلاحيت کي وڌايو آهي مشهور نالن ۽ جڳهن کي شامل ڪرڻ لاء، جهڙوڪ پئرس ۾ ايفل ٽاور ۽ لنڊن ۾ بگ بين. جڏهن اهي ٺاهيل ٽرانسڪرپٽ ۾ ظاهر ٿيندا آهن يا اسڪرين تي نظريي جي سڃاڻپ (OCR) استعمال ڪندي، لاڳاپيل معلومات شامل ڪئي وئي آهي. ھن نئين خصوصيت سان، توھان انھن سڀني ماڻھن، جڳھن ۽ برانڊن کي ڳولي سگھو ٿا جيڪي ھڪڙي وڊيو ۾ ظاهر ٿيا آھن ۽ انھن بابت تفصيل ڏسي سگھو ٿا، بشمول ٽائم سلاٽ، تفصيل، ۽ وڌيڪ معلومات لاءِ Bing سرچ انجڻ جا لنڪ.

12 نيون Azure ميڊيا خدمتون مصنوعي ذهانت سان

ايڊيٽر لاءِ فريم ڳولڻ وارو ماڊل

هي نئون فيچر JSON تفصيلن ۾ انفرادي فريم سان ڳنڍيل ميٽا ڊيٽا ۾ "ٽيگ" جو هڪ سيٽ شامل ڪري ٿو انهن جي ادارتي قسم جي نمائندگي ڪرڻ لاءِ (مثال طور، وسيع شاٽ، وچولي شاٽ، بند اپ، انتهائي ويجهي اپ، ٻه شاٽ، گهڻا ماڻهو. ، ٻاهران، اندر، وغيره). اهي شاٽ قسم جون خاصيتون ڪارائتيون آهن جڏهن ڪلپس ۽ ٽريلر لاءِ وڊيو ايڊيٽنگ ڪرڻ، يا جڏهن فنڪارانه مقصدن لاءِ هڪ مخصوص شاٽ انداز ڳولي رهيا آهيو.

12 نيون Azure ميڊيا خدمتون مصنوعي ذهانت سان
وڌيڪ سکو ويڊيو انڊيڪسر ۾ فريم جي قسم جي سڃاڻپ.

وڌايل IPTC ميپنگ گرينولرٽي

اسان جو موضوع معلوم ڪرڻ وارو ماڊل ٽرانسڪرپشن، آپٽيڪل ڪيڪٽر ريڪگنيشن (OCR) ۽ معلوم ڪيل مشهور شخصيتن جي بنياد تي وڊيو جو موضوع طئي ڪري ٿو، جيتوڻيڪ موضوع واضح طور تي بيان نه ڪيو ويو آهي. اسان انهن دريافت ڪيل عنوانن کي چار درجه بندي وارن علائقن ڏانهن نقشي ۾ ترتيب ڏيون ٿا: وڪيپيڊيا، Bing، IPTC، ۽ IAB. هي واڌارو اسان کي ٻئي سطح جي IPTC درجه بندي شامل ڪرڻ جي اجازت ڏئي ٿو.
انهن سڌارن جو فائدو وٺڻ جيترو آسان آهي جيترو توهان جي موجوده وڊيو انڊيڪسر لائبريري کي ٻيهر ترتيب ڏيڻ.

نئين لائيو اسٽريمنگ ڪارڪردگي

Azure ميڊيا سروسز جي ڏيک ۾، اسان پڻ پيش ڪري رهيا آهيون ٻه نيون خاصيتون لائيو اسٽريمنگ لاءِ.

AI-طاقتور حقيقي وقت ٽرانسپشن لائيو اسٽريمنگ کي ايندڙ سطح تي وٺي ٿي

لائيو اسٽريمنگ لاءِ Azure ميڊيا سروسز استعمال ڪندي، توھان ھاڻي حاصل ڪري سگھوٿا ھڪڙو آئوٽ اسٽريم جنھن ۾ آڊيو ۽ وڊيو مواد کان علاوه خود بخود ٺاھيل ٽيڪسٽ ٽريڪ شامل آھي. متن مصنوعي ذهانت جي بنياد تي حقيقي وقت آڊيو ٽرانسپشن استعمال ڪندي ٺاهيو ويو آهي. نتيجن کي بهتر ڪرڻ لاءِ تقرير کان متن جي تبديلي کان اڳ ۽ بعد ۾ ڪسٽم ٽيڪنڪ لاڳو ٿينديون آهن. ٽيڪسٽ ٽريڪ IMSC1، TTML يا WebVTT ۾ پيڪيج ٿيل آهي، ان تي منحصر آهي ته ڇا اهو DASH، HLS CMAF يا HLS TS ۾ فراهم ڪيو ويو آهي.

24/7 OTT چينلز لاءِ حقيقي وقت واري لائن انڪوڊنگ

اسان جي v3 APIs استعمال ڪندي، توهان OTT (اوور-دي-ٽاپ) چينلز ٺاهي، منظم ۽ نشر ڪري سگهو ٿا، ۽ ٻيون سڀئي Azure ميڊيا سروسز استعمال ڪري سگهو ٿا جهڙوڪ لائيو وڊيو آن ڊيمانڊ (VOD، وڊيو آن ڊيمانڊ)، پيڪنگنگ ۽ ڊجيٽل حقن جو انتظام ( DRM، ڊجيٽل حقن جو انتظام).
انهن خاصيتن جا ڏيک ورجن ڏسڻ لاءِ، دورو ڪريو Azure ميڊيا سروسز ڪميونٽي.

12 نيون Azure ميڊيا خدمتون مصنوعي ذهانت سان

نئون پيڪيج پيدا ڪرڻ جي صلاحيت

آڊيو وضاحت جي ٽريڪ لاء سپورٽ

براڊڪاسٽ چينلز تي نشر ڪيل مواد اڪثر ڪري هڪ آڊيو ٽريڪ هوندو آهي زباني وضاحت سان ته اسڪرين تي ڇا ٿي رهيو آهي باقاعده آڊيو سگنل کان علاوه. هي پروگرامن کي بصري طور تي متاثر ٿيل ناظرين تائين وڌيڪ رسائي لائق بڻائي ٿو، خاص طور تي جيڪڏهن مواد بنيادي طور تي بصري آهي. نئون آڊيو وضاحت فنڪشن توهان کي اجازت ڏئي ٿو ته آڊيو ٽريڪز مان هڪ کي هڪ آڊيو تفصيل ٽريڪ (AD، آڊيو وضاحت) جي طور تي بيان ڪرڻ جي، رانديگرن کي اجازت ڏئي ٿي ته AD ٽريڪ کي ناظرین لاءِ دستياب بڻائي.

ID3 ميٽا ڊيٽا داخل ڪرڻ

ڪلائنٽ جي پليئر تي اشتهارن يا ڪسٽم ميٽاداٽا واقعن جي داخل ٿيڻ کي سگنل ڏيڻ لاءِ، براڊڪاسٽر اڪثر وڊيو ۾ شامل ڪيل ٽائيم ميٽاداٽا استعمال ڪندا آهن. SCTE-35 سگنلنگ موڊس کان علاوه، اسان ھاڻي پڻ سپورٽ ڪريون ٿا ID3v2 ۽ ٻيون ڪسٽم اسڪيمون، ڪلائنٽ ايپليڪيشن پاران استعمال لاءِ ايپليڪيشن ڊولپر پاران وضاحت ڪئي وئي آهي.

Microsoft Azure ڀائيوارن جي آخر کان آخر تائين حل جو مظاهرو ڪيو

بٽموف متعارف ڪرايو Bitmovin وڊيو انڪوڊنگ ۽ Bitmovin وڊيو پليئر Microsoft Azure لاءِ. گراهڪ ھاڻي انھن انڪوڊنگ ۽ پلے آئوٽ حلن کي Azure ۾ استعمال ڪري سگھن ٿا ۽ ترقي يافته خصوصيتن مان فائدو حاصل ڪري سگھن ٿا جھڙوڪ ٽي اسٽيج انڪوڊنگ، AV1/VC ڪوڊيڪ سپورٽ، گھڻ لساني ذيلي عنوان، ۽ QoS، اشتهارن، ۽ وڊيو ٽريڪنگ لاءِ اڳ-انٽيگريٽيڊ وڊيو اينالائيٽڪس.

سدابهار Azure تي ان جي يوزر لائف سائيڪل مينيجمينٽ پليٽ فارم کي ڏيکاري ٿو. آمدني ۽ ڪسٽمر لائف سائيڪل مئنيجمينٽ حل جي هڪ معروف فراهم ڪندڙ جي طور تي، ايورجنٽ استعمال ڪري ٿو Azure AI پريميئم تفريحي فراهم ڪندڙن جي مدد ڪرڻ لاءِ گراهڪ جي حصول ۽ برقرار رکڻ کي بهتر بڻائڻ لاءِ ٽارگيٽ سروس پيڪيجز ۽ پيشڪش ٺاهي ڪري گراهڪ لائف سائيڪل ۾ نازڪ نقطن تي.

حويزن ڏيکاريندو ان جي ذهين ڪلائوڊ بيسڊ ميڊيا روٽنگ سروس، SRT Hub، جيڪا گراهڪ جي مدد ڪري ٿي آخر کان آخر تائين ڪم جي فلوز کي تبديل ڪندي Azure ڊيٽا باڪس ايج ۽ Avid، Telestream، Wowza، Cinegy ۽ Make.tv کان Hublets سان ڪم جي فلوز کي تبديل ڪرڻ.

ايس ايس پنهنجي سيٽلائيٽ ۽ منظم ميڊيا سروسز گراهڪن لاءِ Azure پليٽ فارم تي براڊڪاسٽ گريڊ ميڊيا سروسز جو هڪ سوٽ تيار ڪيو آهي. SES مڪمل طور تي منظم پلے آئوٽ سروسز لاءِ حل ڏيکاريندو، بشمول ماسٽر پلے آئوٽ، لوڪلائزڊ پلے آئوٽ، اشتهار دريافت ۽ متبادل، ۽ Azure تي اعليٰ معيار جي حقيقي وقت 24x7 ملٽي چينل انڪوڊنگ.

هم وقت ساز لفظ آسان بادل اوزار ۽ دستخط آٽوميشن ٽيڪنالاجي کي Azure تي دستياب بڻائي ٿو. اهي آڇون ميڊيا جي تنظيمن لاءِ خودڪار طور تي ذيلي ٽائيٽل شامل ڪرڻ آسان بڻائينديون، بشمول غير ملڪي ٻولي جا ذيلي عنوان، Azure تي سندن لائيو ۽ آف لائن وڊيو ورڪ فلوز ۾.
بين الاقوامي ڪمپني تاتا ايلڪسسي، هڪ ٽيڪنالاجي سروسز ڪمپني، پنهنجي OTT SaaS پليٽ فارم TEPlay کي Azure ميڊيا سروسز ۾ ضم ڪيو آهي ته جيئن ڪلائوڊ مان OTT مواد پهچائڻ لاءِ. Tata Elxsi پڻ آندو آهي Falcon Eye معيار جو تجربو (QoE) مانيٽرنگ حل Microsoft Azure لاءِ، مهيا ڪرڻ لاءِ تجزياتي ۽ ميٽرڪس فيصلا ڪرڻ.

ويزز ميڊيا پنهنجي اسٽريمنگ پليٽ فارم کي Azure تي بيٽا رليز طور دستياب ڪري رهيو آهي. Verizon ميڊيا پليٽ فارم هڪ انٽرنيشنل-گريڊ منظم OTT حل آهي جنهن ۾ شامل آهي DRM، اشتهار داخل ڪرڻ، هڪ کان هڪ ذاتي سيشن، متحرڪ مواد جي متبادل، ۽ وڊيو پهچائڻ. انضمام ڪم جي وهڪري کي آسان بڻائي ٿو، عالمي مدد ۽ پيماني تي، ۽ Azure ۾ مليل ڪجھ منفرد صلاحيتن کي انلاڪ ڪري ٿو.

جو ذريعو: www.habr.com

تبصرو شامل ڪريو