Microsoft جو مشن هر ماڻهو ۽ تنظيم کي سيارو تي وڌيڪ حاصل ڪرڻ لاء بااختيار بڻائڻ آهي. ميڊيا انڊسٽري هن مشن کي حقيقت بڻائڻ جو هڪ بهترين مثال آهي. اسان هڪ دور ۾ رهون ٿا جتي وڌيڪ مواد ٺاهي ۽ استعمال ڪيو پيو وڃي، وڌيڪ طريقن سان ۽ وڌيڪ ڊوائيسز تي. IBC 2019 تي، اسان شيئر ڪري رهيا آهيون جديد جدت جنهن تي اسان ڪم ڪري رهيا آهيون ۽ اهي ڪيئن توهان جي ميڊيا جي تجربي کي تبديل ڪرڻ ۾ مدد ڪري سگهن ٿيون.
ڪٽ جي هيٺان تفصيل!
هي صفحو تي آهي
وڊيو Indexer ھاڻي متحرڪ ۽ گھڻ لساني مواد کي سپورٽ ڪري ٿو
گذريل سال IBC تي اسان اسان جو انعام کٽيو
اسان جي تازي پيشڪش ۾ ٻه انتهائي گهربل ۽ مختلف خصوصيتن جا ڏيک شامل آهن- متحرڪ ڪردار جي سڃاڻپ ۽ گهڻ لساني تقرير جي نقل- سان گڏوگڏ موجوده ماڊلز ۾ ڪيترائي اضافا جيڪي اڄ موجود آهن وڊيو انڊيڪسر ۾.
متحرڪ ڪردار جي سڃاڻپ
متحرڪ مواد مواد جي سڀ کان مشهور قسمن مان هڪ آهي، پر انساني چهرن کي سڃاڻڻ لاءِ ٺاهيل معياري ڪمپيوٽر ويزن ماڊل ان سان سٺو ڪم نه ٿا ڪن، خاص طور تي جيڪڏهن مواد انساني چهري جي خاصيتن کان سواءِ ڪردارن تي مشتمل هجي. نئون پريويو ورزن ويڊيو انڊيڪسر کي Microsoft جي Azure Custom Vision سروس سان گڏ ڪري ٿو، ماڊلز جو هڪ نئون سيٽ مهيا ڪري ٿو جيڪو پاڻمرادو ڳولي ٿو ۽ متحرڪ ڪردارن کي گروپ ڪري ٿو ۽ انٽيگريٽيڊ ڪسٽم ويزن ماڊل استعمال ڪندي انهن کي ليبل ڪرڻ ۽ سڃاڻڻ آسان بڻائي ٿو.
ماڊل هڪ واحد پائپ لائن ۾ ضم ٿيل آهن، ڪنهن کي ڪنهن به مشين جي سکيا جي ڄاڻ کان سواء خدمت استعمال ڪرڻ جي اجازت ڏئي ٿي. نتيجا دستياب آهن بغير ڪوڊ ويڊيو انڊيڪسر پورٽل يا REST API ذريعي توهان جي پنهنجي ايپليڪيشنن ۾ جلدي انضمام لاءِ.
اسان اهي ماڊل ٺاهيا آهن متحرڪ ڪردارن سان گڏ ڪم ڪرڻ لاءِ ڪجهه صارفين سان جيڪي تربيت ۽ جاچ لاءِ حقيقي متحرڪ مواد مهيا ڪن ٿا. نئين ڪارڪردگيءَ جو قدر چڱيءَ طرح بيان ڪيو ويو اينڊي گٽيرج، اسٽوڊيو ٽيڪنالاجي جي سينئر ڊائريڪٽر ۽ پوسٽ پروڊڪشن Viacom انٽرنيشنل ميڊيا نيٽ ورڪ تي، جيڪو ڊيٽا فراهم ڪندڙن مان هڪ هو: ”مضبوط AI-طاقتور متحرڪ مواد دريافت ڪرڻ جي اجازت ڏيندو. اسان کي اسان جي لائبريري مواد مان جلدي ۽ موثر طريقي سان ڪردار ميٽا ڊيٽا کي ڳولڻ ۽ فهرست ڪرڻ لاء.
سڀ کان وڌيڪ اهم، اهو اسان جي تخليقي ٽيمن کي فوري طور تي مواد ڳولڻ جي صلاحيت ڏيندو جنهن کي انهن جي ضرورت آهي، ميڊيا کي منظم ڪرڻ ۽ انهن کي تخليقيت تي ڌيان ڏيڻ جي اجازت ڏيڻ جي وقت کي گھٽائڻ.
توهان سان گڏ متحرڪ ڪردار جي سڃاڻپ سان واقف ٿيڻ شروع ڪري سگهو ٿا
ڪيترن ئي ٻولين ۾ مواد جي سڃاڻپ ۽ ٽرانسپشن
ميڊيا جا ڪجهه وسيلا، جهڙوڪ خبرون، تاريخون ۽ انٽرويو، مختلف ٻوليون ڳالهائيندڙ ماڻهن جي رڪارڊنگ تي مشتمل آهي. گهڻيون موجود اسپيچ-ٽو-ٽيڪسٽ صلاحيتن لاءِ آواز جي سڃاڻپ جي ٻولي کي اڳ ۾ بيان ڪرڻ جي ضرورت آهي، ان کي گهڻ لساني وڊيوز کي نقل ڪرڻ ڏکيو بڻائي ٿو.
مختلف قسم جي مواد لاءِ اسان جي نئين خودڪار ڳالهائيندڙ ٻولي جي سڃاڻپ جي خاصيت ميڊيا اثاثن ۾ مليل ٻولين کي سڃاڻڻ لاءِ مشين لرننگ ٽيڪنالاجي استعمال ڪري ٿي. هڪ دفعو معلوم ٿئي ٿو، هر ٻولي جو ڀاڱو خودڪار طريقي سان مناسب ٻولي ۾ ٽرانسپشن جي عمل مان گذري ٿو، ۽ پوء سڀني حصن کي هڪ واحد گھڻ-ٻولي ٽرانسپشن فائل ۾ گڏ ڪيو ويو آهي.
نتيجو وارو ٽرانسڪرپٽ وڊيو انڊيڪسر جي JSON آئوٽ جي حصي طور ۽ ذيلي عنوان فائلن جي طور تي دستياب آهي. آئوٽ پٽ ٽرانسڪرپٽ پڻ Azure ڳولا سان ضم ٿيل آهي، توهان کي فوري طور تي توهان جي وڊيوز ۾ مختلف ٻولين جي حصن کي ڳولڻ جي اجازت ڏئي ٿي. اضافي طور تي، گهڻ لساني ٽرانسڪرپشن موجود آهي جڏهن وڊيو انڊيڪسر پورٽل سان ڪم ڪري رهيا آهيو، تنهنڪري توهان ٽرانسڪرپٽ ۽ سڃاڻپ واري ٻولي کي وقت سان ڏسي سگهو ٿا، يا هر ٻوليءَ لاءِ وڊيو ۾ مخصوص هنڌن تي وڃو ۽ گهڻ لساني ٽرانسڪرپشن کي ڪيپشن طور ڏسو جيئن وڊيو هلندي آهي. توهان پورٹل ۽ API ذريعي حاصل ڪيل متن کي 54 دستياب ٻولين مان ڪنهن به ۾ ترجمو ڪري سگهو ٿا.
نئين گهڻ لساني مواد جي سڃاڻپ جي خصوصيت بابت وڌيڪ سکو ۽ وڊيو انڊيڪسر ۾ اهو ڪيئن استعمال ٿئي ٿو
اضافي اپڊيٽ ۽ بهتر ماڊل
اسان وڊيو انڊيڪسر ۾ نوان ماڊل پڻ شامل ڪري رهيا آهيون ۽ موجوده ماڊلز کي بهتر ڪري رهيا آهيون، جنهن ۾ هيٺ بيان ڪيل شامل آهن.
ماڻهن ۽ جڳهن سان لاڳاپيل ادارن کي ڪڍڻ
اسان اسان جي موجوده برانڊ دريافت ڪرڻ جي صلاحيت کي وڌايو آهي مشهور نالن ۽ جڳهن کي شامل ڪرڻ لاء، جهڙوڪ پئرس ۾ ايفل ٽاور ۽ لنڊن ۾ بگ بين. جڏهن اهي ٺاهيل ٽرانسڪرپٽ ۾ ظاهر ٿيندا آهن يا اسڪرين تي نظريي جي سڃاڻپ (OCR) استعمال ڪندي، لاڳاپيل معلومات شامل ڪئي وئي آهي. ھن نئين خصوصيت سان، توھان انھن سڀني ماڻھن، جڳھن ۽ برانڊن کي ڳولي سگھو ٿا جيڪي ھڪڙي وڊيو ۾ ظاهر ٿيا آھن ۽ انھن بابت تفصيل ڏسي سگھو ٿا، بشمول ٽائم سلاٽ، تفصيل، ۽ وڌيڪ معلومات لاءِ Bing سرچ انجڻ جا لنڪ.
ايڊيٽر لاءِ فريم ڳولڻ وارو ماڊل
هي نئون فيچر JSON تفصيلن ۾ انفرادي فريم سان ڳنڍيل ميٽا ڊيٽا ۾ "ٽيگ" جو هڪ سيٽ شامل ڪري ٿو انهن جي ادارتي قسم جي نمائندگي ڪرڻ لاءِ (مثال طور، وسيع شاٽ، وچولي شاٽ، بند اپ، انتهائي ويجهي اپ، ٻه شاٽ، گهڻا ماڻهو. ، ٻاهران، اندر، وغيره). اهي شاٽ قسم جون خاصيتون ڪارائتيون آهن جڏهن ڪلپس ۽ ٽريلر لاءِ وڊيو ايڊيٽنگ ڪرڻ، يا جڏهن فنڪارانه مقصدن لاءِ هڪ مخصوص شاٽ انداز ڳولي رهيا آهيو.
وڌايل IPTC ميپنگ گرينولرٽي
اسان جو موضوع معلوم ڪرڻ وارو ماڊل ٽرانسڪرپشن، آپٽيڪل ڪيڪٽر ريڪگنيشن (OCR) ۽ معلوم ڪيل مشهور شخصيتن جي بنياد تي وڊيو جو موضوع طئي ڪري ٿو، جيتوڻيڪ موضوع واضح طور تي بيان نه ڪيو ويو آهي. اسان انهن دريافت ڪيل عنوانن کي چار درجه بندي وارن علائقن ڏانهن نقشي ۾ ترتيب ڏيون ٿا: وڪيپيڊيا، Bing، IPTC، ۽ IAB. هي واڌارو اسان کي ٻئي سطح جي IPTC درجه بندي شامل ڪرڻ جي اجازت ڏئي ٿو.
انهن سڌارن جو فائدو وٺڻ جيترو آسان آهي جيترو توهان جي موجوده وڊيو انڊيڪسر لائبريري کي ٻيهر ترتيب ڏيڻ.
نئين لائيو اسٽريمنگ ڪارڪردگي
Azure ميڊيا سروسز جي ڏيک ۾، اسان پڻ پيش ڪري رهيا آهيون ٻه نيون خاصيتون لائيو اسٽريمنگ لاءِ.
AI-طاقتور حقيقي وقت ٽرانسپشن لائيو اسٽريمنگ کي ايندڙ سطح تي وٺي ٿي
لائيو اسٽريمنگ لاءِ Azure ميڊيا سروسز استعمال ڪندي، توھان ھاڻي حاصل ڪري سگھوٿا ھڪڙو آئوٽ اسٽريم جنھن ۾ آڊيو ۽ وڊيو مواد کان علاوه خود بخود ٺاھيل ٽيڪسٽ ٽريڪ شامل آھي. متن مصنوعي ذهانت جي بنياد تي حقيقي وقت آڊيو ٽرانسپشن استعمال ڪندي ٺاهيو ويو آهي. نتيجن کي بهتر ڪرڻ لاءِ تقرير کان متن جي تبديلي کان اڳ ۽ بعد ۾ ڪسٽم ٽيڪنڪ لاڳو ٿينديون آهن. ٽيڪسٽ ٽريڪ IMSC1، TTML يا WebVTT ۾ پيڪيج ٿيل آهي، ان تي منحصر آهي ته ڇا اهو DASH، HLS CMAF يا HLS TS ۾ فراهم ڪيو ويو آهي.
24/7 OTT چينلز لاءِ حقيقي وقت واري لائن انڪوڊنگ
اسان جي v3 APIs استعمال ڪندي، توهان OTT (اوور-دي-ٽاپ) چينلز ٺاهي، منظم ۽ نشر ڪري سگهو ٿا، ۽ ٻيون سڀئي Azure ميڊيا سروسز استعمال ڪري سگهو ٿا جهڙوڪ لائيو وڊيو آن ڊيمانڊ (VOD، وڊيو آن ڊيمانڊ)، پيڪنگنگ ۽ ڊجيٽل حقن جو انتظام ( DRM، ڊجيٽل حقن جو انتظام).
انهن خاصيتن جا ڏيک ورجن ڏسڻ لاءِ، دورو ڪريو
نئون پيڪيج پيدا ڪرڻ جي صلاحيت
آڊيو وضاحت جي ٽريڪ لاء سپورٽ
براڊڪاسٽ چينلز تي نشر ڪيل مواد اڪثر ڪري هڪ آڊيو ٽريڪ هوندو آهي زباني وضاحت سان ته اسڪرين تي ڇا ٿي رهيو آهي باقاعده آڊيو سگنل کان علاوه. هي پروگرامن کي بصري طور تي متاثر ٿيل ناظرين تائين وڌيڪ رسائي لائق بڻائي ٿو، خاص طور تي جيڪڏهن مواد بنيادي طور تي بصري آهي. نئون
ID3 ميٽا ڊيٽا داخل ڪرڻ
ڪلائنٽ جي پليئر تي اشتهارن يا ڪسٽم ميٽاداٽا واقعن جي داخل ٿيڻ کي سگنل ڏيڻ لاءِ، براڊڪاسٽر اڪثر وڊيو ۾ شامل ڪيل ٽائيم ميٽاداٽا استعمال ڪندا آهن. SCTE-35 سگنلنگ موڊس کان علاوه، اسان ھاڻي پڻ سپورٽ ڪريون ٿا
Microsoft Azure ڀائيوارن جي آخر کان آخر تائين حل جو مظاهرو ڪيو
بين الاقوامي ڪمپني
جو ذريعو: www.habr.com