مائیکروسافٹ کا مشن کرہ ارض پر موجود ہر فرد اور تنظیم کو مزید حاصل کرنے کے لیے بااختیار بنانا ہے۔ میڈیا انڈسٹری اس مشن کو حقیقت بنانے کی ایک بہترین مثال ہے۔ ہم ایک ایسے دور میں رہتے ہیں جہاں زیادہ مواد تخلیق اور استعمال کیا جا رہا ہے، زیادہ طریقوں سے اور زیادہ آلات پر۔ IBC 2019 میں، ہم نے ان تازہ ترین اختراعات کا اشتراک کیا جن پر ہم کام کر رہے ہیں اور وہ آپ کے میڈیا کے تجربے کو تبدیل کرنے میں کس طرح مدد کر سکتی ہیں۔
کٹ کے نیچے تفصیلات!
یہ صفحہ آن ہے۔
ویڈیو انڈیکسر اب اینیمیشن اور کثیر لسانی مواد کو سپورٹ کرتا ہے۔
پچھلے سال IBC میں ہم نے اپنا ایوارڈ جیتا۔
ہماری تازہ ترین پیشکشوں میں دو انتہائی مطلوب اور امتیازی خصوصیات کے پیش نظارہ شامل ہیں — متحرک کردار کی شناخت اور کثیر لسانی تقریر کی نقل — نیز ویڈیو انڈیکسر میں آج دستیاب موجودہ ماڈلز میں کئی اضافے شامل ہیں۔
متحرک کردار کی شناخت
متحرک مواد مواد کی مقبول ترین اقسام میں سے ایک ہے، لیکن انسانی چہروں کو پہچاننے کے لیے بنائے گئے معیاری کمپیوٹر ویژن ماڈلز اس کے ساتھ اچھی طرح کام نہیں کرتے، خاص طور پر اگر مواد میں انسانی چہرے کی خصوصیات کے بغیر کردار ہوں۔ نیا پیش نظارہ ورژن ویڈیو انڈیکسر کو مائیکروسافٹ کی Azure Custom Vision سروس کے ساتھ ملاتا ہے، ماڈلز کا ایک نیا سیٹ فراہم کرتا ہے جو خود کار طریقے سے متحرک کرداروں کا پتہ لگاتا ہے اور گروپ کرتا ہے اور مربوط کسٹم وژن ماڈلز کا استعمال کرتے ہوئے انہیں لیبل اور پہچاننا آسان بناتا ہے۔
ماڈلز کو ایک ہی پائپ لائن میں ضم کیا گیا ہے، جس سے کسی کو بھی مشین لرننگ کے علم کے بغیر سروس استعمال کرنے کی اجازت ملتی ہے۔ آپ کی اپنی ایپلی کیشنز میں فوری انضمام کے لیے نتائج بغیر کوڈ ویڈیو انڈیکسر پورٹل یا REST API کے ذریعے دستیاب ہیں۔
ہم نے یہ ماڈل کچھ ایسے صارفین کے ساتھ متحرک کرداروں کے ساتھ کام کرنے کے لیے بنائے ہیں جنہوں نے تربیت اور جانچ کے لیے حقیقی متحرک مواد فراہم کیا۔ نئی فعالیت کی قدر وائکوم انٹرنیشنل میڈیا نیٹ ورکس میں اسٹوڈیو ٹیکنالوجی اور پوسٹ پروڈکشن کے سینئر ڈائریکٹر اینڈی گٹیریج نے اچھی طرح سے بیان کی، جو ڈیٹا فراہم کرنے والوں میں سے ایک تھے: "مضبوط AI سے چلنے والے اینیمیٹڈ مواد کی دریافت کی اجازت دے گی۔ ہمیں اپنی لائبریری کے مواد سے کریکٹر میٹا ڈیٹا کو تیزی سے اور مؤثر طریقے سے تلاش کرنے اور کیٹلاگ کرنے کے لیے۔
سب سے اہم بات یہ ہے کہ یہ ہماری تخلیقی ٹیموں کو فوری طور پر مطلوبہ مواد تلاش کرنے کی صلاحیت فراہم کرے گا، میڈیا کے نظم و نسق میں صرف ہونے والے وقت کو کم سے کم کرے گا اور انہیں تخلیقی صلاحیتوں پر توجہ مرکوز کرنے کی اجازت دے گا۔
آپ کے ساتھ متحرک کردار کی شناخت سے واقف ہونا شروع کر سکتے ہیں۔
متعدد زبانوں میں مواد کی شناخت اور نقل
میڈیا کے کچھ وسائل، جیسے خبریں، تاریخ اور انٹرویوز، مختلف زبانیں بولنے والے لوگوں کی ریکارڈنگ پر مشتمل ہوتے ہیں۔ زیادہ تر موجودہ اسپیچ ٹو ٹیکسٹ صلاحیتوں کے لیے آڈیو ریکگنیشن لینگویج کا پہلے سے تعین کرنے کی ضرورت ہوتی ہے، جس سے کثیر لسانی ویڈیوز کو نقل کرنا مشکل ہو جاتا ہے۔
مختلف قسم کے مواد کے لیے ہماری نئی خودکار بولی جانے والی زبان کی شناخت کی خصوصیت میڈیا کے اثاثوں میں پائی جانے والی زبانوں کی شناخت کے لیے مشین لرننگ ٹیکنالوجی کا استعمال کرتی ہے۔ ایک بار پتہ لگ جانے کے بعد، ہر زبان کا طبقہ خود بخود مناسب زبان میں ٹرانسکرپشن کے عمل سے گزرتا ہے، اور پھر تمام حصوں کو ایک کثیر زبان کی ٹرانسکرپشن فائل میں ملا دیا جاتا ہے۔
نتیجے میں آنے والا ٹرانسکرپٹ ویڈیو انڈیکسر کے JSON آؤٹ پٹ کے حصے کے طور پر اور سب ٹائٹل فائلوں کے طور پر دستیاب ہے۔ آؤٹ پٹ ٹرانسکرپٹ کو Azure سرچ کے ساتھ بھی مربوط کیا گیا ہے، جس سے آپ فوری طور پر اپنے ویڈیوز میں مختلف زبان کے حصوں کو تلاش کر سکتے ہیں۔ مزید برآں، ویڈیو انڈیکسر پورٹل کے ساتھ کام کرتے وقت کثیر لسانی ٹرانسکرپشن دستیاب ہے، لہذا آپ وقت کے ساتھ نقل اور شناخت شدہ زبان کو دیکھ سکتے ہیں، یا ہر زبان کے لیے ویڈیو میں مخصوص جگہوں پر جا سکتے ہیں اور ویڈیو چلتے ہی کثیر لسانی ٹرانسکرپشن کو کیپشن کے طور پر دیکھ سکتے ہیں۔ آپ موصول شدہ متن کا پورٹل اور API کے ذریعے 54 دستیاب زبانوں میں سے کسی میں بھی ترجمہ کر سکتے ہیں۔
نئی کثیر لسانی مواد کی شناخت کی خصوصیت اور ویڈیو انڈیکسر میں اس کے استعمال کے بارے میں مزید جانیں۔
اضافی اپ ڈیٹ اور بہتر ماڈل
ہم ویڈیو انڈیکسر میں نئے ماڈلز بھی شامل کر رہے ہیں اور موجودہ ماڈلز کو بہتر کر رہے ہیں، بشمول ذیل میں بیان کردہ۔
لوگوں اور مقامات سے وابستہ اداروں کو نکالنا
ہم نے معروف ناموں اور مقامات کو شامل کرنے کے لیے اپنی موجودہ برانڈ کی دریافت کی صلاحیتوں کو بڑھا دیا ہے، جیسے پیرس میں ایفل ٹاور اور لندن میں بگ بین۔ جب وہ آپٹیکل کریکٹر ریکگنیشن (OCR) کا استعمال کرتے ہوئے تیار کردہ ٹرانسکرپٹ میں یا اسکرین پر ظاہر ہوتے ہیں، تو متعلقہ معلومات شامل کی جاتی ہیں۔ اس نئی خصوصیت کے ساتھ، آپ ویڈیو میں ظاہر ہونے والے تمام لوگوں، مقامات اور برانڈز کو تلاش کر سکتے ہیں اور ان کے بارے میں تفصیلات دیکھ سکتے ہیں، بشمول ٹائم سلاٹس، تفصیل، اور مزید معلومات کے لیے Bing سرچ انجن کے لنکس۔
ایڈیٹر کے لیے فریم کا پتہ لگانے کا ماڈل
یہ نئی خصوصیت JSON تفصیلات میں انفرادی فریموں کے ساتھ منسلک میٹا ڈیٹا میں "ٹیگز" کا ایک سیٹ شامل کرتی ہے تاکہ ان کی ادارتی قسم کی نمائندگی کی جاسکے (مثال کے طور پر، وسیع شاٹ، میڈیم شاٹ، کلوز اپ، انتہائی کلوز اپ، دو شاٹس، ایک سے زیادہ لوگ باہر، گھر کے اندر، وغیرہ)۔ یہ شاٹ قسم کی خصوصیات کلپس اور ٹریلرز کے لیے ویڈیو میں ترمیم کرنے یا فنکارانہ مقاصد کے لیے مخصوص شاٹ اسٹائل کی تلاش میں مفید ہیں۔
بہتر آئی پی ٹی سی میپنگ گرینولریٹی
ہمارا موضوع کا پتہ لگانے کا ماڈل ٹرانسکرپشن، آپٹیکل کریکٹر ریکگنیشن (OCR)، اور شناخت شدہ مشہور شخصیات کی بنیاد پر ویڈیو کے موضوع کا تعین کرتا ہے، چاہے موضوع واضح طور پر متعین نہ ہو۔ ہم ان دریافت شدہ موضوعات کو درجہ بندی کے چار شعبوں میں نقشہ بناتے ہیں: ویکیپیڈیا، بنگ، آئی پی ٹی سی، اور آئی اے بی۔ یہ اضافہ ہمیں دوسرے درجے کی IPTC درجہ بندی کو شامل کرنے کی اجازت دیتا ہے۔
ان بہتریوں سے فائدہ اٹھانا اتنا ہی آسان ہے جتنا کہ آپ کی موجودہ ویڈیو انڈیکسر لائبریری کو دوبارہ ترتیب دینا۔
لائیو سٹریمنگ کی نئی فعالیت
Azure Media Services کے پیش نظارہ میں، ہم لائیو سٹریمنگ کے لیے دو نئی خصوصیات بھی پیش کر رہے ہیں۔
AI سے چلنے والی ریئل ٹائم ٹرانسکرپشن لائیو سٹریمنگ کو اگلے درجے تک لے جاتی ہے۔
لائیو سٹریمنگ کے لیے Azure Media Services کا استعمال کرتے ہوئے، آپ اب ایک آؤٹ پٹ سٹریم حاصل کر سکتے ہیں جس میں آڈیو اور ویڈیو مواد کے علاوہ خود کار طریقے سے تیار کردہ ٹیکسٹ ٹریک بھی شامل ہے۔ متن مصنوعی ذہانت کی بنیاد پر ریئل ٹائم آڈیو ٹرانسکرپشن کا استعمال کرتے ہوئے بنایا گیا ہے۔ نتائج کو بہتر بنانے کے لیے اسپیچ ٹو ٹیکسٹ کنورژن سے پہلے اور بعد میں حسب ضرورت تکنیک کا اطلاق کیا جاتا ہے۔ ٹیکسٹ ٹریک IMSC1، TTML یا WebVTT میں پیک کیا جاتا ہے، اس پر منحصر ہے کہ آیا یہ DASH، HLS CMAF یا HLS TS میں فراہم کیا جاتا ہے۔
24/7 OTT چینلز کے لیے ریئل ٹائم لائن انکوڈنگ
ہمارے v3 APIs کا استعمال کرتے ہوئے، آپ OTT (اوور دی ٹاپ) چینلز بنا سکتے ہیں، ان کا نظم کر سکتے ہیں اور براڈکاسٹ کر سکتے ہیں، اور Azure میڈیا سروسز کی دیگر تمام خصوصیات جیسے کہ لائیو ویڈیو آن ڈیمانڈ (VOD، ویڈیو آن ڈیمانڈ)، پیکیجنگ اور ڈیجیٹل رائٹس مینجمنٹ ( DRM، ڈیجیٹل رائٹس مینجمنٹ)۔
ان خصوصیات کے پیش نظارہ ورژن دیکھنے کے لیے، ملاحظہ کریں۔
نئے پیکیج کی تیاری کی صلاحیتیں۔
آڈیو تفصیل ٹریکس کے لیے سپورٹ
نشریاتی چینلز پر نشر ہونے والے مواد میں اکثر آڈیو ٹریک ہوتا ہے جس میں باقاعدہ آڈیو سگنل کے علاوہ اسکرین پر کیا ہو رہا ہے اس کی زبانی وضاحت ہوتی ہے۔ یہ پروگراموں کو بصارت سے محروم ناظرین کے لیے زیادہ قابل رسائی بناتا ہے، خاص طور پر اگر مواد بنیادی طور پر بصری ہو۔ نئی
ID3 میٹا ڈیٹا داخل کرنا
کلائنٹ کے پلیئر کو اشتہارات یا حسب ضرورت میٹا ڈیٹا ایونٹس داخل کرنے کا اشارہ دینے کے لیے، براڈکاسٹر اکثر ویڈیو میں ایمبیڈڈ ٹائم میٹا ڈیٹا کا استعمال کرتے ہیں۔ SCTE-35 سگنلنگ طریقوں کے علاوہ، ہم اب سپورٹ بھی کرتے ہیں۔
مائیکروسافٹ Azure کے شراکت دار آخر سے آخر تک حل کا مظاہرہ کرتے ہیں۔
بین الاقوامی کمپنی
ماخذ: www.habr.com