12 خدمة وسائط Azure جديدة مع AI

تتمثل مهمة Microsoft في تمكين كل شخص ومؤسسة على هذا الكوكب من تحقيق المزيد. وتعد صناعة الإعلام مثالاً رائعًا لتحويل هذه المهمة إلى حقيقة. نحن نعيش في عصر يتم فيه إنشاء المزيد من المحتوى واستهلاكه، بطرق أكثر وعلى المزيد من الأجهزة. في IBC 2019، شاركنا أحدث الابتكارات التي نعمل عليها وكيف يمكن أن تساعد في تحويل تجربتك الإعلامية.
12 خدمة وسائط Azure جديدة مع AI
التفاصيل تحت الخفض!

هذه الصفحة قيد التشغيل موقعنا.

يدعم Video Indexer الآن الرسوم المتحركة والمحتوى متعدد اللغات

في العام الماضي في IBC حصلنا على جوائزنا مفهرس الفيديو لخدمات الوسائط Azure، وهذا العام أصبح الأمر أفضل. يقوم Video Indexer تلقائيًا باستخراج المعلومات والبيانات التعريفية من ملفات الوسائط، مثل الكلمات المنطوقة والوجوه والعواطف والموضوعات والعلامات التجارية، ولا تحتاج إلى أن تكون خبيرًا في التعلم الآلي لاستخدامه.

تتضمن أحدث عروضنا معاينات لميزتين متميزتين ومرغوبتين للغاية - التعرف على الأحرف المتحركة ونسخ الكلام متعدد اللغات - بالإضافة إلى العديد من الإضافات إلى النماذج الحالية المتوفرة اليوم في Video Indexer.

التعرف على الشخصيات المتحركة

12 خدمة وسائط Azure جديدة مع AI
يعد المحتوى المتحرك أحد أكثر أنواع المحتوى شيوعًا، لكن نماذج الرؤية الحاسوبية القياسية المصممة للتعرف على الوجوه البشرية لا تعمل بشكل جيد معها، خاصة إذا كان المحتوى يحتوي على شخصيات بدون ملامح وجه بشرية. يجمع إصدار المعاينة الجديد بين Video Indexer وخدمة Azure Custom Vision من Microsoft، مما يوفر مجموعة جديدة من النماذج التي تكتشف الشخصيات المتحركة وتجميعها تلقائيًا وتسهل تصنيفها والتعرف عليها باستخدام نماذج الرؤية المخصصة المدمجة.

تم دمج النماذج في مسار واحد، مما يسمح لأي شخص باستخدام الخدمة دون أي معرفة بالتعلم الآلي. تتوفر النتائج من خلال بوابة Video Indexer بدون تعليمات برمجية أو عبر REST API للتكامل السريع في تطبيقاتك الخاصة.

لقد بنينا هذه النماذج للعمل مع الشخصيات المتحركة جنبًا إلى جنب مع بعض المستهلكين الذين قدموا محتوى رسوم متحركة حقيقيًا للتدريب والاختبار. تم تلخيص قيمة الوظيفة الجديدة بشكل جيد من قبل آندي جوتريدج، المدير الأول لتكنولوجيا الاستوديو ومرحلة ما بعد الإنتاج في Viacom International Media Networks، الذي كان أحد موفري البيانات: "إن إضافة اكتشاف محتوى الرسوم المتحركة القوي المدعوم بالذكاء الاصطناعي سيسمح يمكننا العثور على البيانات الوصفية للشخصية وفهرستها بسرعة وكفاءة من محتوى مكتبتنا.

والأهم من ذلك، أنه سيمنح فرقنا الإبداعية القدرة على العثور على المحتوى الذي يحتاجونه على الفور، مما يقلل من الوقت الذي يقضيه في إدارة الوسائط ويسمح لهم بالتركيز على الإبداع.

يمكنك البدء في التعرف على التعرف على الشخصيات المتحركة صفحات التوثيق.

تحديد ونسخ المحتوى بلغات متعددة

تحتوي بعض الموارد الإعلامية، مثل الأخبار والسجلات والمقابلات، على تسجيلات لأشخاص يتحدثون لغات مختلفة. تتطلب معظم إمكانيات تحويل الكلام إلى نص الموجودة تحديد لغة التعرف على الصوت مسبقًا، مما يجعل من الصعب نسخ مقاطع الفيديو متعددة اللغات.

تستخدم ميزة التعرف التلقائي على اللغة المنطوقة الجديدة الخاصة بنا لأنواع مختلفة من المحتوى تقنية التعلم الآلي لتحديد اللغات الموجودة في أصول الوسائط. بمجرد اكتشافه، يمر كل مقطع لغة تلقائيًا عبر عملية النسخ باللغة المناسبة، ثم يتم دمج جميع المقاطع في ملف نسخ واحد متعدد اللغات.

12 خدمة وسائط Azure جديدة مع AI

يتوفر النص الناتج كجزء من مخرجات JSON لمفهرس الفيديو وكملفات ترجمة. يتم أيضًا دمج النص الناتج مع Azure Search، مما يسمح لك بالبحث الفوري عن مقاطع لغوية مختلفة في مقاطع الفيديو الخاصة بك. بالإضافة إلى ذلك، يتوفر النسخ متعدد اللغات عند العمل مع بوابة Video Indexer، بحيث يمكنك عرض النص واللغة المحددة بمرور الوقت، أو الانتقال إلى أماكن محددة في الفيديو لكل لغة ورؤية النسخ متعدد اللغات كتسميات توضيحية أثناء تشغيل الفيديو. يمكنك أيضًا ترجمة النص المستلم إلى أي من اللغات الـ 54 المتاحة من خلال البوابة وواجهة برمجة التطبيقات.

تعرف على المزيد حول ميزة التعرف على المحتوى متعدد اللغات الجديدة وكيفية استخدامها في "مفهرس الفيديو". قراءة الوثائق.

نماذج إضافية محدثة ومحسنة

نقوم أيضًا بإضافة نماذج جديدة إلى Video Indexer وتحسين النماذج الحالية، بما في ذلك تلك الموضحة أدناه.

استخراج الكيانات المرتبطة بالأشخاص والأماكن

لقد قمنا بتوسيع قدراتنا الحالية في اكتشاف العلامات التجارية لتشمل أسماء ومواقع مشهورة، مثل برج إيفل في باريس وبيج بن في لندن. عندما تظهر في النص الذي تم إنشاؤه أو على الشاشة باستخدام التعرف الضوئي على الحروف (OCR)، تتم إضافة المعلومات ذات الصلة. باستخدام هذه الميزة الجديدة، يمكنك البحث عن جميع الأشخاص والأماكن والعلامات التجارية التي ظهرت في مقطع فيديو وعرض تفاصيل عنها، بما في ذلك الفترات الزمنية والأوصاف والروابط لمحرك بحث Bing لمزيد من المعلومات.

12 خدمة وسائط Azure جديدة مع AI

نموذج الكشف عن الإطار للمحرر

تضيف هذه الميزة الجديدة مجموعة من "العلامات" إلى البيانات التعريفية المرفقة بالإطارات الفردية في تفاصيل JSON لتمثيل نوعها التحريري (على سبيل المثال، لقطة واسعة، لقطة متوسطة، لقطة قريبة، لقطة قريبة للغاية، لقطتين، عدة أشخاص ، في الهواء الطلق، في الداخل، الخ.). تعتبر خصائص نوع اللقطة هذه مفيدة عند تحرير الفيديو للمقاطع والمقاطع الترويجية، أو عند البحث عن نمط لقطة محدد لأغراض فنية.

12 خدمة وسائط Azure جديدة مع AI
يتعلم أكثر الكشف عن نوع الإطار في مفهرس الفيديو.

تحسين دقة رسم خرائط IPTC

يحدد نموذج اكتشاف الموضوع الخاص بنا موضوع الفيديو بناءً على النسخ والتعرف البصري على الأحرف (OCR) والمشاهير المكتشفين، حتى لو لم يتم تحديد الموضوع بشكل صريح. نقوم بتعيين هذه المواضيع المكتشفة إلى أربع مناطق تصنيف: Wikipedia وBing وIPTC وIAB. يتيح لنا هذا التحسين تضمين تصنيف IPTC من المستوى الثاني.
يعد الاستفادة من هذه التحسينات أمرًا سهلاً مثل إعادة فهرسة مكتبة فهرس الفيديو الحالية لديك.

وظيفة البث المباشر الجديدة

في معاينة Azure Media Services، نقدم أيضًا ميزتين جديدتين للبث المباشر.

ينقل النسخ في الوقت الفعلي المدعوم بالذكاء الاصطناعي البث المباشر إلى المستوى التالي

باستخدام Azure Media Services للبث المباشر، يمكنك الآن تلقي دفق إخراج يتضمن مسارًا نصيًا تم إنشاؤه تلقائيًا بالإضافة إلى محتوى الصوت والفيديو. يتم إنشاء النص باستخدام النسخ الصوتي في الوقت الفعلي استنادًا إلى الذكاء الاصطناعي. يتم تطبيق تقنيات مخصصة قبل وبعد تحويل الكلام إلى نص لتحسين النتائج. يتم حزم المسار النصي في IMSC1 أو TTML أو WebVTT، اعتمادًا على ما إذا كان متوفرًا في DASH أو HLS CMAF أو HLS TS.

ترميز الخط في الوقت الحقيقي لقنوات OTT على مدار 24 ساعة طوال أيام الأسبوع

باستخدام واجهات برمجة التطبيقات v3 الخاصة بنا، يمكنك إنشاء قنوات OTT (عبر القمة) وإدارتها وبثها، واستخدام جميع ميزات خدمات وسائط Azure الأخرى مثل الفيديو المباشر عند الطلب (VOD والفيديو حسب الطلب) والتعبئة وإدارة الحقوق الرقمية ( DRM، إدارة الحقوق الرقمية).
لرؤية إصدارات المعاينة لهذه الميزات، قم بزيارة مجتمع خدمات الوسائط Azure.

12 خدمة وسائط Azure جديدة مع AI

قدرات توليد الحزمة الجديدة

دعم مسارات الوصف الصوتي

غالبًا ما يشتمل المحتوى الذي يتم بثه عبر قنوات البث على مسار صوتي مع شرح لفظي لما يحدث على الشاشة بالإضافة إلى الإشارة الصوتية العادية. وهذا يجعل البرامج في متناول المشاهدين ضعاف البصر، خاصة إذا كان المحتوى مرئيًا في المقام الأول. جديد وظيفة الوصف الصوتي يسمح لك بإضافة تعليق توضيحي لأحد المسارات الصوتية كمسار وصف صوتي (AD، وصف صوتي)، مما يسمح للاعبين بإتاحة مسار AD للمشاهدين.

إدراج البيانات التعريفية ID3

للإشارة إلى إدراج إعلانات أو أحداث بيانات وصفية مخصصة لمشغل العميل، غالبًا ما يستخدم المذيعون بيانات وصفية موقوتة مضمنة في الفيديو. بالإضافة إلى أوضاع الإشارة SCTE-35، فإننا ندعمها الآن أيضًا ID3v2 والمخططات المخصصة الأخرى، تم تحديدها من قبل مطور التطبيق ليستخدمها تطبيق العميل.

يوضح شركاء Microsoft Azure الحلول الشاملة

Bitmovin يقدم Bitmovin Video Encoding وBitmovin Video Player لـ Microsoft Azure. يمكن للعملاء الآن الاستفادة من حلول التشفير والتشغيل هذه في Azure والاستفادة من الميزات المتقدمة مثل التشفير ثلاثي المراحل ودعم برنامج ترميز AV1/VC والترجمات المتعددة اللغات وتحليلات الفيديو المدمجة مسبقًا لجودة الخدمة والإعلانات وتتبع الفيديو.

إيفرجنت يوضح نظام إدارة دورة حياة المستخدم الخاص به على Azure. باعتبارها شركة رائدة في مجال توفير حلول إدارة الإيرادات ودورة حياة العملاء، تستخدم Evergent Azure AI لمساعدة موفري الترفيه المتميزين على تحسين اكتساب العملاء والاحتفاظ بهم من خلال إنشاء حزم وعروض خدمات مستهدفة في النقاط الحرجة في دورة حياة العميل.

Haivision ستعرض خدمة توجيه الوسائط الذكية القائمة على السحابة، SRT Hub، والتي تساعد العملاء على تحويل سير العمل الشامل باستخدام حافة مربع بيانات Azure وتحويل سير العمل باستخدام Hublets من Avid وTelestream وWowza وCinegy وMake.tv.

SES قامت بتطوير مجموعة من خدمات الوسائط على مستوى البث على منصة Azure لعملاء خدمات الوسائط المدارة والأقمار الصناعية. ستعرض SES حلولاً لخدمات التشغيل المُدارة بالكامل، بما في ذلك التشغيل الرئيسي والتشغيل المحلي واكتشاف الإعلانات واستبدالها وترميز متعدد القنوات عالي الجودة في الوقت الفعلي على مدار 24 ساعة طوال أيام الأسبوع على Azure.

مزامنة الكلمات يجعل الأدوات السحابية الملائمة وتقنية أتمتة التوقيع متاحة على Azure. ستسهل هذه العروض على المؤسسات الإعلامية إضافة الترجمات تلقائيًا، بما في ذلك الترجمات المصاحبة للغة الأجنبية، إلى سير عمل الفيديو المباشر وغير المتصل بالإنترنت على Azure.
شركة دولية تاتا إلكشسيقامت شركة خدمات التكنولوجيا بدمج منصة OTT SaaS TEPlay في Azure Media Services لتقديم محتوى OTT من السحابة. جلبت Tata Elxsi أيضًا حل مراقبة جودة تجربة Falcon Eye (QoE) إلى Microsoft Azure، مما يوفر التحليلات والمقاييس اللازمة لاتخاذ القرار.

فيريزون ميديا تعمل على إتاحة منصة البث الخاصة بها على Azure كإصدار تجريبي. Verizon Media Platform عبارة عن حل OTT مُدار على مستوى المؤسسة يتضمن إدارة الحقوق الرقمية وإدراج الإعلانات والجلسات الشخصية الفردية واستبدال المحتوى الديناميكي وتسليم الفيديو. يعمل التكامل على تبسيط سير العمل والدعم العالمي والتوسع، ويفتح بعض الإمكانات الفريدة الموجودة في Azure.

المصدر: www.habr.com

إضافة تعليق