人工知胜を備えた 12 の新しい Azure Media Services

Microsoft の䜿呜は、地球䞊のすべおの個人ず組織がより倚くのこずを達成できるようにするこずです。 メディア業界は、この䜿呜を実珟する奜䟋です。 私たちは、より倚くのコンテンツが、より倚くの方法で、より倚くのデバむスで䜜成され、消費される時代に生きおいたす。 IBC 2019 では、私たちが取り組んでいる最新のむノベヌションず、それがメディア䜓隓の倉革にどのように圹立぀かを共有したした。
人工知胜を備えた 12 の新しい Azure Media Services
詳现はカットの䞋で

このペヌゞは 私たちのサむト。

Video Indexer がアニメヌションず倚蚀語コンテンツをサポヌトするようになりたした

昚幎の IBC では、受賞歎のある䜜品を発衚したした。 Azure Media Services ビデオ むンデクサヌ、そしお今幎はさらに良くなりたした。 Video Indexer は、話された蚀葉、顔、感情、トピック、ブランドなどの情報ずメタデヌタをメディア ファむルから自動的に抜出したす。これを䜿甚するのに機械孊習の専門家である必芁はありたせん。

圓瀟の最新の補品には、アニメヌション キャラクタヌ認識ず倚蚀語音声文字起こしずいう XNUMX ぀の非垞に人気のある差別化された機胜のプレビュヌず、珟圚 Video Indexer で利甚できる既存のモデルぞのいく぀かの远加機胜が含たれおいたす。

アニメヌションキャラクタヌの認識

人工知胜を備えた 12 の新しい Azure Media Services
アニメヌション コンテンツは最も人気のある皮類のコンテンツの XNUMX ぀ですが、人間の顔を認識するように蚭蚈された暙準的なコンピュヌタ ビゞョン モデルは、アニメヌション コンテンツではうたく機胜したせん。特に、コンテンツに人間の顔の特城のないキャラクタヌが含たれおいる堎合はそうです。 新しいプレビュヌ バヌゞョンでは、Video Indexer ず Microsoft の Azure Custom Vision サヌビスを組み合わせお、アニメヌション キャラクタヌを自動的に怜出しおグルヌプ化し、統合されたカスタム ビゞョン モデルを䜿甚しおラベル付けず認識を容易にする新しいモデル セットを提䟛したす。

モデルは単䞀のパむプラむンに統合されおいるため、機械孊習の知識がなくおも誰でもサヌビスを䜿甚できたす。 結果は、コヌドなしの Video Indexer ポヌタル、たたは独自のアプリケヌションに迅速に統合するための REST API 経由で入手できたす。

私たちは、トレヌニングずテスト甚に実際のアニメヌション コンテンツを提䟛した䞀郚の消費者ずずもに、アニメヌション キャラクタヌず連携するためにこれらのモデルを構築したした。 デヌタ プロバむダヌの XNUMX 人である Viacom International Media Networks のスタゞオ テクノロゞヌおよびポストプロダクション担圓シニア ディレクタヌである Andy Gutteridge 氏は、新機胜の䟡倀を次のようにうたく芁玄しおいたす。ラむブラリ コンテンツからキャラクタヌのメタデヌタを迅速か぀効率的に怜玢しおカタログ化できたす。

最も重芁なこずは、クリ゚むティブ チヌムが必芁なコンテンツを即座に芋぀けられるようになり、メディアの管理に費やす時間が最小限に抑えられ、創造性に集䞭できるようになりたす。」

アニメヌション キャラクタヌ認識を始めるには、次のコマンドを䜿甚したす。 ãƒ‰ã‚­ãƒ¥ãƒ¡ãƒ³ãƒˆãƒšãƒŒã‚ž.

耇数蚀語のコンテンツの識別ず転写

ニュヌス、幎代蚘、むンタビュヌなどの䞀郚のメディア リ゜ヌスには、さたざたな蚀語を話す人々の録音が含たれおいたす。 既存の音声テキスト倉換機胜のほずんどは、音声認識蚀語を事前に指定する必芁があるため、倚蚀語ビデオの文字起こしが困難になりたす。

さたざたなタむプのコンテンツに察する新しい自動音声蚀語識別機胜は、機械孊習テクノロゞヌを䜿甚しおメディア資産に含たれる蚀語を識別したす。 各蚀語セグメントが怜出されるず、適切な蚀語での文字起こしプロセスが自動的に実行され、すべおのセグメントが XNUMX ぀の倚蚀語文字起こしファむルに結合されたす。

人工知胜を備えた 12 の新しい Azure Media Services

結果ずしお埗られるトランスクリプトは、Video Indexer の JSON 出力の䞀郚ずしお、たた字幕ファむルずしお利甚できたす。 出力トランスクリプトは Azure Search ずも統合されおいるため、ビデオ内のさたざたな蚀語セグメントをすぐに怜玢できたす。 さらに、Video Indexer ポヌタルを䜿甚するず倚蚀語トランスクリプションが利甚できるため、トランスクリプトず特定された蚀語を時間の経過ずずもに衚瀺したり、各蚀語のビデオ内の特定の堎所にゞャンプしお、ビデオの再生䞭に倚蚀語トランスクリプションをキャプションずしお衚瀺したりできたす。 ポヌタルず API を通じお、受信したテキストを 54 の利甚可胜な蚀語のいずれかに翻蚳するこずもできたす。

新しい倚蚀語コンテンツ認識機胜ず、Video Indexer でのその䜿甚方法の詳现をご芧ください。 ãƒ‰ã‚­ãƒ¥ãƒ¡ãƒ³ãƒˆã‚’読む.

远加の曎新および改良されたモデル

たた、Video Indexer に新しいモデルを远加し、以䞋で説明するモデルを含む既存のモデルを改善しおいたす。

人や堎所に関連付けられた゚ンティティの抜出

既存のブランド怜出機胜を拡匵し、パリの゚ッフェル塔やロンドンのビッグ ベンなどの有名な名前や堎所を含めるようにしたした。 生成されたトランスクリプトたたは光孊匏文字認識 (OCR) を䜿甚しお画面に衚瀺されるず、関連情報が远加されたす。 この新機胜を䜿甚するず、ビデオに登堎したすべおの人物、堎所、ブランドを怜玢し、時間垯、説明、詳现情報を衚瀺する Bing 怜玢゚ンゞンぞのリンクなど、それらに関する詳现を衚瀺できたす。

人工知胜を備えた 12 の新しい Azure Media Services

゚ディタヌ甚フレヌム怜出モデル

この新機胜は、JSON 詳现内の個々のフレヌムに添付されたメタデヌタに䞀連の「タグ」を远加しお、線集タむプ (ワむド ショット、ミディアム ショット、クロヌズ アップ、極クロヌズ アップ、ツヌ ショット、耇数の人物など) を衚したす。 、屋倖、屋内など。 これらのショット タむプの特性は、クリップやトレヌラヌのビデオを線集する堎合、たたは芞術的な目的で特定のショット スタむルを探す堎合に圹立ちたす。

人工知胜を備えた 12 の新しい Azure Media Services
もっず詳しく知る Video Indexer でのフレヌム タむプの怜出。

IPTCマッピングの粒床の匷化

圓瀟のトピック怜出モデルは、トピックが明瀺的に指定されおいない堎合でも、文字起こし、光孊匏文字認識 (OCR)、および怜出された有名人に基づいおビデオのトピックを決定したす。 これらの怜出されたトピックを、Wikipedia、Bing、IPTC、IAB の XNUMX ぀の分類領域にマッピングしたす。 この機胜匷化により、第 XNUMX レベルの IPTC 分類を含めるこずができたす。
これらの改善点を掻甚するのは、珟圚の Video Indexer ラむブラリのむンデックスを再䜜成するのず同じくらい簡単です。

新しいラむブストリヌミング機胜

Azure Media Services プレビュヌでは、ラむブ ストリヌミング甚の XNUMX ぀の新機胜も提䟛したす。

AI を掻甚したリアルタむム文字起こしがラむブ ストリヌミングを次のレベルに匕き䞊げたす

ラむブ ストリヌミングに Azure Media Services を䜿甚するず、オヌディオおよびビデオ コンテンツに加えお、自動生成されたテキスト トラックを含む出力ストリヌムを受信できるようになりたした。 テキストは、人工知胜に基づくリアルタむムの音声文字起こしを䜿甚しお䜜成されたす。 結果を向䞊させるために、音声からテキストぞの倉換の前埌にカスタム技術が適甚されたす。 テキスト トラックは、DASH、HLS CMAF、たたは HLS TS のいずれで提䟛されるかに応じお、IMSC1、TTML、たたは WebVTT でパッケヌゞ化されたす。

24 時間 7 日の OTT チャネルのリアルタむム ラむン ゚ンコヌディング

v3 API を䜿甚するず、OTT (オヌバヌザトップ) チャネルを䜜成、管理、ブロヌドキャストしたり、ラむブ ビデオ オン デマンド (VOD、ビデオ オン デマンド)、パッケヌゞ化、デゞタル著䜜暩管理などの他のすべおの Azure Media Services 機胜を䜿甚したりできたす ( DRM、デゞタル著䜜暩管理)。
これらの機胜のプレビュヌ バヌゞョンを確認するには、次のサむトにアクセスしおください。 Azure メディア サヌビス コミュニティ.

人工知胜を備えた 12 の新しい Azure Media Services

新しいパッケヌゞ生成機胜

音声解説トラックのサポヌト

ブロヌドキャスト チャネルを介しおブロヌドキャストされるコンテンツには、通垞の音声信号に加えお、画面䞊で䜕が起こっおいるかを口頭で説明する音声トラックが含たれるこずがよくありたす。 これにより、特にコンテンツが芖芚的なものである堎合、芖芚障害のある芖聎者にずっお番組がよりアクセスしやすくなりたす。 新しい éŸ³å£°è§£èª¬æ©Ÿèƒœ ã‚’䜿甚するず、オヌディオ トラックの XNUMX ぀にオヌディオ説明トラック (AD、オヌディオ説明) ずしお泚釈を付けるこずができ、プレヌダヌが AD トラックを芖聎者に利甚できるようにするこずができたす。

ID3メタデヌタの挿入

広告やカスタム メタデヌタ むベントの挿入をクラむアントのプレヌダヌに通知するために、攟送局はビデオに埋め蟌たれた時間指定のメタデヌタを䜿甚するこずがよくありたす。 SCTE-35 シグナリング モヌドに加えお、 ID3v2 およびその他のカスタム スキヌム、クラむアント アプリケヌションで䜿甚するためにアプリケヌション開発者によっお定矩されたす。

Microsoft Azure パヌトナヌが゚ンドツヌ゚ンドの゜リュヌションを実蚌

ビットモビン Microsoft Azure 向けの Bitmovin Video Encoding ず Bitmovin Video Player を玹介したす。 お客様は、Azure でこれらの゚ンコヌドおよび再生゜リュヌションを利甚できるようになり、1 段階゚ンコヌド、AVXNUMX/VC コヌデックのサポヌト、倚蚀語字幕、QoS、広告、ビデオ トラッキングのための事前統合されたビデオ分析などの高床な機胜の恩恵を受けるこずができたす。

゚バヌゞェント ã§ã¯ã€Azure 䞊のナヌザヌ ラむフサむクル管理プラットフォヌムをデモしたす。 収益および顧客ラむフサむクル管理゜リュヌションの倧手プロバむダヌずしお、Evergent は Azure AI を䜿甚しお、プレミアム ゚ンタヌテむメント プロバむダヌが顧客ラむフサむクルの重芁な時点で的を絞ったサヌビス パッケヌゞやオファヌを䜜成するこずで顧客の獲埗ず維持を向䞊できるよう支揎しおいたす。

Haivision ã¯ã€ã‚€ãƒ³ãƒ†ãƒªã‚žã‚§ãƒ³ãƒˆãªã‚¯ãƒ©ã‚Šãƒ‰ãƒ™ãƒŒã‚¹ã®ãƒ¡ãƒ‡ã‚£ã‚¢ ルヌティング サヌビスである SRT Hub を玹介したす。これは、顧客が Azureデヌタボックス゚ッゞ Avid、Telestream、Wowza、Cinegy、Make.tv の Hublet を䜿甚しおワヌクフロヌを倉革したす。

SES ã¯ã€è¡›æ˜ŸãŠã‚ˆã³ãƒžãƒãƒŒã‚žãƒ‰ メディア サヌビスの顧客向けに、Azure プラットフォヌム䞊でブロヌドキャスト グレヌドのメディア サヌビス スむヌトを開発したした。 SES は、マスタヌ プレむアりト、ロヌカラむズされたプレむアりト、広告の怜出ず眮換、Azure での高品質リアルタむム 24 時間 7 日マルチチャネル ゚ンコヌディングなど、フルマネヌゞド プレむアりト サヌビスの゜リュヌションをデモンストレヌションしたす。

シンクワヌズ äŸ¿åˆ©ãªã‚¯ãƒ©ã‚Šãƒ‰ ツヌルず眲名自動化テクノロゞを Azure で利甚できるようにしたす。 これらのサヌビスにより、メディア組織は Azure 䞊のラむブおよびオフラむン ビデオ ワヌクフロヌに倖囜語字幕を含む字幕を自動的に远加するこずが容易になりたす。
囜際䌁業 ã‚¿ã‚¿ã‚šãƒ«ãƒã‚·ãƒ†ã‚¯ãƒŽãƒ­ã‚žãƒŒ サヌビス䌚瀟である は、自瀟の OTT SaaS プラットフォヌム TEPlay を Azure Media Services に統合し、クラりドから OTT コンテンツを配信したす。 Tata Elxsi はたた、Falcon Eye の゚クスペリ゚ンス品質 (QoE) 監芖゜リュヌションを Microsoft Azure に導入し、意思決定のための分析ずメトリクスを提䟛したす。

Verizon Media ã¯ã€ã‚¹ãƒˆãƒªãƒŒãƒŸãƒ³ã‚° プラットフォヌムをベヌタ リリヌスずしお Azure で利甚できるようにしおいたす。 Verizon Media Platform は、DRM、広告挿入、XNUMX 察 XNUMX のパヌ゜ナラむズされたセッション、動的なコンテンツ眮換、ビデオ配信を含む゚ンタヌプラむズ グレヌドのマネヌゞド OTT ゜リュヌションです。 この統合により、ワヌクフロヌ、グロヌバル サポヌトずスケヌルが簡玠化され、Azure にあるいく぀かの独自機胜が利甚可胜になりたす。

出所 habr.com

コメントを远加したす