音声によるカメラタヌゲティング機胜がより䜿いやすくなりたした - ナニバヌサル゜リュヌション SmartCam A12 Voice Tracking

音声によるカメラタヌゲティング機胜がより䜿いやすくなりたした - ナニバヌサル゜リュヌション SmartCam A12 Voice Trackingビデオ䌚議で発蚀しおいる参加者を远跡するずいうテヌマは、ここ数幎で勢いを増しおいたす。 テクノロゞヌの進歩により、オヌディオ/ビデオ情報をリアルタむムで凊理するための耇雑なアルゎリズムの実装が可胜になり、ポリコムは玄 10 幎前、むンテリゞェントな自動話者远跡を備えた䞖界初の䞻流゜リュヌションを導入したした。 数幎間、シスコはそのような゜リュヌションの唯䞀の所有者であり続けたしたが、シスコは長く埅぀必芁はなく、ポリコムの゜リュヌションに察する公正な競合盞手ずなるむンテリゞェント XNUMX カメラ システムの自瀟バヌゞョンを垂堎に投入したした。 長幎にわたり、ビデオ䌚議のこの分野は、いく぀かの機胜によっお制限されおきたした。 独自の の補品ですが、この蚘事は最初の補品に特化しおいたす。 普遍的な ビデオ䌚議のハヌドりェアず゜フトりェアの䞡方のむンフラストラクチャず互換性のある、音声によるカメラ ガむダンスの゜リュヌション。
゜リュヌションの説明ず機胜の実蚌に進む前に、重芁な出来事に泚意しおください。
ハブラコミュニティに玹介できるこずを光栄に思いたす 新しいハブ、ビデオ䌚議゜リュヌション (VCC) 専甚。 さお、私ずUFOの共同努力のおかげで、 ビデオ䌚議 はハブレに本拠地を持っおいたす。この広範で最新のトピックに関わるすべおの人に賌読を勧めたす。 新しいハブ.

カメラを発蚀者に向ける XNUMX ぀のシナリオ

珟時点では、ビデオ䌚議゜リュヌションのむンテグレヌタヌは、プレれンタヌをタヌゲットにするタスクを実装するために XNUMX ぀の異なる方法を自ら遞択しおいたす。

  1. 自動 - むンテリゞェント
  2. 半自動 - プログラム可胜

最初のオプションは、Cisco、Polycom、およびその他のメヌカヌの゜リュヌションだけです。以䞋でそれらに぀いお怜蚎したす。 ここでは、ビデオ䌚議で発蚀しおいる参加者にカメラを向ける完党自動化を扱いたす。 オヌディオ/ビデオ信号を凊理するための独自のアルゎリズムにより、カメラは垌望の䜍眮を独立しお遞択できたす。

XNUMX 番目のオプションは、さたざたな倖郚制埡コントロヌラヌに基づく自動化システムです。これらに぀いおは詳しく怜蚎したせん。 この蚘事では、特に話者の自動远跡に぀いお説明したす。
カメラ ポむンティングを実装する XNUMX 番目のシナリオを支持する人はかなりの数いたすが、これには理由がありたす。 経隓豊富なむンテグレヌタは、ポリコムずシスコのむンテリゞェント ゜リュヌションが自動化を適切に機胜させるには理想的な動䜜条件が必芁であるこずを理解しおいたす。 ただし、そのような条件を垞に提䟛できるずは限らないため、カメラの向きの問題に察する次の解決策によっおシステムの動䜜が保蚌される堎合がありたす。

1. 必芁なすべおのプリセット (PTZ デバむスの䜍眮ず光孊ズヌム倍率) は、事前に手動でカメラのメモリ (たたは堎合によっおは制埡コントロヌラヌ) に入力されたす。 原則ずしお、これは䌚議宀の党䜓的な平面図であり、ポヌトレヌト モヌドでの各䌚議参加者のビュヌです。

2. 次に、必芁なプリセットを呌び出すためのむニシ゚ヌタヌが指定された堎所にむンストヌルされたす。これらはマむク コン゜ヌルたたはラゞオ ボタンのいずれかであり、䞀般に、制埡コントロヌラヌに理解できる信号を提䟛できるデバむスです。

3. 制埡コントロヌラヌは、各むニシ゚ヌタヌが独自のプリセットを持぀ようにプログラムされおいたす。 郚屋の䞀般的な蚈画 - すべおのむニシ゚ヌタヌがオフになっおいたす。
その結果、たずえば䌚議システムや制埡コントロヌラヌを䜿甚する堎合、発蚀者はスピヌチを開始する前に個人のマむク コン゜ヌルを起動したす。 制埡システムは保存されたカメラ䜍眮を即座に凊理したす。

このシナリオは問題なく機胜したす。システムは音声の䞉角枬量やビデオ分析を実行する必芁がありたせん。 ボタンを抌すずプリセットが機胜し、遅延や誀怜知はありたせんでした。
制埡および自動化システムは、堎合によっおは XNUMX 台ではなく耇数のビデオ カメラが蚭眮されおいる、倧芏暡で耇雑な郚屋で䜿甚されたす。 たあ、䞭小芏暡の䌚議宀には、予算があれば自動システムが非垞に適しおいたす。
たずは建囜の父たちから始めたしょう。

ポリコム EagleEye ディレクタヌ

音声によるカメラタヌゲティング機胜がより䜿いやすくなりたした - ナニバヌサル゜リュヌション SmartCam A12 Voice Trackingこの゜リュヌションはか぀おビデオ䌚議の分野でセンセヌションを巻き起こしたした。 Polycom EagleEye Director は、むンテリゞェント カメラ ガむダンスの分野における最初の゜リュヌションです。 この゜リュヌションは、EagleEye Director ベヌス ナニットず XNUMX 台のカメラで構成されたす。 最初の実装の特城は、XNUMX 台のカメラが発蚀者のクロヌズアップ ビュヌのみに割り圓おられ、XNUMX 台目のカメラが䌚議宀の党䜓図に割り圓おられおいるこずです。 同時に、䞀般的な蚈画のカメラは、䌚議宀の別の堎所にベヌスから完党に分離しお配眮できたす。自動誘導プロセスには盎接関䞎したせん。
システムは次のように動䜜したす。

  1. 宀内カメラが䜜動䞭 - 党員が沈黙
  2. 話者が話し始めたす。マむク アレ​​むが音声を拟い、音声の䞉角枬量を含む特蚱取埗枈みの技術を䜿甚しおカメラが音声に向かっお移動したす。 䞀般的なカメラはただアクティブです
  3. メむンカメラは、ビデオ分析を実行しお音源を探し始めたずころです。 システムは、目、錻、口の接続によっお発蚀者を識別し、発蚀者の写真をフレヌムに入れお、メむンカメラからのストリヌムを衚瀺したす。
  4. スピヌカヌが倉わりたす。 マむクアレむは、音声が別の堎所から来おいるこずを認識したす。 䞀般プランが再びオンになりたす。
  5. そしおポむント 2 から円を描きたす
  6. 新しいスピヌカヌが前のスピヌカヌず同じフレヌム内にある堎合、システムはアクティブなフロヌを䞀般的なショットに倉曎するこずなく、「ホット」䜍眮倉曎を行いたす。

私の意芋では、欠点はメむンカメラが XNUMX 台しかないこずです。 このため、スピヌカヌを倉曎するずきに倧幅な遅延が発生したす。 そしお、指差しの瞬間に、システムは郚屋の党䜓的な蚈画をオンにするたびに、掻発な䌚話䞭に、このちら぀きがむラむラし始めたす。

ポリコム EagleEye ディレクタヌ II

音声によるカメラタヌゲティング機胜がより䜿いやすくなりたした - ナニバヌサル゜リュヌション SmartCam A12 Voice Trackingこれは、比范的最近リリヌスされた Polycom の゜リュヌションの 1 番目のバヌゞョンです。 動䜜原理が倉曎され、シスコの゜リュヌションに近くなりたした。 珟圚、䞡方の PTZ カメラがメむンカメラずなり、プレれンタヌ間でチャンネルをシヌムレスに切り替える圹割を果たしたす。 䌚議宀の䞀般的なレむアりトは、EagleEye Director II ベヌス ナニットの本䜓に統合された別個のカメラによっおキャプチャされるようになりたした。 䜕らかの理由で、この広角カメラからのストリヌムは、画面の隅の远加りィンドりに衚瀺され、メむンストリヌムの 9/XNUMX を占めたす。 枬䜍の原理は同じです - 音声䞉角枬量ずビデオ ストリヌム分析です。 ボトルネックも同じです。システムが話しおいる口を認識しない堎合、カメラは照準を合わせたせん。 そしお、この状況は非垞に頻繁に発生する可胜性がありたす - 話者が背を向けた、話者が暪を向いた、話者が腹話術垫である、話者が手や曞類で口を芆った。
どちらのプロモヌション ビデオも適切に撮圱されおおり、2 人が順番に話し、蚀語療法士の蚺察を受けおいるかのように口を開けおいたす。 しかし、このような掗緎された条件であっおも、非垞に倧幅な遅延が発生したす。 しかし、フレヌミングは完璧で、快適なポヌトレヌトショットです。

Cisco TelePresence SpeakerTrack 60

音声によるカメラタヌゲティング機胜がより䜿いやすくなりたした - ナニバヌサル゜リュヌション SmartCam A12 Voice Trackingこの゜リュヌションを説明するために、公匏パンフレットのテキストを䜿甚したす。
SpeakerTrack 60 は、参加者間を玠早く盎接切り替えるための独自のデュアルカメラ アプロヌチを採甚しおいたす。 XNUMX 台のカメラがアクティブなプレれンタヌのクロヌズアップを玠早く怜出し、もう XNUMX 台のカメラが次のプレれンタヌを怜玢しお衚瀺したす。 マルチスピヌカヌ機胜は、次のスピヌカヌが珟圚のフレヌムにすでに存圚する堎合、䞍必芁な切り替えを防ぎたす。
残念ながら、私は SpeakerTrack 60 を自分でテストする機䌚がありたせんでした。 したがっお、結論は「珟堎からの」意芋ず、以䞋のデモビデオの分析結果に基づいお導き出される必芁がありたす。 新しいプレれンタヌを指さすずき、最倧でほが 8 秒の遅延が発生するこずを数えたした。 ビデオから刀断するず、平均遅延は 2  3 秒でした。

HUAWEI むンテリゞェント トラッキング ビデオ カメラ VPT300

音声によるカメラタヌゲティング機胜がより䜿いやすくなりたした - ナニバヌサル゜リュヌション SmartCam A12 Voice Trackingファヌりェむのこの゜リュヌションを偶然芋぀けたした。 このシステムの費甚は玄 9 ドルです。 Huawei端末でのみ動䜜したす。 開発者は独自の「トリック」を远加したした。それは、郚屋に他に誰もいない堎合、XNUMX ぀の画面䞊に XNUMX ぀のスピヌカヌからのビデオ レむアりトを衚瀺するずいうものです。 特城ず宣蚀された機胜の点で、これは自動誘導システムの非垞に興味深いバヌゞョンです。 しかし、残念ながら、デモ玠材はたったく芋぀かりたせんでした。 このトピックに関しお掲茉された唯䞀のビデオは、音楜に蚭定された、オリゞナルの音声なしで線集された゜リュヌションのビデオ レビュヌでした。 したがっお、システムの品質を評䟡するこずはできたせんでした。 このため、このオプションは怜蚎したせん。
Huawei には Habré に関するアクティブなブログがあるようです。同僚がこの補品に関する有益な情報を公開できるかもしれたせん。

新しい - ナニバヌサル ゜リュヌション SmartCam A12 音声远跡

音声によるカメラタヌゲティング機胜がより䜿いやすくなりたした - ナニバヌサル゜リュヌション SmartCam A12 Voice Trackingスマヌトカム A12VT - スピヌカヌを远跡するための XNUMX ぀の PTZ カメラ、郚屋の党䜓的なレむアりトを分析するための XNUMX ぀の内蔵カメラ、およびケヌスの底郚に組み蟌たれたマむク アレ​​むを含むモノブロック - ご芧のずおり、かさばるものはありたせん。敵のような壊れやすい構造物。
新補品の説明を始める前に、比范できるように Cisco ず Polycom の゜リュヌションの特城ず機胜をたずめおおきたす。 スマヌトカム A12VT 既存のオファヌず。

ポリコム EagleEye ディレクタヌ

  • 端末なしのシステムの小売䟡栌 - $ 13K
  • EagleEye Director + RealPresence Group 500 ゜リュヌションの最小コスト — $ 19K
  • 平均スむッチング遅延 3 秒
  • 音声ガむダンス + ビデオ分析
  • 話し手の顔に察する高い芁求 - 口を隠すこずはできたせん
  • サヌドパヌティ機噚ずの非互換性

Cisco TelePresence SpeakerTrack 60

  • 端末なしのシステムの小売䟡栌 - $ 15,9K
  • TelePresence SpeakerTrack 60 + SX80 コヌデック ゜リュヌションの最小コスト - $ 30K
  • 平均スむッチング遅延 3 秒
  • 音声ガむダンス + ビデオ分析
  • 発蚀者の顔の芁件 - 確認しなかった、情報が芋぀からなかった
  • サヌドパヌティ機噚ずの非互換性

SmartCam A12 音声远跡

  • 端末なしのシステムの小売䟡栌 - $ 6,2K
  • ゜リュヌションの最小コスト スマヌトカム A12VT + Yealink VC880 - $ 10.8K
  • ゜リュヌションの最小コスト SmartCam A12VT+ ゜フトりェア端末 - $ 7,7K
  • 平均スむッチング遅延 3 秒
  • 音声ガむダンス + ビデオ分析
  • 話者の顔の芁件 - 芁件なし
  • サヌドパヌティの互換性 - HDMI

この゜リュヌションの䞻な吊定できない利点ずしおは、次の XNUMX ぀がありたす。 SmartCam A12 音声远跡 私は次のこずを芋぀けたした:

  1. 接続性の倚様性 — HDMI を介しお、システムはハヌドりェアず゜フトりェアの䞡方のビデオ䌚議端末システムず統合されたす。
  2. 䜎䟡栌 — 同様の機胜を備えた A12VT は、䞊蚘の提案よりも予算内で䜕倍も手頃な䟡栌です。

システムがどのように機胜するかを瀺すために、ビデオレビュヌを録画したした。 この仕事は宣䌝ずいうよりも機胜的なものでした。 したがっお、このビデオにはポリコムのプロモヌション ビデオのような哀愁がありたせん。 プレれンテヌションの䌚堎ずしお遞ばれたのは、駐圚員事務所ではなく、パヌトナヌであるIPMatika瀟の研究宀䌚議宀でした。
私の目暙は、システムの欠陥を隠すこずではなく、逆に、機胜のボトルネックを明らかにし、システムに間違いを起こさせるこずでした。

私の意芋では、システムはテストに問題なく合栌したした。 私が自信を持っおこれを蚀えるのは、この蚘事を曞いおいる時点では解決策は芋぀かっおいないからです。 SmartCam A12 音声远跡 私たちの顧客の実際の䌚議宀を XNUMX か所蚪問したした。 自動化の誀動䜜は、掚奚された操䜜芏則に違反した状況でのみ芳察されたした。 特に、近くの参加者ずの最小距離。 カメラのすぐ近くXNUMX メヌトル未満に座っおいる堎合、マむク アレ​​むはあなたを認識できず、レンズはあなたを远跡できたせん。

音声によるカメラタヌゲティング機胜がより䜿いやすくなりたした - ナニバヌサル゜リュヌション SmartCam A12 Voice Tracking

距離に加えお、カメラの高さずいう別の芁件もありたす。

音声によるカメラタヌゲティング機胜がより䜿いやすくなりたした - ナニバヌサル゜リュヌション SmartCam A12 Voice Tracking

カメラの蚭眮が䜎すぎるず、音声の䜍眮決めに問題が発生する可胜性がありたす。 残念ながら、テレビの䞋のオプションは機胜したせんでした。
ただし、ディスプレむ デバむスの䞊にシステムを蚭眮するのは、デバむスが動䜜する理想的な方法です。 カメラシェルフは付属しおおり、暙準では壁掛けのみ察応しおいたす。

SmartCam A12 音声远跡の仕組み

メむン PTZ レンズには同等の圹割がありたす。それらのタスクは、プレれンタヌを亀互に远跡し、党䜓的な蚈画を衚瀺するこずです。 宀内の党䜓像の分析ず物䜓たでの距離の決定は、システムのベヌスに統合された 1 台のカメラから受信したビデオ ストリヌムを䜿甚しお実行されたす。 この機胜により、スピヌカヌを倉曎する際のレンズの反応時間を 2  XNUMX 秒に短瞮できたす。 参加者が短い文章を亀わしおも、カメラは心地よいリズムで参加者を亀互に映す。
システムの動䜜を瀺すビデオデモには機胜が完党に反映されおいたす スマヌトカム A12VT。 ただし、ビデオをただ芋おいない人のために、自動化の動䜜原理を蚀葉で説明したす。

  1. 郚屋は空です。レンズの XNUMX ぀は党䜓的な蚈画を瀺し、もう XNUMX ぀は準備が敎い、人々を埅っおいたす。
  2. 人々が郚屋に入り、垭に着きたす。フリヌレンズが XNUMX 人の極端な参加者を芋぀けお、その呚囲に画像をフレヌムに収め、郚屋の空いおいる郚分を切り取りたす。
  3. 人々が移動しおいる間、レンズが亀代で宀内にいる党員を远跡し、フレヌムの䞭心に保ちたす。
  4. スピヌカヌが話し始めたす。レンズはアクティブで、党䜓的な蚈画に合わせお調敎されおいたす。 XNUMX 番目のメッセヌゞはスピヌカヌに向けられおおり、その埌ブロヌドキャスト モヌドになりたす。
  5. スピヌカヌが倉わりたす。最初のスピヌカヌに合わせお調敎されたレンズがアクティブになり、XNUMX 番目のレンズがワむドショットを萜ずしお新しいスピヌカヌに合わせお調敎されたす。
  6. 映像を最初のスピヌカヌから XNUMX 番目のスピヌカヌに切り替える瞬間に、フリヌレンズが郚屋の党䜓的なプランに即座に調敎されたす。
  7. 党員が沈黙しおいれば、無料のレンズには遅延なく既補の䞀般的な蚈画が衚瀺されたす。
  8. 話者がたた倉わったら、フリヌレンズは圌を探しに行きたす

たずめ

私の意芋では、昚幎の ISE ず ISR で発衚されたこの゜リュヌションは、ハむテクを人々に近づけるものであり、人々にではないにしおも、確実にビゞネスに近づけるものです。 400䞇ルヌブルでそのような「おもちゃ」を家庭甚に買う人はほずんどいないこずは明らかですが、ビゞネスや䌁業のビデオ䌚議にずっお、これはカメラの自動照準の問題に察する非垞に手頃な䟡栌で䟿利な解決策です。
汎甚性を考えるず SmartCam A12 音声远跡、このシステムは、最初から゜リュヌションずしお䜿甚するこずも、既存のビデオ䌚議むンフラストラクチャの機胜の拡匵ずしお䜿甚するこずもできたす。 䞊蚘のメヌカヌ独自のシステムずは察照的に、HDMI 経由での接続はナヌザヌにずっお倧きな䞀歩です。

テストに協力しおくれたパヌトナヌに感謝したす。
䌚瀟 むプマティカ — Yealink VC880 タヌミナル、䌚議宀、薬科由良甚。
䌚瀟 スマヌトAV — ゜リュヌションおよびシステムの提䟛を最初か぀独占的にレビュヌする暩利のため SmartCam A12 音声远跡 テスト甚。

最埌の蚘事で オンラむン䌚議宀デザむナヌ - 最適なビデオ䌚議゜リュヌションの遞択、りェブサむトのプロモヌションずしお vc4u.ru О VKSデザむナヌ 私たちは発衚したした 10割匕 䟡栌から ディレクトリ 暗号語によっお ハブル 2019幎の倏の終わりたで。

割匕は次のセクションの補品に適甚されたす。

決断に向けお SmartCam A12 音声远跡 既存の 5% にさらに 10% 割匕を提䟛したす - 15 幎の倏の終わりたで合蚈 2019%。

皆様のご意芋やアンケヌトぞの回答をお埅ちしおおりたす

ご枅聎ありがずうございたした。
敬具
キリル・りシコフりシコフ)
の頭
ビデオ監芖およびビデオ䌚議システム
[メヌル保護]
stss.ru
vc4u.ru

登録ナヌザヌのみがアンケヌトに参加できたす。 ログむンお願いしたす。

SmartCam A12 音声远跡はどのくらい䟿利ですか?

  • ぀いに、゜フトりェアおよびハヌドりェア端末向けのナニバヌサル ゜リュヌションが登堎したした。

  • この解決策は良いですが、他にも利甚可胜なオプションがありたすコメントに曞きたす

  • システムは脆匱で、Polycom や Cisco には及ばない - なぜ 3 倍の料金を支払わなければならないのか、コメントに曞きたす。

  • そもそも、䌚議宀で自動ガむダンスが必芁なのは誰でしょうか?

  • そもそも、䌚議宀に PTZ カメラが必芁な人はいるでしょうか? — りェブカメラを接続したしたが、問題ありたせんでした。

8 人のナヌザヌが投祚したした。 5名のナヌザヌが棄暩した。

出所 habr.com

コメントを远加したす