U tema di seguità un participante parlante in una videoconferenza hà guadagnatu impulsu in l'ultimi anni. A tecnulugia hà permessu di implementà algoritmi cumplessi per u processu di l'infurmazioni audio / video in tempu reale, chì hà incitatu Polycom, quasi 10 anni fà, à presentà a prima soluzione mainstream di u mondu cun seguimentu automaticu intelligente di parlanti. Per parechji anni, anu sappiutu per esse l'unicu pruprietariu di una tale suluzione, ma Cisco ùn hà micca bisognu di aspittà longu è hà purtatu à u mercatu a so versione di un sistema intelligente di duie camere, chì era un competitore ghjustu à a suluzione Polycom. Per parechji anni, stu segmentu di videoconferenza era limitatu da e capacità di parechji pruprietariu prudutti, ma stu articulu hè dedicatu à u primu universale soluzione per a guida di càmera per voce, cumpatibile cù l'infrastruttura hardware è software di videoconferenza.
Prima di passà à descrizzione di suluzioni è dimustrà e capacità, vogliu nutà un avvenimentu impurtante:
Sò onoratu di presentà à a cumunità Habra , dedicatu à e soluzioni di videoconferenza (VCC). Avà, grazia à i sforzi cumuni (u mio è UFO), hà a so propria casa nantu à Habré, è invitu à tutti quelli chì participanu à stu tema vastu è attuale à abbunà .
Dui scenarii per puntà a camera versu u parlante
À u mumentu, l'integratori di soluzioni di videoconferenza sceglienu per elli dui modi diffirenti per implementà u compitu di destinazione à u presentatore:
- Automaticu - Intelligente
- Semi-automaticu - programmable
A prima opzione hè solu suluzioni da Cisco, Polycom è altri fabricatori, avemu da cunsiderà quì sottu. Quì avemu trattatu di l'automatizazione cumpleta di puntà a camera à u participante parlante in a videoconferenza. Algoritmi unichi per processà i segnali audio / video permettenu à a camera di selezziunà a pusizione desiderata indipindente.
A seconda opzione hè sistemi d'automatizazione basati nantu à diversi cuntrolli di cuntrollu esterni, ùn avemu micca cunsideratu in dettagliu, perchè L'articulu hè dedicatu specificamente à u seguimentu automaticu di parlanti.
Ci hè un pocu di sustenidori di u sicondu scenariu per implementà a camera pointing, è ci sò ragioni per questu. Integratori sperimentati capiscenu chì e soluzioni intelligenti da Polycom è Cisco necessitanu cundizioni operative ideali per chì l'automatizazione funziona bè. Ma ùn hè micca sempre pussibule di assicurà tali cundizioni, cusì u funziunamentu di u sistema hè qualchì volta garantitu da a seguente suluzione à u prublema di punta di a camera:
1. Tutti i presets necessarii (pusizioni di u dispusitivu PTZ è u fattore di zoom otticu) sò inseriti manualmente in anticipu in a memoria di a camera (o qualchì volta in u controller di cuntrollu). Comu regula, questu hè un pianu generale di a sala di riunioni, è una vista di ogni participante di a cunferenza in modu di ritrattu.
2. In seguitu, l'iniziatori per chjamà u preset necessariu sò stallati in i lochi specificati - questi sò cunsola di microfonu o buttoni di radiu, in generale, qualsiasi dispositivu chì pò furnisce u cuntrollu di cuntrollu cun un signalu chì capisce.
3. U controller di cuntrollu hè programatu in tale manera chì ogni iniziatore hà u so propiu preset. Pianu generale di a stanza - tutti l'iniziatori sò disattivati.
In u risultatu, quandu si usa un sistema di cungressu, per esempiu, è un controller di cuntrollu, u parlante, prima di inizià u so discorsu, attiva a so cunsola di microfonu persunale. U sistema di cuntrollu processa istantaneamente a pusizione di a camera salvata.
Stu scenariu funziona perfettamente - u sistema ùn hà micca bisognu di fà triangulazione di voce è analisi video. Aghju pressatu u buttone è u preset hà travagliatu, senza ritardi o falsi pusitivi.
Sistemi di cuntrollu è automatizazione sò usati in stanzi grandi è cumplessi, induve qualchì volta micca una, ma parechje videocamere sò stallati. Eppo, per e sale di riunioni chjuche è mediu, i sistemi automatichi sò abbastanza adattati (se avete u budgetu).
Cuminciamu cù i babbi fundatori.
Direttore di Polycom EagleEye
Sta suluzione hà creatu una volta una sensazione in u campu di a videoconferenza. Polycom EagleEye Director hè stata a prima suluzione in u campu di a guida di càmera intelligente. A suluzione hè custituita da una unità di base EagleEye Director è duie camere. A peculiarità di quella prima implementazione hè chì una camera hè attribuita solu à una vista ravvicinata di u parlante, è a seconda - à un pianu generale di a sala di riunioni. À u listessu tempu, a camera di u pianu generale pò esse piazzata completamente separata da a basa in un altru locu in a sala di riunioni - ùn hè micca direttamente implicata in u prucessu di guida automatica.
U sistema funziona cusì:
- A camera generale di a camera hè attiva - tutti sò silenziu
- U parlante cumencia à parlà - a matrice di microfonu piglia a voce, a camera si move versu u sonu utilizendu tecnulugia patentata chì include a triangulazione di voce. A camera generale hè sempre attiva
- A camera principale hè ghjustu cuminciatu à circà a fonte di sonu, cunducendu analitiche video. U sistema identifica u parlante da a cunnessione ochji-nasu-bocca, inquadra a stampa di u parlante è mostra u flussu da a camera principale.
- U parlante cambia. L'array di microfonu capisce chì a voce vene da un altru locu. U pianu generale hè attivatu di novu.
- E poi in un circhiu, partendu da u puntu 2
- Se u novu parlante hè in u quadru cù u precedente, u sistema faci un cambiamentu di pusizioni "calda" senza cambià u flussu attivu à u colpu generale.
U svantaghju, in my opinion, hè a prisenza di una sola camera principale. Questu risultatu in un ritardu significativu quandu cambia i parlanti. È ogni volta à u mumentu di a puntata, u sistema accende u pianu generale di a stanza - durante una conversazione vivace, stu flickering cumencia à irritate.

Polycom EagleEye Director II
Questa hè a seconda versione di a suluzione da Polycom, chì hè stata liberata pocu pocu. U principiu di funziunamentu hà subitu cambiamenti è hè diventatu più cum'è una suluzione da Cisco. Avà e duie camere PTZ sò i principali è servenu per cambià senza interruzioni i canali da un presentatore à l'altru. U layout generale di a sala di riunione hè avà catturatu da una camera separata integrata in u corpu di l'unità base EagleEye Director II. Per una certa ragione, u flussu da questa camera di grandu angulu hè visualizatu in una finestra addiziale in u cantonu di u screnu, occupendu 1/9 di u flussu principale. U principiu di posizionamentu hè u listessu - triangulazione di voce è analisi di flussu video. E i buttiglii sò listessi: se u sistema ùn vede micca a bocca parlante, a camera ùn hà micca scopu. E sta situazione pò succorsu abbastanza spessu - u parlante hà vultatu, u parlante hà vultatu di latu, u parlante hè un ventrilocu, u parlante hà cupertu a bocca cù a manu o un documentu.
I dui video promozionali sò stati girati in modu cumpetente - 2 persone parlanu à turnu, è apre a bocca cum'è à un appuntamentu cù un logopedista. Ma ancu in tali cundizioni raffinati ci hè un ritardu assai significativu. Ma l'inquadramentu hè impeccable - un ritrattu còmode.

Cisco TelePresence SpeakerTrack 60
Per discrive sta suluzione, aghju aduprà u testu da u librettu ufficiale.
SpeakerTrack 60 adopta un approcciu unicu di doppia camera per cambià rapidamente direttamente trà i participanti. Una camera trova rapidamente un primu pianu di u presentatore attivu, mentre chì l'altra cerca è mostra u prossimu presentatore. A funzione MultiSpeaker impedisce u cambiamentu innecessariu se u prossimu parlante hè digià presente in u quadru attuale.
Sfortunatamente, ùn aghju micca avutu a pussibilità di pruvà u SpeakerTrack 60 stessu. Dunque, e cunclusioni anu da esse tirate nantu à l'opinione "da u campu" è basatu nantu à i risultati di l'analisi di u video di dimostrazione sottu. Aghju cuntatu un ritardu massimu di quasi 8 seconde quandu puntava à un novu presentatore. U ritardu mediu era 2-3 seconde, à ghjudicà da u video.

HUAWEI Intelligent Tracking Video Camera VPT300
Aghju trovu sta suluzione da Huawei per accidente. U sistema costa circa $ 9K. Funziona solu cù terminali Huawei. I sviluppatori anu aghjustatu u so propiu "truccu" - un layout video da dui parlanti nantu à una schermu se ùn ci hè nimu in a stanza. In termini di caratteristiche è funziunalità dichjarata, questa hè una versione assai interessante di u sistema di guida automatica. Ma, sfurtunatamenti, ùn aghju trovu assolutamente micca materiale demo. L'unicu video chì apparsu nantu à questu tema era una rivista video editata di a suluzione, senza sonu originale, pusatu in musica. Cusì, ùn era micca pussibule di evaluà a qualità di u sistema. Per quessa, ùn aghju micca cunsideratu sta opzione.
Vecu chì Huawei hà un blog attivu nantu à Habré - forse i culleghi puderanu pubblicà alcune informazioni utili nantu à stu pruduttu.
Novu - suluzione universale
- un monobloccu, cumprese duie camere PTZ per i parlanti di seguimentu, duie camere integrate per analizà u layout generale di a stanza, è ancu un array di microfonu integratu in a basa di u casu - cum'è pudete vede, ùn ci sò micca voluminu strutture fragili cum'è quelli di l'avversari.
Prima di principià à descriverà u novu pruduttu, aghjustà e caratteristiche è e caratteristiche di e soluzioni di Cisco è Polycom per pudè paragunà. cù offerte esistenti.
Direttore di Polycom EagleEye
- Costu di vendita di u sistema senza terminal - $ 13K
- Costu minimu di EagleEye Director + Soluzione RealPresence Group 500 - $ 19K
- Ritardo medio di commutazione 3 seconde
- Guida vocale + analisi video
- Esigenze elevate nantu à a faccia di u parlante - ùn pudete micca ammuccià a bocca
- Incompatibilità cù l'equipaggiu di terzu
Cisco TelePresence SpeakerTrack 60
- Costu di vendita di u sistema senza terminal - $ 15,9K
- Costu minimu di a soluzione TelePresence SpeakerTrack 60 + SX80 Codec - $ 30K
- Ritardo medio di commutazione 3 seconde
- Guida vocale + analisi video
- Requisiti per a faccia di u parlante - ùn hà micca verificatu, ùn hà micca truvatu infurmazione
- Incompatibilità cù l'equipaggiu di terzu
SmartCam A12 Voice Tracking
- Costu di vendita di u sistema senza terminal - $ 6,2K
- U costu minimu di suluzione - $ 10.8K
- U costu minimu di suluzione - $ 7,7K
- Ritardo medio di commutazione 3 seconde
- Guida vocale + analisi video
- Requisiti per a faccia di u parlante - senza esigenze
- Compatibilità di terze parti - HDMI
Cum'è dui vantaghji principali è innegabile di a suluzione SmartCam A12 Voice Tracking trovu:
- Versatilità di cunnessione - via HDMI, u sistema si integra cù i sistemi di terminale di videoconferenza hardware è software
- Low costu - cù funziunalità simili, A12VT hè parechje volte più assequible nantu à un budgetu cà e pruposte descritte sopra.
Per dimustrà cumu funziona u sistema, avemu arregistratu una rivista video. U compitu ùn era micca tantu publicità quant'è funziunale. Dunque, u video hè privo di u pathos di un video promozionale Polycom. U locu sceltu per a presentazione ùn era micca un uffiziu rappresentante, ma una sala di riunioni di u laboratoriu di u nostru cumpagnu, a cumpagnia IPMatika.
U mo scopu ùn era micca di ammuccià i difetti di u sistema, ma, à u cuntrariu, di espose i buttiglii di a funziunalità, di furzà u sistema à sbaglià.

In u mo parè, u sistema hà passatu i testi cù successu. Dicu questu cun cunfidenza perchè à u mumentu di scrive stu articulu, a suluzione visitatu una decina di veri sale riunioni di i nostri clienti. I malfunzionamenti di l'automatizazione sò stati osservati solu in cundizioni di violazione di e regule operative cunsigliatu. In particulare, a distanza minima à i participanti vicini. Sè site assai vicinu à a camera, menu di un metru, u microfonu di u microfonu ùn puderà micca ricunnosce è a lente ùn serà micca capaci di seguità.

In più di a distanza, ci hè un altru requisitu - l'altezza di a camera.

Se a camera hè stallata troppu bassu, i prublemi cù u posizionamentu di a voce ponu accade. L'opzione sottu a TV, sfurtunatamenti, ùn hà micca travagliatu.
Ma l'installazione di u sistema sopra à un dispositivu di visualizazione hè un modu ideale per u funziunamentu di u dispusitivu. U scaffale di a camera hè inclusu; solu u supportu di muru hè supportatu cum'è standard.
Cumu funziona SmartCam A12 Voice Tracking
I principali lenti PTZ anu rolli uguali - u so compitu hè di seguità alternativamente i presentatori è di vede u pianu generale. L'analisi di l'imaghjini generale in a stanza è a determinazione di a distanza à l'uggetti hè realizatu cù flussi video ricevuti da duie camere integrate in a basa di u sistema. Questa funzione permette di riduce u tempu di reazione di a lente quandu cambia u parlante à 1-2 seconde. A camera riesce à alternà trà i participanti à un ritmu còmode, ancu s'ellu scambianu frasi brevi.
Una dimostrazione video di u funziunamentu di u sistema riflette cumplettamente a funziunalità . Ma, per quelli chì ùn anu micca vistu u video, descriveraghju in parolle u principiu di funziunamentu di l'automatizazione:
- A stanza hè viota: una di e lenti mostra u pianu generale, a seconda hè pronta - aspittendu a ghjente
- A ghjente entra in a stanza è piglia i so posti: a lente libera trova i dui participanti estremi è inquadra l'imaghjini intornu à elli, tagliendu a parte viota di a stanza.
- Mentre a ghjente si move, i lenti si turnanu seguitendu tutti in a stanza, mantenenduli in u centru di u quadru.
- U parlante principia à parlà: a lente hè attiva, aghjusta à u pianu generale. U sicondu hè destinatu à u parlante, è solu dopu passa in modu di trasmissione
- U parlante cambia: a lente aghjustata à u primu parlante hè attivu, è a seconda lente abbanduneghja u colpu largu è si adatta à u novu parlante.
- À u mumentu di cambià l'imaghjini da u primu parlante à u sicondu, a lente libera hè immediatamente aghjustata à u pianu generale di a stanza.
- Sì tutti sò silenziu, a lente libera mostrarà un pianu generale prontu senza ritardi
- Se u parlante cambia di novu, a lente libera andarà in cerca di ellu
cunchiusioni
In u mo parè, sta suluzione, presentata à l'ISE è l'ISR l'annu passatu, avvicina l'alta tecnulugia - se micca à a ghjente, allora à l'affari di sicuru. Hè chjaru chì per 400 mila rubli, pochi pirsuni cumprà un tali "ghjocu" per a casa, ma per l'affari, per a videoconferenza corporativa, questu hè una suluzione assai assequible è còmuda à u prublema di l'auto-puntamentu di una camera.
Data a versatilità , u sistema pò esse usatu cum'è una suluzione da zero, o cum'è una estensione di a funziunalità di una infrastruttura di videoconferenza esistente. A cunnessione via HDMI hè un grande passu versu l'utilizatore, in cuntrastu cù i sistemi proprietarii di i fabricatori sopra-descritti.
Vogliu ringrazià i partenarii chì anu assistitu à a prova.
cumpagnia - per u terminal Yealink VC880, sala di riunioni è Yakushina Yura.
cumpagnia - per u dirittu di a prima è esclusiva rivista di a suluzione è a prestazione di u sistema per pruvà.
In l'ultimu articulu , cum'è promozione di u situ web и avemu annunziatu 10% di sconto da u prezzu in per parola codice HABR finu à a fine di l'estate 2019.
U scontu si applica à i prudutti in e seguenti sezioni:
À a decisione Offre un scontu supplementu di 5% à u 10% digià esistente - un totale di 15% finu à a fine di l'estate 2019.
Aspettu i vostri cumenti è risposte in l'indagine!
ti ringraziu per u vostru attinzioni.
sincerità,
Kirill Usikov ()
Capu di
Sistemi di videosurveglianza è videoconferenza
1@stss.ru
Solu l'utilizatori registrati ponu participà à l'indagine. , per piacè.
Quantu hè utile SmartCam A12 Voice Tracking?
Infine, una soluzione universale per i terminali di software è hardware hè apparsu!
A suluzione hè bona, ma ci sò altre opzioni dispunibili (scrivu in i cumenti)
U sistema hè debbule, ùn ghjunghje micca Polycom è Cisco - scriveraghju in i cumenti perchè duvete pagà 3 volte di più!
Quale hè bisognu di l'autoguida in una sala di riunioni in ogni casu?
Quale hè bisognu di una camera PTZ in una sala di riunioni in ogni casu? - Aghju cunnessu a webcam è era bè!
8 utilizatori anu vutatu. 5 utilizatori si sò astenuti.
Source: www.habr.com
