A funzione di targeting camera da voce hè diventata più accessibile - a suluzione universale SmartCam A12 Voice Tracking

A funzione di targeting camera da voce hè diventata più accessibile - a suluzione universale SmartCam A12 Voice TrackingU tema di seguità un participante parlante in una videoconferenza hà guadagnatu impulsu in l'ultimi anni. A tecnulugia hà permessu di implementà algoritmi cumplessi per u processu di l'infurmazioni audio / video in tempu reale, chì hà incitatu Polycom, quasi 10 anni fà, à presentà a prima soluzione mainstream di u mondu cun seguimentu automaticu intelligente di parlanti. Per parechji anni, anu sappiutu per esse l'unicu pruprietariu di una tale suluzione, ma Cisco ùn hà micca bisognu di aspittà longu è hà purtatu à u mercatu a so versione di un sistema intelligente di duie camere, chì era un competitore ghjustu à a suluzione Polycom. Per parechji anni, stu segmentu di videoconferenza era limitatu da e capacità di parechji pruprietariu prudutti, ma stu articulu hè dedicatu à u primu universale soluzione per a guida di càmera per voce, cumpatibile cù l'infrastruttura hardware è software di videoconferenza.
Prima di passà à descrizzione di suluzioni è dimustrà e capacità, vogliu nutà un avvenimentu impurtante:
Sò onoratu di presentà à a cumunità Habra novu hub, dedicatu à e soluzioni di videoconferenza (VCC). Avà, grazia à i sforzi cumuni (u mio è UFO), Video cunferenza hà a so propria casa nantu à Habré, è invitu à tutti quelli chì participanu à stu tema vastu è attuale à abbunà novu hub.

Dui scenarii per puntà a camera versu u parlante

À u mumentu, l'integratori di soluzioni di videoconferenza sceglienu per elli dui modi diffirenti per implementà u compitu di destinazione à u presentatore:

  1. Automaticu - Intelligente
  2. Semi-automaticu - programmable

A prima opzione hè solu suluzioni da Cisco, Polycom è altri fabricatori, avemu da cunsiderà quì sottu. Quì avemu trattatu di l'automatizazione cumpleta di puntà a camera à u participante parlante in a videoconferenza. Algoritmi unichi per processà i segnali audio / video permettenu à a camera di selezziunà a pusizione desiderata indipindente.

A seconda opzione hè sistemi d'automatizazione basati nantu à diversi cuntrolli di cuntrollu esterni, ùn avemu micca cunsideratu in dettagliu, perchè L'articulu hè dedicatu specificamente à u seguimentu automaticu di parlanti.
Ci hè un pocu di sustenidori di u sicondu scenariu per implementà a camera pointing, è ci sò ragioni per questu. Integratori sperimentati capiscenu chì e soluzioni intelligenti da Polycom è Cisco necessitanu cundizioni operative ideali per chì l'automatizazione funziona bè. Ma ùn hè micca sempre pussibule di assicurà tali cundizioni, cusì u funziunamentu di u sistema hè qualchì volta garantitu da a seguente suluzione à u prublema di punta di a camera:

1. Tutti i presets necessarii (pusizioni di u dispusitivu PTZ è u fattore di zoom otticu) sò inseriti manualmente in anticipu in a memoria di a camera (o qualchì volta in u controller di cuntrollu). Comu regula, questu hè un pianu generale di a sala di riunioni, è una vista di ogni participante di a cunferenza in modu di ritrattu.

2. In seguitu, l'iniziatori per chjamà u preset necessariu sò stallati in i lochi specificati - questi sò cunsola di microfonu o buttoni di radiu, in generale, qualsiasi dispositivu chì pò furnisce u cuntrollu di cuntrollu cun un signalu chì capisce.

3. U controller di cuntrollu hè programatu in tale manera chì ogni iniziatore hà u so propiu preset. Pianu generale di a stanza - tutti l'iniziatori sò disattivati.
In u risultatu, quandu si usa un sistema di cungressu, per esempiu, è un controller di cuntrollu, u parlante, prima di inizià u so discorsu, attiva a so cunsola di microfonu persunale. U sistema di cuntrollu processa istantaneamente a pusizione di a camera salvata.

Stu scenariu funziona perfettamente - u sistema ùn hà micca bisognu di fà triangulazione di voce è analisi video. Aghju pressatu u buttone è u preset hà travagliatu, senza ritardi o falsi pusitivi.
Sistemi di cuntrollu è automatizazione sò usati in stanzi grandi è cumplessi, induve qualchì volta micca una, ma parechje videocamere sò stallati. Eppo, per e sale di riunioni chjuche è mediu, i sistemi automatichi sò abbastanza adattati (se avete u budgetu).
Cuminciamu cù i babbi fundatori.

Direttore di Polycom EagleEye

A funzione di targeting camera da voce hè diventata più accessibile - a suluzione universale SmartCam A12 Voice TrackingSta suluzione hà creatu una volta una sensazione in u campu di a videoconferenza. Polycom EagleEye Director hè stata a prima suluzione in u campu di a guida di càmera intelligente. A suluzione hè custituita da una unità di base EagleEye Director è duie camere. A peculiarità di quella prima implementazione hè chì una camera hè attribuita solu à una vista ravvicinata di u parlante, è a seconda - à un pianu generale di a sala di riunioni. À u listessu tempu, a camera di u pianu generale pò esse piazzata completamente separata da a basa in un altru locu in a sala di riunioni - ùn hè micca direttamente implicata in u prucessu di guida automatica.
U sistema funziona cusì:

  1. A camera generale di a camera hè attiva - tutti sò silenziu
  2. U parlante cumencia à parlà - a matrice di microfonu piglia a voce, a camera si move versu u sonu utilizendu tecnulugia patentata chì include a triangulazione di voce. A camera generale hè sempre attiva
  3. A camera principale hè ghjustu cuminciatu à circà a fonte di sonu, cunducendu analitiche video. U sistema identifica u parlante da a cunnessione ochji-nasu-bocca, inquadra a stampa di u parlante è mostra u flussu da a camera principale.
  4. U parlante cambia. L'array di microfonu capisce chì a voce vene da un altru locu. U pianu generale hè attivatu di novu.
  5. E poi in un circhiu, partendu da u puntu 2
  6. Se u novu parlante hè in u quadru cù u precedente, u sistema faci un cambiamentu di pusizioni "calda" senza cambià u flussu attivu à u colpu generale.

U svantaghju, in my opinion, hè a prisenza di una sola camera principale. Questu risultatu in un ritardu significativu quandu cambia i parlanti. È ogni volta à u mumentu di a puntata, u sistema accende u pianu generale di a stanza - durante una conversazione vivace, stu flickering cumencia à irritate.

Play video

Polycom EagleEye Director II

A funzione di targeting camera da voce hè diventata più accessibile - a suluzione universale SmartCam A12 Voice TrackingQuesta hè a seconda versione di a suluzione da Polycom, chì hè stata liberata pocu pocu. U principiu di funziunamentu hà subitu cambiamenti è hè diventatu più cum'è una suluzione da Cisco. Avà e duie camere PTZ sò i principali è servenu per cambià senza interruzioni i canali da un presentatore à l'altru. U layout generale di a sala di riunione hè avà catturatu da una camera separata integrata in u corpu di l'unità base EagleEye Director II. Per una certa ragione, u flussu da questa camera di grandu angulu hè visualizatu in una finestra addiziale in u cantonu di u screnu, occupendu 1/9 di u flussu principale. U principiu di posizionamentu hè u listessu - triangulazione di voce è analisi di flussu video. E i buttiglii sò listessi: se u sistema ùn vede micca a bocca parlante, a camera ùn hà micca scopu. E sta situazione pò succorsu abbastanza spessu - u parlante hà vultatu, u parlante hà vultatu di latu, u parlante hè un ventrilocu, u parlante hà cupertu a bocca cù a manu o un documentu.
I dui video promozionali sò stati girati in modu cumpetente - 2 persone parlanu à turnu, è apre a bocca cum'è à un appuntamentu cù un logopedista. Ma ancu in tali cundizioni raffinati ci hè un ritardu assai significativu. Ma l'inquadramentu hè impeccable - un ritrattu còmode.

Play video

Cisco TelePresence SpeakerTrack 60

A funzione di targeting camera da voce hè diventata più accessibile - a suluzione universale SmartCam A12 Voice TrackingPer discrive sta suluzione, aghju aduprà u testu da u librettu ufficiale.
SpeakerTrack 60 adopta un approcciu unicu di doppia camera per cambià rapidamente direttamente trà i participanti. Una camera trova rapidamente un primu pianu di u presentatore attivu, mentre chì l'altra cerca è mostra u prossimu presentatore. A funzione MultiSpeaker impedisce u cambiamentu innecessariu se u prossimu parlante hè digià presente in u quadru attuale.
Sfortunatamente, ùn aghju micca avutu a pussibilità di pruvà u SpeakerTrack 60 stessu. Dunque, e cunclusioni anu da esse tirate nantu à l'opinione "da u campu" è basatu nantu à i risultati di l'analisi di u video di dimostrazione sottu. Aghju cuntatu un ritardu massimu di quasi 8 seconde quandu puntava à un novu presentatore. U ritardu mediu era 2-3 seconde, à ghjudicà da u video.

Play video

HUAWEI Intelligent Tracking Video Camera VPT300

A funzione di targeting camera da voce hè diventata più accessibile - a suluzione universale SmartCam A12 Voice TrackingAghju trovu sta suluzione da Huawei per accidente. U sistema costa circa $ 9K. Funziona solu cù terminali Huawei. I sviluppatori anu aghjustatu u so propiu "truccu" - un layout video da dui parlanti nantu à una schermu se ùn ci hè nimu in a stanza. In termini di caratteristiche è funziunalità dichjarata, questa hè una versione assai interessante di u sistema di guida automatica. Ma, sfurtunatamenti, ùn aghju trovu assolutamente micca materiale demo. L'unicu video chì apparsu nantu à questu tema era una rivista video editata di a suluzione, senza sonu originale, pusatu in musica. Cusì, ùn era micca pussibule di evaluà a qualità di u sistema. Per quessa, ùn aghju micca cunsideratu sta opzione.
Vecu chì Huawei hà un blog attivu nantu à Habré - forse i culleghi puderanu pubblicà alcune informazioni utili nantu à stu pruduttu.

Novu - suluzione universale SmartCam A12 Voice Tracking

A funzione di targeting camera da voce hè diventata più accessibile - a suluzione universale SmartCam A12 Voice TrackingSmartCam A12VT - un monobloccu, cumprese duie camere PTZ per i parlanti di seguimentu, duie camere integrate per analizà u layout generale di a stanza, è ancu un array di microfonu integratu in a basa di u casu - cum'è pudete vede, ùn ci sò micca voluminu strutture fragili cum'è quelli di l'avversari.
Prima di principià à descriverà u novu pruduttu, aghjustà e caratteristiche è e caratteristiche di e soluzioni di Cisco è Polycom per pudè paragunà. SmartCam A12VT cù offerte esistenti.

Direttore di Polycom EagleEye

  • Costu di vendita di u sistema senza terminal - $ 13K
  • Costu minimu di EagleEye Director + Soluzione RealPresence Group 500 - $ 19K
  • Ritardo medio di commutazione 3 seconde
  • Guida vocale + analisi video
  • Esigenze elevate nantu à a faccia di u parlante - ùn pudete micca ammuccià a bocca
  • Incompatibilità cù l'equipaggiu di terzu

Cisco TelePresence SpeakerTrack 60

  • Costu di vendita di u sistema senza terminal - $ 15,9K
  • Costu minimu di a soluzione TelePresence SpeakerTrack 60 + SX80 Codec - $ 30K
  • Ritardo medio di commutazione 3 seconde
  • Guida vocale + analisi video
  • Requisiti per a faccia di u parlante - ùn hà micca verificatu, ùn hà micca truvatu infurmazione
  • Incompatibilità cù l'equipaggiu di terzu

SmartCam A12 Voice Tracking

  • Costu di vendita di u sistema senza terminal - $ 6,2K
  • U costu minimu di suluzione SmartCam A12VT + Yealink VC880 - $ 10.8K
  • U costu minimu di suluzione Terminale di software SmartCam A12VT+ - $ 7,7K
  • Ritardo medio di commutazione 3 seconde
  • Guida vocale + analisi video
  • Requisiti per a faccia di u parlante - senza esigenze
  • Compatibilità di terze parti - HDMI

Cum'è dui vantaghji principali è innegabile di a suluzione SmartCam A12 Voice Tracking trovu:

  1. Versatilità di cunnessione - via HDMI, u sistema si integra cù i sistemi di terminale di videoconferenza hardware è software
  2. Low costu - cù funziunalità simili, A12VT hè parechje volte più assequible nantu à un budgetu cà e pruposte descritte sopra.

Per dimustrà cumu funziona u sistema, avemu arregistratu una rivista video. U compitu ùn era micca tantu publicità quant'è funziunale. Dunque, u video hè privo di u pathos di un video promozionale Polycom. U locu sceltu per a presentazione ùn era micca un uffiziu rappresentante, ma una sala di riunioni di u laboratoriu di u nostru cumpagnu, a cumpagnia IPMatika.
U mo scopu ùn era micca di ammuccià i difetti di u sistema, ma, à u cuntrariu, di espose i buttiglii di a funziunalità, di furzà u sistema à sbaglià.

Play video

In u mo parè, u sistema hà passatu i testi cù successu. Dicu questu cun cunfidenza perchè à u mumentu di scrive stu articulu, a suluzione SmartCam A12 Voice Tracking visitatu una decina di veri sale riunioni di i nostri clienti. I malfunzionamenti di l'automatizazione sò stati osservati solu in cundizioni di violazione di e regule operative cunsigliatu. In particulare, a distanza minima à i participanti vicini. Sè site assai vicinu à a camera, menu di un metru, u microfonu di u microfonu ùn puderà micca ricunnosce è a lente ùn serà micca capaci di seguità.

A funzione di targeting camera da voce hè diventata più accessibile - a suluzione universale SmartCam A12 Voice Tracking

In più di a distanza, ci hè un altru requisitu - l'altezza di a camera.

A funzione di targeting camera da voce hè diventata più accessibile - a suluzione universale SmartCam A12 Voice Tracking

Se a camera hè stallata troppu bassu, i prublemi cù u posizionamentu di a voce ponu accade. L'opzione sottu a TV, sfurtunatamenti, ùn hà micca travagliatu.
Ma l'installazione di u sistema sopra à un dispositivu di visualizazione hè un modu ideale per u funziunamentu di u dispusitivu. U scaffale di a camera hè inclusu; solu u supportu di muru hè supportatu cum'è standard.

Cumu funziona SmartCam A12 Voice Tracking

I principali lenti PTZ anu rolli uguali - u so compitu hè di seguità alternativamente i presentatori è di vede u pianu generale. L'analisi di l'imaghjini generale in a stanza è a determinazione di a distanza à l'uggetti hè realizatu cù flussi video ricevuti da duie camere integrate in a basa di u sistema. Questa funzione permette di riduce u tempu di reazione di a lente quandu cambia u parlante à 1-2 seconde. A camera riesce à alternà trà i participanti à un ritmu còmode, ancu s'ellu scambianu frasi brevi.
Una dimostrazione video di u funziunamentu di u sistema riflette cumplettamente a funziunalità SmartCam A12VT. Ma, per quelli chì ùn anu micca vistu u video, descriveraghju in parolle u principiu di funziunamentu di l'automatizazione:

  1. A stanza hè viota: una di e lenti mostra u pianu generale, a seconda hè pronta - aspittendu a ghjente
  2. A ghjente entra in a stanza è piglia i so posti: a lente libera trova i dui participanti estremi è inquadra l'imaghjini intornu à elli, tagliendu a parte viota di a stanza.
  3. Mentre a ghjente si move, i lenti si turnanu seguitendu tutti in a stanza, mantenenduli in u centru di u quadru.
  4. U parlante principia à parlà: a lente hè attiva, aghjusta à u pianu generale. U sicondu hè destinatu à u parlante, è solu dopu passa in modu di trasmissione
  5. U parlante cambia: a lente aghjustata à u primu parlante hè attivu, è a seconda lente abbanduneghja u colpu largu è si adatta à u novu parlante.
  6. À u mumentu di cambià l'imaghjini da u primu parlante à u sicondu, a lente libera hè immediatamente aghjustata à u pianu generale di a stanza.
  7. Sì tutti sò silenziu, a lente libera mostrarà un pianu generale prontu senza ritardi
  8. Se u parlante cambia di novu, a lente libera andarà in cerca di ellu

cunchiusioni

In u mo parè, sta suluzione, presentata à l'ISE è l'ISR l'annu passatu, avvicina l'alta tecnulugia - se micca à a ghjente, allora à l'affari di sicuru. Hè chjaru chì per 400 mila rubli, pochi pirsuni cumprà un tali "ghjocu" per a casa, ma per l'affari, per a videoconferenza corporativa, questu hè una suluzione assai assequible è còmuda à u prublema di l'auto-puntamentu di una camera.
Data a versatilità SmartCam A12 Voice Tracking, u sistema pò esse usatu cum'è una suluzione da zero, o cum'è una estensione di a funziunalità di una infrastruttura di videoconferenza esistente. A cunnessione via HDMI hè un grande passu versu l'utilizatore, in cuntrastu cù i sistemi proprietarii di i fabricatori sopra-descritti.

Vogliu ringrazià i partenarii chì anu assistitu à a prova.
cumpagnia IPMatika - per u terminal Yealink VC880, sala di riunioni è Yakushina Yura.
cumpagnia Smart-AV - per u dirittu di a prima è esclusiva rivista di a suluzione è a prestazione di u sistema SmartCam A12 Voice Tracking per pruvà.

In l'ultimu articulu Designer di sala di riunioni in linea - selezzione di a suluzione ottima di videoconferenza, cum'è promozione di u situ web vc4u.ru и Designer VKS avemu annunziatu 10% di sconto da u prezzu in catalogu per parola codice HABR finu à a fine di l'estate 2019.

U scontu si applica à i prudutti in e seguenti sezioni:

À a decisione SmartCam A12 Voice Tracking Offre un scontu supplementu di 5% à u 10% digià esistente - un totale di 15% finu à a fine di l'estate 2019.

Aspettu i vostri cumenti è risposte in l'indagine!

ti ringraziu per u vostru attinzioni.
sincerità,
Kirill Usikov (Usikoff)
Capu di
Sistemi di videosurveglianza è videoconferenza
1@stss.ru
stss.ru
vc4u.ru

Solu l'utilizatori registrati ponu participà à l'indagine. Firmà lu, per piacè.

Quantu hè utile SmartCam A12 Voice Tracking?

  • Infine, una soluzione universale per i terminali di software è hardware hè apparsu!

  • A suluzione hè bona, ma ci sò altre opzioni dispunibili (scrivu in i cumenti)

  • U sistema hè debbule, ùn ghjunghje micca Polycom è Cisco - scriveraghju in i cumenti perchè duvete pagà 3 volte di più!

  • Quale hè bisognu di l'autoguida in una sala di riunioni in ogni casu?

  • Quale hè bisognu di una camera PTZ in una sala di riunioni in ogni casu? - Aghju cunnessu a webcam è era bè!

8 utilizatori anu vutatu. 5 utilizatori si sò astenuti.

Source: www.habr.com

Cumprate un hosting affidabile per i siti cù prutezzione DDoS, servitori VPS VDS 🔥 Cumprate un hosting di siti web affidabile cù prutezzione DDoS, servitori VPS VDS | ProHoster