De funksje fan kamera-targeting mei stim is tagonkliker wurden - de universele oplossing SmartCam A12 Voice Tracking

De funksje fan kamera-targeting mei stim is tagonkliker wurden - de universele oplossing SmartCam A12 Voice TrackingIt ûnderwerp fan it folgjen fan in sprekkende dielnimmer oan in fideokonferinsje hat de ôfrûne jierren momentum krigen. Technology hat it mooglik makke om komplekse algoritmen te ymplementearjen foar it ferwurkjen fan audio- / fideo-ynformaasje yn realtime, wat Polycom hast 10 jier lyn frege om de earste mainstream-oplossing fan 'e wrâld te yntrodusearjen mei yntelliginte automatyske sprekker folgjen. Foar ferskate jierren wisten se de ienige eigners fan sa'n oplossing te bliuwen, mar Cisco hoegde net lang te wachtsjen en brocht har ferzje fan in yntelligint twa-kamera-systeem op 'e merk, dat in earlike konkurrint wie foar de oplossing fan Polycom. In protte jierren waard dit segmint fan fideokonferinsjes beheind troch de mooglikheden fan ferskate proprietary produkten, mar dit artikel is wijd oan de earste universeel oplossing foar kamera-begelieding troch stim, kompatibel mei sawol hardware- as softwareynfrastruktuer foar fideokonferinsjes.
Foardat ik trochgean mei it beskriuwen fan oplossingen en demonstrearjen fan mooglikheden, wol ik in wichtich barren opmerke:
Ik bin eare om te presintearjen oan 'e Habra-mienskip nij hub, wijd oan videoconferencing-oplossingen (VCC). No, mei tank oan de mienskiplike ynspanningen (myn en UFO), Fideo gearkomst hat in eigen hûs op Habré, en ik noegje elkenien dy't belutsen binne by dit wiidweidige en aktuele ûnderwerp út om in abonnemint op te nimmen nij hub.

Twa senario's foar it rjochtsjen fan de kamera op de sprekker

Op it stuit kieze yntegrators fan oplossings foar fideokonferinsjes foar harsels twa ferskillende manieren om de taak te realisearjen om de presintator te rjochtsjen:

  1. Automatysk - Intelligent
  2. Semi-automatysk - programmeerber

De earste opsje is gewoan oplossingen fan Cisco, Polycom en oare fabrikanten; wy sille se hjirûnder beskôgje. Hjir hawwe wy te krijen mei de folsleine automatisearring fan it rjochtsjen fan de kamera op 'e sprekkende dielnimmer oan' e fideokonferinsje. Unike algoritmen foar it ferwurkjen fan audio / fideo-sinjalen kinne de kamera de winske posysje selsstannich selektearje.

De twadde opsje is automatisearring systemen basearre op ferskate eksterne kontrôle controllers; wy sille net beskôgje se yn detail, omdat It artikel is spesifyk wijd oan it automatysk folgjen fan sprekkers.
D'r binne nochal wat oanhingers fan it twadde senario foar it ymplementearjen fan kamerawizen, en d'r binne redenen foar dit. Ervaren integrators begripe dat yntelliginte oplossings út Polycom en Cisco fereaskje ideale bestjoeringssysteem betingsten foar de automatisearring te funksjonearjen goed. Mar it is net altyd mooglik om sokke betingsten te leverjen, dus de wurking fan it systeem wurdt soms garandearre troch de folgjende oplossing foar it probleem mei kamerawize:

1. Alle nedige presets (posysjes fan it PTZ-apparaat en optyske zoomfaktor) wurde foarôf manuell ynfierd yn it ûnthâld fan 'e kamera (of soms yn' e kontrôlekontrôler). As regel is dit in algemien plan fan 'e gearkomsteseal, en in werjefte fan elke konferinsje dielnimmer yn portretmodus.

2. Folgjende, de inisjatyfnimmers foar it oproppen fan de fereaske preset wurde ynstallearre yn de oantsjutte plakken - dit binne of mikrofoan konsoles of radio knoppen, yn it algemien, elk apparaat dat kin foarsjen de kontrôle controller mei in sinjaal dat it begrypt.

3. De kontrôle controller is programmearre op sa'n wize dat elke inisjatyfnimmer hat syn eigen foarôf ynsteld. Algemien plan fan 'e keamer - alle inisjatyfnimmers binne útskeakele.
As gefolch, by it brûken fan in kongressysteem, bygelyks, en in kontrôlekontrôler, aktivearret de sprekker, foardat syn taspraak begjint, syn persoanlike mikrofoankonsole. It kontrôlesysteem ferwurket de bewarre kameraposysje direkt.

Dit senario wurket perfekt - it systeem hoecht gjin stimtriangulaasje en fideo-analytyk út te fieren. Ik drukte op de knop en de foarynstelling wurke, gjin fertragingen of falske positiven.
Kontrôle- en automatisearringssystemen wurde brûkt yn grutte, komplekse keamers, wêr't soms net ien, mar ferskate fideokamera's ynstalleare binne. No, foar lytse en middelgrutte gearkomsteromten binne automatyske systemen hiel geskikt (as jo it budzjet hawwe).
Litte wy begjinne mei de oprjochters.

Polycom EagleEye direkteur

De funksje fan kamera-targeting mei stim is tagonkliker wurden - de universele oplossing SmartCam A12 Voice TrackingDizze oplossing makke ienris in sensaasje op it mêd fan fideokonferinsjes. Polycom EagleEye Director wie de earste oplossing op it mêd fan yntelliginte kamerabegelieding. De oplossing bestiet út in EagleEye Director-basisienheid en twa kamera's. It eigenaardichheid fan dy earste ymplemintaasje is dat ien kamera allinich is tawiisd oan in close-up fan 'e sprekker, en de twadde - oan in algemien plan fan' e gearkomsteseal. Tagelyk kin de algemiene plankamera folslein apart fan 'e basis pleatst wurde op in oar plak yn' e gearkomsteseal - it is net direkt belutsen by it automatyske begeliedingsproses.
It systeem wurket as folget:

  1. De algemiene keamerkamera is aktyf - elkenien is stil
  2. De sprekker begjint te praten - de mikrofoanarray pakt de stim op, de kamera beweecht nei it lûd mei patintearre technology dy't stimtriangulaasje omfettet. De algemiene kamera is noch aktyf
  3. De haadkamera begjint krekt te sykjen nei de lûdsboarne, it útfieren fan fideo-analytyk. It systeem identifisearret de sprekker troch de each-noas-mûle ferbining, frames de foto fan 'e sprekker en toant de stream fan 'e haadkamera
  4. De sprekker feroaret. De mikrofoanarray begrypt dat de stim fan in oar plak komt. It algemien plan wurdt wer ynskeakele.
  5. En dan yn in sirkel, begjinnend fan punt 2
  6. As de nije sprekker yn it frame is mei de foarige, makket it systeem in "hot" posysjeferoaring sûnder de aktive stream te feroarjen nei it algemiene skot.

It neidiel, nei myn miening, is de oanwêzigens fan mar ien haadkamera. Dit resultearret yn in signifikante fertraging by it wikseljen fan sprekkers. En elke kear op it momint fan it oanwizen draait it systeem it algemiene plan fan 'e keamer oan - yn in libbendich petear begjint dit flikkerjen te irritearjen.

Polycom EagleEye direkteur II

De funksje fan kamera-targeting mei stim is tagonkliker wurden - de universele oplossing SmartCam A12 Voice TrackingDit is de twadde ferzje fan 'e oplossing fan Polycom, dy't relatyf koartlyn waard útbrocht. It prinsipe fan wurking hat ûndergien feroarings en is wurden mear as in oplossing út Cisco. No binne beide PTZ-kamera's de wichtichste en tsjinje om naadloos kanalen te wikseljen fan de iene presintator nei de oare. De algemiene yndieling fan 'e gearkomsteseal is no fêstlein troch in aparte kamera yntegreare yn it lichem fan' e EagleEye Director II-basisienheid. Om ien of oare reden wurdt de stream fan dizze breedhoekkamera werjûn yn in ekstra finster yn 'e hoeke fan it skerm, dy't 1/9 fan' e haadstream beslacht. It prinsipe fan posysjonearring is itselde - stimtriangulaasje en fideostreamanalyse. En de knyppunten binne itselde: as it systeem de sprekkende mûle net sjocht, sil de kamera net rjochtsje. En dizze situaasje kin nochal faak barre - de sprekker hat him ôfdraaid, de sprekker is fan 'e kant draaid, de sprekker is in ventriloquist, de sprekker hat de mûle mei syn hân of in dokumint bedutsen.
Beide promoasjefideo's waarden kompetint makke - 2 minsken prate om beurten, en iepenje har mûle as op in ôfspraak mei in logopedist. Mar sels yn sokke ferfine omstannichheden is der in tige wichtige fertraging. Mar de framing is ûnberikber - in noflike portretfoto.

Cisco TelePresence SpeakerTrack 60

De funksje fan kamera-targeting mei stim is tagonkliker wurden - de universele oplossing SmartCam A12 Voice TrackingOm dizze oplossing te beskriuwen, sil ik tekst brûke út 'e offisjele brosjuere.
SpeakerTrack 60 nimt in unike oanpak mei dûbele kamera's om fluch direkt tusken dielnimmers te wikseljen. De iene kamera fynt gau in close-up fan de aktive presintator, wylst de oare de folgjende presintator siket en toant. De MultiSpeaker-funksje foarkomt ûnnedige skeakeljen as de folgjende sprekker al oanwêzich is yn it hjoeddeistige frame.
Spitigernôch hie ik gjin kâns om de SpeakerTrack 60 sels te testen. Dêrom moatte konklúzjes wurde lutsen op basis fan 'e miening "fan it fjild" en basearre op de resultaten fan analyse fan 'e demonstraasjefideo hjirûnder. Ik telde in maksimale fertraging fan hast 8 sekonden by it oanwizen fan in nije presintator. De gemiddelde fertraging wie 2-3 sekonden, beoardielje troch de fideo.

HUAWEI Intelligent Tracking Video Camera VPT300

De funksje fan kamera-targeting mei stim is tagonkliker wurden - de universele oplossing SmartCam A12 Voice TrackingIk kaam by ûngelok dizze oplossing fan Huawei tsjin. It systeem kostet sawat $ 9K. Wurket allinnich mei Huawei terminals. De ûntwikkelders hawwe har eigen "trick" tafoege - in fideo-yndieling fan twa sprekkers op ien skerm as der gjinien oars yn 'e keamer is. Wat skaaimerken en ferklearre funksjonaliteit oanbelanget, is dit in heul ynteressante ferzje fan it automatyske begeliedingsysteem. Mar, spitigernôch, ik fûn absolút gjin demo materiaal. De ienige fideo dy't ferskynde oer dit ûnderwerp wie in bewurke fideoresinsje fan 'e oplossing, sûnder orizjineel lûd, ynsteld op muzyk. Sa wie it net mooglik om de kwaliteit fan it systeem te evaluearjen. Om dizze reden sil ik dizze opsje net beskôgje.
Ik sjoch dat Huawei in aktyf blog hat oer Habré - miskien kinne kollega's wat nuttige ynformaasje oer dit produkt publisearje.

Nije - universele oplossing SmartCam A12 Voice Tracking

De funksje fan kamera-targeting mei stim is tagonkliker wurden - de universele oplossing SmartCam A12 Voice TrackingSmartCam A12VT - in monoblok, ynklusyf twa PTZ-kamera's foar it folgjen fan sprekkers, twa ynboude kamera's foar it analysearjen fan 'e algemiene yndieling fan' e keamer, lykas ek in mikrofoanarray ynboud yn 'e basis fan' e saak - lykas jo kinne sjen, binne d'r gjin bulk en fragile struktueren lykas dy fan tsjinstanners.
Foardat ik begjin mei it beskriuwen fan it nije produkt, sil ik de skaaimerken en funksjes fan oplossingen fan Cisco en Polycom gearstelle, sadat ik fergelykje kin SmartCam A12VT mei besteande oanbiedingen.

Polycom EagleEye direkteur

  • Retail kosten fan it systeem sûnder terminal - $ 13K
  • Minimum kosten fan EagleEye Director + RealPresence Group 500 oplossing - $ 19K
  • Gemiddelde switch fertraging 3 sekonden
  • Stimbegelieding + fideo-analytyk
  • Hege easken oan it gesicht fan 'e sprekker - jo kinne jo mûle net ferbergje
  • Ynkompatibiliteit mei apparatuer fan tredden

Cisco TelePresence SpeakerTrack 60

  • Retail kosten fan it systeem sûnder terminal - $ 15,9K
  • Minimale kosten fan TelePresence SpeakerTrack 60 + SX80 Codec-oplossing - $ 30K
  • Gemiddelde switch fertraging 3 sekonden
  • Stimbegelieding + fideo-analytyk
  • Easken foar it gesicht fan 'e sprekker - kontrolearre net, fûn gjin ynformaasje
  • Ynkompatibiliteit mei apparatuer fan tredden

SmartCam A12 Voice Tracking

  • Retail kosten fan it systeem sûnder terminal - $ 6,2K
  • Minimum oplossing kosten SmartCam A12VT + Yealink VC880 - $ 10.8K
  • Minimum oplossing kosten SmartCam A12VT+ software terminal - $ 7,7K
  • Gemiddelde switch fertraging 3 sekonden
  • Stimbegelieding + fideo-analytyk
  • Easken foar it gesicht fan 'e sprekker - gjin easken
  • Kompatibiliteit fan tredden - HDMI

As twa wichtichste en ûnbestriden foardielen fan 'e oplossing SmartCam A12 Voice Tracking ik fyn:

  1. Ferbining veelzijdigheid - fia HDMI yntegreart it systeem mei sawol hardware- as software-fideokonferinsjeterminalsystemen
  2. Lege kosten - mei ferlykbere funksjonaliteit is A12VT in protte kearen betelberder op in budzjet dan de hjirboppe beskreaune foarstellen.

Om te demonstrearjen hoe't it systeem wurket, hawwe wy in fideoresinsje opnommen. De taak wie net sasear reklame as funksjoneel. Dêrom is de fideo sûnder de patos fan in Polycom-promoasjefideo. It plak dat keazen waard foar de presintaasje wie gjin represintatyf kantoar, mar in laboratoariumgearkomste fan ús partner, it bedriuw IPMatika.
Myn doel wie net om de gebreken fan it systeem te ferbergjen, mar, krekt oarsom, de knyppunten fan 'e funksjonaliteit bleat te lizzen, it systeem te twingen om flaters te meitsjen.

Neffens my hat it systeem de tests mei súkses trochjûn. Ik sis dit mei fertrouwen, om't op it momint fan it skriuwen fan dit artikel de oplossing SmartCam A12 Voice Tracking besocht in tsiental echte gearkomsteromten fan ús klanten. Defekten fan 'e automatisearring waarden allinich waarnommen yn betingsten fan oertreding fan' e oanbefellende bestjoeringsregels. Benammen de minimale ôfstân nei tichtby dielnimmers. As jo ​​​​heul ticht by de kamera sitte, minder dan in meter, sil de mikrofoanarray jo net kinne werkenne en sil de lens jo net kinne folgje.

De funksje fan kamera-targeting mei stim is tagonkliker wurden - de universele oplossing SmartCam A12 Voice Tracking

Neist de ôfstân is d'r in oare eask - de hichte fan 'e kamera.

De funksje fan kamera-targeting mei stim is tagonkliker wurden - de universele oplossing SmartCam A12 Voice Tracking

As de kamera te leech is ynstalleare, kinne problemen mei stimposysje foarkomme. De opsje ûnder de TV, spitigernôch, wurke net.
Mar it ynstallearjen fan it systeem boppe in display-apparaat is in ideale manier foar it apparaat om te operearjen. De kameraplank is ynbegrepen; allinich de muorrebeugel wurdt standert stipe.

Hoe SmartCam A12 Voice Tracking wurket

De wichtichste PTZ-lenzen hawwe gelikense rollen - har taak is om ôfwikseljend presintatoaren te folgjen en it algemiene plan te werjaan. Analyze fan it totale byld yn 'e keamer en it bepalen fan' e ôfstân nei objekten wurdt útfierd mei help fan fideostreamen ûntfongen fan twa kamera's yntegreare yn 'e basis fan it systeem. Mei dizze funksje kinne jo de reaksjetiid fan 'e lens ferminderje by it feroarjen fan de sprekker nei 1-2 sekonden. De kamera wit om te wikseljen tusken de dielnimmers op in noflik ritme, ek al wikselje se koarte sinnen út.
In fideodemonstraasje fan 'e wurking fan it systeem reflektet de funksjonaliteit folslein SmartCam A12VT. Mar foar dyjingen dy't de fideo net hawwe sjoen, sil ik it prinsipe fan 'e automatisearring yn wurden beskriuwe:

  1. De keamer is leech: ien fan 'e linzen lit it algemiene plan sjen, de twadde is klear - wachtsje op minsken
  2. Minsken komme de keamer yn en nimme har sitten: de frije lens fynt de twa ekstreme dielnimmers en ramt it byld om har hinne, snijt it lege diel fan 'e keamer ôf
  3. Wylst minsken bewege, folgje de linzen om beurten elkenien yn 'e keamer, en hâlde se yn it sintrum fan it frame
  4. De sprekker begjint te praten: de lens is aktyf, oanpast oan it algemiene plan. De twadde is rjochte op de sprekker, en giet dan pas yn útstjoermodus
  5. De sprekker feroaret: de lens oanpast oan 'e earste sprekker is aktyf, en de twadde lens falt it brede skot en past him oan' e nije sprekker
  6. Op it momint fan it wikseljen fan de ôfbylding fan 'e earste sprekker nei de twadde, wurdt de frije lens direkt oanpast oan it algemiene plan fan' e keamer
  7. As elkenien stil is, sil de fergese lens sûnder fertraging in klear makke algemien plan sjen litte
  8. As de sprekker wer feroaret, giet de frije lens op syk nei him

konklúzje

Yn myn miening bringt dizze oplossing, presinteare by ISE en ISR ferline jier, hege technology tichterby - as net oan 'e minsken, dan nei bedriuw foar wis. It is dúdlik dat foar 400 tûzen roebel in pear minsken sa'n "boartersguod" foar thús keapje, mar foar bedriuw, foar bedriuwsfideokonferinsjes, dit is in heul betelbere en handige oplossing foar it probleem fan auto-rjochting fan in kamera.
Sjoen de veelzijdigheid SmartCam A12 Voice Tracking, it systeem kin brûkt wurde as in oplossing fanôf it begjin, of as in útwreiding fan 'e funksjonaliteit fan in besteande fideokonferinsje-ynfrastruktuer. Ferbine fia HDMI is in grutte stap nei de brûker, yn tsjinstelling ta de proprietêre systemen fan de hjirboppe beskreaune fabrikanten.

Ik wol de partners betankje dy't holpen hawwe by it testen.
Bedriuw IPMatika - foar de Yealink VC880 terminal, gearkomste keamer en Yakushina Yura.
Bedriuw Smart-AV - foar it rjocht fan 'e earste en eksklusive beoardieling fan' e oplossing en foarsjenning fan it systeem SmartCam A12 Voice Tracking foar testen.

Yn it foarige artikel Untwerper fan online gearkomsteromten - seleksje fan 'e optimale oplossing foar fideokonferinsjes, as webside promoasje vc4u.ru и VKS ûntwerper wy oankundige 10% koarting fan priis yn directory troch koade wurd HABR oant de ein fan simmer 2019.

De koarting jildt foar produkten yn 'e folgjende seksjes:

Oan it beslút SmartCam A12 Voice Tracking Ik bied in ekstra 5% koarting oan de al besteande 10% - yn totaal 15% oant it ein fan simmer 2019.

Ik sjoch út nei jo opmerkings en antwurden yn 'e enkête!

Tige tank foar jo oandacht.
Mei freonlike groetnis,
Kirill Usikov (Usikoff)
Haad fan
Fideo tafersjoch en video conferencing systemen
[e-post beskerme]
stss.ru
vc4u.ru

Allinnich registrearre brûkers kinne meidwaan oan 'e enkête. Ynlogge, asjebleaft.

Hoe brûkber is SmartCam A12 Voice Tracking?

  • Uteinlik is in universele oplossing foar software- en hardwareterminals ferskynd!

  • De oplossing is goed, mar d'r binne oare beskikbere opsjes (ik skriuw yn 'e kommentaren)

  • It systeem is swak, it berikt Polycom en Cisco net - ik skriuw yn 'e kommentaren wêrom't jo 3 kear mear moatte betelje!

  • Wa hat dochs auto-begelieding nedich yn in gearkomsteromte?

  • Wa hat dochs in PTZ-kamera nedich yn in gearkomsteromte? - Ik ferbûn de webcam en it wie goed!

8 brûkers stimden. 5 brûkers ûntholden har.

Boarne: www.habr.com

Add a comment