Kaamera häälega sihtimise funktsioon on muutunud kättesaadavamaks – universaalne lahendus SmartCam A12 Voice Tracking

Kaamera häälega sihtimise funktsioon on muutunud kättesaadavamaks – universaalne lahendus SmartCam A12 Voice TrackingVideokonverentsil esineva osaleja jälgimise teema on viimastel aastatel hoo sisse saanud. Tehnoloogia on võimaldanud rakendada keerulisi algoritme heli/videoteabe reaalajas töötlemiseks, mis ajendas Polycomi peaaegu 10 aastat tagasi tutvustama maailma esimest tavalahendust koos intelligentse automaatse kõlarite jälgimisega. Mitu aastat õnnestus neil jääda sellise lahenduse ainsaks omanikuks, kuid Cisco ei pidanud kaua ootama ja tõi turule oma versiooni intelligentsest kahekaamerasüsteemist, mis oli Polycomi lahendusele aus konkurent. Paljude aastate jooksul oli see videokonverentsi segment piiratud mitme võimalusega varaline tooteid, kuid see artikkel on pühendatud esimesele universaalne lahendus kaamera häälega juhtimiseks, mis ühildub videokonverentside riist- ja tarkvara infrastruktuuriga.
Enne lahenduste kirjeldamise ja võimaluste demonstreerimise juurde asumist tahan märkida ühte olulist sündmust:
Mul on au esitleda Habra kogukonnale uus keskus, mis on pühendatud videokonverentsilahendustele (VCC). Nüüd tänu ühistele jõupingutustele (minu ja UFO) Videokonverentsid on oma kodu Habrel ja ma kutsun kõiki, kes on selle ulatusliku ja aktuaalse teemaga seotud, tellima uus keskus.

Kaks stsenaariumi kaamera kõlarile suunamiseks

Hetkel valivad videokonverentsilahenduste integreerijad endale kaks erinevat viisi esineja sihtimise ülesande elluviimiseks:

  1. Automaatne – intelligentne
  2. Poolautomaatne – programmeeritav

Esimene võimalus on vaid Cisco, Polycomi ja teiste tootjate lahendused; me käsitleme neid allpool. Siin käsitleme kaamera videokonverentsil kõnelevale osalejale suunamise täielikku automatiseerimist. Unikaalsed heli-/videosignaalide töötlemise algoritmid võimaldavad kaameral iseseisvalt soovitud asendi valida.

Teine võimalus on erinevatel välistel juhtimiskontrolleritel põhinevad automaatikasüsteemid; me ei käsitle neid üksikasjalikult, sest Artikkel on pühendatud spetsiaalselt kõlarite automaatsele jälgimisele.
Kaamera suunamise rakendamise teise stsenaariumi pooldajaid on üsna palju ja sellel on oma põhjused. Kogenud integraatorid mõistavad, et Polycomi ja Cisco intelligentsed lahendused nõuavad automaatika nõuetekohaseks toimimiseks ideaalseid töötingimusi. Kuid alati pole selliseid tingimusi võimalik pakkuda, nii et mõnikord tagab süsteemi töö kaamera suunamisprobleemi järgmise lahendusega:

1. Kõik vajalikud eelseaded (PTZ-seadme asukohad ja optilise suumi koefitsient) sisestatakse eelnevalt käsitsi kaamera mällu (või mõnikord ka juhtkontrollerisse). Reeglina on see koosolekuruumi üldplaan ja vaade igale konverentsil osalejale portreerežiimis.

2. Järgmisena paigaldatakse määratud kohtadesse vajaliku eelseadistuse helistamise initsiaatorid - need on kas mikrofonikonsoolid või raadionupud, üldiselt mis tahes seade, mis suudab juhtkontrollerile anda signaali, millest see aru saab.

3. Juhtkontroller on programmeeritud nii, et igal initsiaatoril on oma eelseade. Ruumi üldplaan - kõik initsiaatorid on välja lülitatud.
Selle tulemusena aktiveerib kõneleja enne kõne alustamist näiteks kongressisüsteemi ja kontrollerit kasutades isikliku mikrofonikonsooli. Juhtsüsteem töötleb koheselt salvestatud kaameraasendit.

See stsenaarium töötab laitmatult – süsteem ei pea tegema hääle triangulatsiooni ja videoanalüüsi. Vajutasin nuppu ja eelseade töötas, viivitusi ega valepositiivseid tulemusi ei olnud.
Juhtimis- ja automaatikasüsteeme kasutatakse suurtes keerukates ruumides, kuhu mõnikord paigaldatakse mitte üks, vaid mitu videokaamerat. Noh, väikeste ja keskmise suurusega koosolekuruumide jaoks on automaatsed süsteemid üsna sobivad (kui teil on eelarve).
Alustame asutajatest.

Polycom EagleEye direktor

Kaamera häälega sihtimise funktsioon on muutunud kättesaadavamaks – universaalne lahendus SmartCam A12 Voice TrackingKunagi tekitas see lahendus videokonverentside vallas sensatsiooni. Polycom EagleEye Director oli esimene lahendus intelligentse kaamera juhtimise valdkonnas. Lahendus koosneb EagleEye Directori baasseadmest ja kahest kaamerast. Selle esimese teostuse eripära on see, et üks kaamera on eraldatud ainult kõneleja lähivaatele ja teine ​​​​- koosolekuruumi üldplaanile. Samas saab üldplaani kaamera paigutada täiesti eraldi alusest teise kohta koosolekuruumis - see ei ole otseselt automaatse suunamise protsessiga seotud.
Süsteem töötab järgmiselt:

  1. Üldine ruumikaamera on aktiivne – kõik vaikivad
  2. Kõlar hakkab rääkima – mikrofoni massiiv võtab hääle üles, kaamera liigub heli poole, kasutades patenteeritud tehnoloogiat, mis sisaldab hääle triangulatsiooni. Üldkaamera on endiselt aktiivne
  3. Põhikaamera alles hakkab otsima heliallikat, viies läbi videoanalüüsi. Süsteem tuvastab kõlari silma-nina-suu ühenduse kaudu, raamib kõlari pildi ja kuvab põhikaamerast tuleva voo
  4. Kõlar vahetub. Mikrofoni massiiv mõistab, et hääl tuleb teisest kohast. Üldplaneering lülitatakse uuesti sisse.
  5. Ja siis ringis, alustades punktist 2
  6. Kui uus kõlar on eelmisega kaadris, teeb süsteem "kuuma" positsioneerimise muudatuse, muutmata aktiivset voogu üldkaadrisse.

Negatiivne külg on minu meelest vaid ühe põhikaamera olemasolu. See toob kaasa märkimisväärse viivituse kõlarite vahetamisel. Ja iga kord näpuga näitamise hetkel lülitab süsteem sisse ruumi üldplaneeringu – elava vestluse käigus hakkab see virvendus ärritama.

Polycom EagleEye Režissöör II

Kaamera häälega sihtimise funktsioon on muutunud kättesaadavamaks – universaalne lahendus SmartCam A12 Voice TrackingSee on Polycomi lahenduse teine ​​versioon, mis ilmus suhteliselt hiljuti. Tööpõhimõte on muutunud ja muutunud pigem Cisco lahenduseks. Nüüd on mõlemad PTZ-kaamerad peamised ja nende abil saate kanaleid sujuvalt ühelt saatejuhilt teisele vahetada. Koosolekuruumi üldist paigutust jäädvustab nüüd eraldi kaamera, mis on integreeritud EagleEye Director II põhiseadme korpusesse. Millegipärast kuvatakse selle lainurkkaamera voog ekraani nurgas asuvas lisaaknas, mis võtab enda alla 1/9 põhivoost. Positsioneerimise põhimõte on sama – hääle triangulatsioon ja videovoo analüüs. Ja kitsaskohad on samad: kui süsteem rääkivat suud ei näe, siis kaamera ei sihi. Ja seda olukorda võib juhtuda päris tihti – kõneleja on ära pööranud, rääkija on end külili keeranud, kõneleja on kõhurääkija, kõneleja on suu käe või dokumendiga kinni katnud.
Mõlemad reklaamvideod filmiti asjatundlikult - 2 inimest räägivad kordamööda ja teevad suu lahti nagu logopeedi vastuvõtul. Kuid isegi sellistes rafineeritud tingimustes on väga suur viivitus. Aga kadreering on laitmatu – mugav portreevõte.

Cisco TelePresence SpeakerTrack 60

Kaamera häälega sihtimise funktsioon on muutunud kättesaadavamaks – universaalne lahendus SmartCam A12 Voice TrackingSelle lahenduse kirjeldamiseks kasutan ametliku brošüüri teksti.
SpeakerTrack 60 kasutab ainulaadset kahe kaameraga lähenemist, et kiiresti osalejate vahel vahetada. Üks kaamera leiab kiiresti aktiivse saatejuhi lähivõtte, teine ​​aga otsib ja kuvab järgmise saatejuhi. Funktsioon MultiSpeaker takistab tarbetut ümberlülitamist, kui järgmine kõlar on praeguses kaadris juba olemas.
Kahjuks ei olnud mul võimalust SpeakerTrack 60 ise testida. Seetõttu tuleb järeldused teha „põllult pärit“ arvamuse ja alloleva esitlusvideo analüüsi tulemuste põhjal. Uuele saatejuhile osutades lugesin maksimaalseks viivituseks peaaegu 8 sekundit. Keskmine viivitus oli video järgi otsustades 2-3 sekundit.

HUAWEI intelligentne jälgimisvideokaamera VPT300

Kaamera häälega sihtimise funktsioon on muutunud kättesaadavamaks – universaalne lahendus SmartCam A12 Voice TrackingSelle lahenduseni sattusin Huaweilt juhuslikult. Süsteem maksab umbes 9 XNUMX dollarit. Töötab ainult Huawei terminalidega. Arendajad lisasid oma "triki" - videopaigutuse kahest kõlarist ühel ekraanil, kui ruumis pole kedagi teist. Omaduste ja deklareeritud funktsionaalsuse poolest on see automaatse juhtimissüsteemi väga huvitav versioon. Kuid kahjuks ei leidnud ma absoluutselt ühtegi demomaterjali. Ainus video, mis sellel teemal ilmus, oli lahenduse monteeritud videoülevaade, ilma originaalhelita, muusika peale seatud. Seega ei olnud võimalik süsteemi kvaliteeti hinnata. Sel põhjusel ma seda võimalust ei kaalu.
Näen, et Huaweil on aktiivne blogi Habré teemal – ehk saavad kolleegid selle toote kohta kasulikku infot avaldada.

Uus – universaalne lahendus SmartCam A12 hääle jälgimine

Kaamera häälega sihtimise funktsioon on muutunud kättesaadavamaks – universaalne lahendus SmartCam A12 Voice TrackingSmartCam A12VT - monoplokk, sealhulgas kaks PTZ-kaamerat kõlarite jälgimiseks, kaks sisseehitatud kaamerat ruumi üldise paigutuse analüüsimiseks, samuti korpuse põhjale sisseehitatud mikrofoni massiiv - nagu näete, pole mahukaid ja haprad struktuurid nagu vastased.
Enne kui hakkan uut toodet kirjeldama, panen kokku Cisco ja Polycomi lahenduste omadused ja omadused, et saaksin võrrelda SmartCam A12VT olemasolevate pakkumistega.

Polycom EagleEye direktor

  • Süsteemi jaehind ilma terminalita - $ 13K
  • EagleEye Director + RealPresence Group 500 lahenduse minimaalne maksumus — $ 19K
  • Keskmine lülitusviivitus 3 sekundit
  • Hääljuhised + videoanalüüs
  • Kõrged nõudmised kõneleja näole – suud ei saa varjata
  • Kokkusobimatus kolmanda osapoole seadmetega

Cisco TelePresence SpeakerTrack 60

  • Süsteemi jaehind ilma terminalita - $ 15,9K
  • TelePresence SpeakerTrack 60 + SX80 Codec lahenduse minimaalne maksumus - $ 30K
  • Keskmine lülitusviivitus 3 sekundit
  • Hääljuhised + videoanalüüs
  • Nõuded kõneleja näole - ei kontrollinud, infot ei leidnud
  • Kokkusobimatus kolmanda osapoole seadmetega

SmartCam A12 hääle jälgimine

  • Süsteemi jaehind ilma terminalita - $ 6,2K
  • Minimaalne lahenduse maksumus SmartCam A12VT + Yealink VC880 - $ 10.8K
  • Minimaalne lahenduse maksumus Tarkvaraterminal SmartCam A12VT+ - $ 7,7K
  • Keskmine lülitusviivitus 3 sekundit
  • Hääljuhised + videoanalüüs
  • Nõuded kõneleja näole – nõudeid pole
  • Kolmandate osapoolte ühilduvus – HDMI

Lahenduse kahe peamise ja vaieldamatu eelisena SmartCam A12 hääle jälgimine Ma leian:

  1. Ühenduvuse mitmekülgsus — HDMI kaudu integreerub süsteem nii riist- kui ka tarkvara videokonverentsi terminalisüsteemidega
  2. Madal hind — sarnase funktsionaalsusega A12VT on eelarvega kordades soodsam kui ülalkirjeldatud ettepanekud.

Süsteemi toimimise demonstreerimiseks salvestasime videoülevaate. Ülesanne polnud niivõrd reklaam, kuivõrd funktsionaalne. Seetõttu puudub videol Polycomi reklaamvideo paatos. Esitluse toimumise kohaks ei valitud esindust, vaid meie koostööpartneri, ettevõtte IPMatika laboratoorset koosolekuruumi.
Minu eesmärk ei olnud varjata süsteemi vigu, vaid vastupidi, paljastada funktsionaalsuse kitsaskohad, sundida süsteemi vigu tegema.

Minu arvates läbis süsteem testid edukalt. Ütlen seda enesekindlalt, sest selle artikli kirjutamise ajal oli lahendus SmartCam A12 hääle jälgimine külastas tosinat meie klientide tõelist koosolekuruumi. Automaatika tõrkeid täheldati eranditult soovitatavate tööreeglite rikkumise korral. Eelkõige minimaalne kaugus lähedalasuvate osalejateni. Kui istud kaamerale väga lähedal, alla meetri, ei tunne mikrofoni massiiv sind ära ja objektiiv ei suuda sind jälgida.

Kaamera häälega sihtimise funktsioon on muutunud kättesaadavamaks – universaalne lahendus SmartCam A12 Voice Tracking

Lisaks kaugusele on veel üks nõue – kaamera kõrgus.

Kaamera häälega sihtimise funktsioon on muutunud kättesaadavamaks – universaalne lahendus SmartCam A12 Voice Tracking

Kui kaamera on paigaldatud liiga madalale, võib tekkida probleeme hääle positsioneerimisega. Teleri all olev valik kahjuks ei töötanud.
Kuid süsteemi paigaldamine kuvari kohale on seadme jaoks ideaalne viis. Kaamerariiul on komplektis, standardvarustuses on ainult seinakinnitus.

Kuidas SmartCam A12 hääljälgimine töötab

Põhilistel PTZ-objektiividel on võrdsed rollid - nende ülesanne on vaheldumisi jälgida saatejuhte ja kuvada üldist plaani. Ruumi üldpildi analüüs ja objektide kauguse määramine toimub kahelt süsteemi alusesse integreeritud kaameralt saadud videovoogude abil. See funktsioon võimaldab vähendada kõlari vahetamisel objektiivi reaktsiooniaega 1-2 sekundini. Kaameral õnnestub osalejate vahel mugavas rütmis vaheldumisi teha, isegi kui nad vahetavad lühikesi lauseid.
Süsteemi toimimise videoesitlus peegeldab täielikult selle funktsionaalsust SmartCam A12VT. Kuid neile, kes pole videot vaadanud, kirjeldan sõnadega automaatika tööpõhimõtet:

  1. Tuba on tühi: üks objektiiv näitab üldplaani, teine ​​on valmis - ootab inimesi
  2. Inimesed sisenevad ruumi ja võtavad istet: vaba objektiiv leiab kaks äärmuslikku osalejat ja raamib nende ümber pildi, lõigates ruumist tühja osa.
  3. Inimeste liikumise ajal jälgivad objektiivid kordamööda kõiki ruumis viibijaid, hoides neid kaadri keskel
  4. Kõlar hakkab rääkima: objektiiv on aktiivne, kohandatud üldplaanile. Teine on suunatud kõlarile ja alles siis läheb saaterežiimi
  5. Kõlar vahetub: esimesele kõlarile kohandatud objektiiv on aktiivne ja teine ​​objektiiv langetab laikaadri ja kohandub uue kõlariga
  6. Pildi vahetamise hetkel esimeselt kõlarilt teisele reguleeritakse vaba objektiiv koheselt ruumi üldplaaniga
  7. Kui kõik on vait, näitab tasuta objektiiv ilma viivitusteta valmis üldplaani
  8. Kui kõlar uuesti vahetub, läheb vaba objektiiv teda otsima

Järeldus

Minu arvates toob see eelmisel aastal ISE-l ja ISR-il esitletud lahendus kõrgtehnoloogia lähemale - kui mitte inimestele, siis ärile kindlasti. On selge, et 400 tuhande rubla eest ostavad vähesed inimesed sellist "mänguasja" koju, kuid äri jaoks, ettevõtte videokonverentside jaoks on see väga taskukohane ja mugav lahendus kaamera automaatse suunamise probleemile.
Arvestades mitmekülgsust SmartCam A12 hääle jälgimine, saab süsteemi kasutada nullist lahendusena või olemasoleva videokonverentsi infrastruktuuri funktsionaalsuse laiendusena. HDMI kaudu ühendamine on suur samm kasutaja poole, erinevalt ülalkirjeldatud tootjate patenteeritud süsteemidest.

Soovin tänada partnereid, kes testimisel abiks olid.
ettevõte IPMatika — Yealink VC880 terminali, koosolekuruumi ja Yakushina Yura jaoks.
ettevõte Smart-AV — lahenduse ja süsteemi pakkumise esmakordse ja eksklusiivse ülevaatamise õiguse eest SmartCam A12 hääle jälgimine testimiseks.

Viimases artiklis Interneti-koosolekuruumide kujundaja – optimaalse videokonverentsilahenduse valik, veebisaidi reklaamina vc4u.ru и VKS disainer teatasime 10% allahindlust hinnast sisse kataloog koodsõna järgi HABR kuni 2019 suve lõpuni.

Soodustus kehtib järgmiste jaotiste toodetele:

Otsuse juurde SmartCam A12 hääle jälgimine Pakun lisaks 5% allahindlust juba olemasolevale 10%-le - 15. aasta suve lõpuni kokku 2019%.

Ootan teie kommentaare ja vastuseid küsitlusele!

Tänan teid tähelepanu eest.
Lugupidamisega
Kirill Usikov (Usikoff)
Juht
Videovalve ja videokonverentsisüsteemid
[meiliga kaitstud]
stss.ru
vc4u.ru

Küsitluses saavad osaleda ainult registreerunud kasutajad. Logi sissepalun.

Kui kasulik on SmartCam A12 hääljälgimine?

  • Lõpuks ometi on ilmunud universaalne lahendus tarkvara- ja riistvaraterminalidele!

  • Lahendus on hea, kuid on ka teisi valikuid (kirjutan kommentaaridesse)

  • Süsteem on nõrk, see ei jõua Polycomi ja Cisconi - kirjutan kommentaaridesse, miks peaksite maksma 3 korda rohkem!

  • Kes ikkagi vajab koosolekuruumis automaatset juhendamist?

  • Kellel üldse PTZ-kaamerat koosolekuruumis vaja on? — Ühendasin veebikaamera ja kõik oli korras!

8 kasutajat hääletas. 5 kasutajat jäi erapooletuks.

Allikas: www.habr.com

Lisa kommentaar