ProHoster > Blogi > Haldamine > Kaamera häälega sihtimise funktsioon on muutunud kättesaadavamaks – universaalne lahendus SmartCam A12 Voice Tracking
Kaamera häälega sihtimise funktsioon on muutunud kättesaadavamaks – universaalne lahendus SmartCam A12 Voice Tracking
Videokonverentsil esineva osaleja jälgimise teema on viimastel aastatel hoo sisse saanud. Tehnoloogia on võimaldanud rakendada keerulisi algoritme heli/videoteabe reaalajas töötlemiseks, mis ajendas Polycomi peaaegu 10 aastat tagasi tutvustama maailma esimest tavalahendust koos intelligentse automaatse kõlarite jälgimisega. Mitu aastat õnnestus neil jääda sellise lahenduse ainsaks omanikuks, kuid Cisco ei pidanud kaua ootama ja tõi turule oma versiooni intelligentsest kahekaamerasüsteemist, mis oli Polycomi lahendusele aus konkurent. Paljude aastate jooksul oli see videokonverentsi segment piiratud mitme võimalusega varaline tooteid, kuid see artikkel on pühendatud esimesele universaalne lahendus kaamera häälega juhtimiseks, mis ühildub videokonverentside riist- ja tarkvara infrastruktuuriga.
Enne lahenduste kirjeldamise ja võimaluste demonstreerimise juurde asumist tahan märkida ühte olulist sündmust: Mul on au esitleda Habra kogukonnale uus keskus, mis on pühendatud videokonverentsilahendustele (VCC). Nüüd tänu ühistele jõupingutustele (minu ja UFO) Videokonverentsid on oma kodu Habrel ja ma kutsun kõiki, kes on selle ulatusliku ja aktuaalse teemaga seotud, tellima uus keskus.
Kaks stsenaariumi kaamera kõlarile suunamiseks
Hetkel valivad videokonverentsilahenduste integreerijad endale kaks erinevat viisi esineja sihtimise ülesande elluviimiseks:
Automaatne – intelligentne
Poolautomaatne – programmeeritav
Esimene võimalus on vaid Cisco, Polycomi ja teiste tootjate lahendused; me käsitleme neid allpool. Siin käsitleme kaamera videokonverentsil kõnelevale osalejale suunamise täielikku automatiseerimist. Unikaalsed heli-/videosignaalide töötlemise algoritmid võimaldavad kaameral iseseisvalt soovitud asendi valida.
Teine võimalus on erinevatel välistel juhtimiskontrolleritel põhinevad automaatikasüsteemid; me ei käsitle neid üksikasjalikult, sest Artikkel on pühendatud spetsiaalselt kõlarite automaatsele jälgimisele.
Kaamera suunamise rakendamise teise stsenaariumi pooldajaid on üsna palju ja sellel on oma põhjused. Kogenud integraatorid mõistavad, et Polycomi ja Cisco intelligentsed lahendused nõuavad automaatika nõuetekohaseks toimimiseks ideaalseid töötingimusi. Kuid alati pole selliseid tingimusi võimalik pakkuda, nii et mõnikord tagab süsteemi töö kaamera suunamisprobleemi järgmise lahendusega:
1. Kõik vajalikud eelseaded (PTZ-seadme asukohad ja optilise suumi koefitsient) sisestatakse eelnevalt käsitsi kaamera mällu (või mõnikord ka juhtkontrollerisse). Reeglina on see koosolekuruumi üldplaan ja vaade igale konverentsil osalejale portreerežiimis.
2. Järgmisena paigaldatakse määratud kohtadesse vajaliku eelseadistuse helistamise initsiaatorid - need on kas mikrofonikonsoolid või raadionupud, üldiselt mis tahes seade, mis suudab juhtkontrollerile anda signaali, millest see aru saab.
3. Juhtkontroller on programmeeritud nii, et igal initsiaatoril on oma eelseade. Ruumi üldplaan - kõik initsiaatorid on välja lülitatud.
Selle tulemusena aktiveerib kõneleja enne kõne alustamist näiteks kongressisüsteemi ja kontrollerit kasutades isikliku mikrofonikonsooli. Juhtsüsteem töötleb koheselt salvestatud kaameraasendit.
See stsenaarium töötab laitmatult – süsteem ei pea tegema hääle triangulatsiooni ja videoanalüüsi. Vajutasin nuppu ja eelseade töötas, viivitusi ega valepositiivseid tulemusi ei olnud.
Juhtimis- ja automaatikasüsteeme kasutatakse suurtes keerukates ruumides, kuhu mõnikord paigaldatakse mitte üks, vaid mitu videokaamerat. Noh, väikeste ja keskmise suurusega koosolekuruumide jaoks on automaatsed süsteemid üsna sobivad (kui teil on eelarve).
Alustame asutajatest.
Polycom EagleEye direktor
Kunagi tekitas see lahendus videokonverentside vallas sensatsiooni. Polycom EagleEye Director oli esimene lahendus intelligentse kaamera juhtimise valdkonnas. Lahendus koosneb EagleEye Directori baasseadmest ja kahest kaamerast. Selle esimese teostuse eripära on see, et üks kaamera on eraldatud ainult kõneleja lähivaatele ja teine - koosolekuruumi üldplaanile. Samas saab üldplaani kaamera paigutada täiesti eraldi alusest teise kohta koosolekuruumis - see ei ole otseselt automaatse suunamise protsessiga seotud.
Süsteem töötab järgmiselt:
Üldine ruumikaamera on aktiivne – kõik vaikivad
Kõlar hakkab rääkima – mikrofoni massiiv võtab hääle üles, kaamera liigub heli poole, kasutades patenteeritud tehnoloogiat, mis sisaldab hääle triangulatsiooni. Üldkaamera on endiselt aktiivne
Põhikaamera alles hakkab otsima heliallikat, viies läbi videoanalüüsi. Süsteem tuvastab kõlari silma-nina-suu ühenduse kaudu, raamib kõlari pildi ja kuvab põhikaamerast tuleva voo
Kõlar vahetub. Mikrofoni massiiv mõistab, et hääl tuleb teisest kohast. Üldplaneering lülitatakse uuesti sisse.
Ja siis ringis, alustades punktist 2
Kui uus kõlar on eelmisega kaadris, teeb süsteem "kuuma" positsioneerimise muudatuse, muutmata aktiivset voogu üldkaadrisse.
Negatiivne külg on minu meelest vaid ühe põhikaamera olemasolu. See toob kaasa märkimisväärse viivituse kõlarite vahetamisel. Ja iga kord näpuga näitamise hetkel lülitab süsteem sisse ruumi üldplaneeringu – elava vestluse käigus hakkab see virvendus ärritama.
Polycom EagleEye Režissöör II
See on Polycomi lahenduse teine versioon, mis ilmus suhteliselt hiljuti. Tööpõhimõte on muutunud ja muutunud pigem Cisco lahenduseks. Nüüd on mõlemad PTZ-kaamerad peamised ja nende abil saate kanaleid sujuvalt ühelt saatejuhilt teisele vahetada. Koosolekuruumi üldist paigutust jäädvustab nüüd eraldi kaamera, mis on integreeritud EagleEye Director II põhiseadme korpusesse. Millegipärast kuvatakse selle lainurkkaamera voog ekraani nurgas asuvas lisaaknas, mis võtab enda alla 1/9 põhivoost. Positsioneerimise põhimõte on sama – hääle triangulatsioon ja videovoo analüüs. Ja kitsaskohad on samad: kui süsteem rääkivat suud ei näe, siis kaamera ei sihi. Ja seda olukorda võib juhtuda päris tihti – kõneleja on ära pööranud, rääkija on end külili keeranud, kõneleja on kõhurääkija, kõneleja on suu käe või dokumendiga kinni katnud.
Mõlemad reklaamvideod filmiti asjatundlikult - 2 inimest räägivad kordamööda ja teevad suu lahti nagu logopeedi vastuvõtul. Kuid isegi sellistes rafineeritud tingimustes on väga suur viivitus. Aga kadreering on laitmatu – mugav portreevõte.
Cisco TelePresence SpeakerTrack 60
Selle lahenduse kirjeldamiseks kasutan ametliku brošüüri teksti. SpeakerTrack 60 kasutab ainulaadset kahe kaameraga lähenemist, et kiiresti osalejate vahel vahetada. Üks kaamera leiab kiiresti aktiivse saatejuhi lähivõtte, teine aga otsib ja kuvab järgmise saatejuhi. Funktsioon MultiSpeaker takistab tarbetut ümberlülitamist, kui järgmine kõlar on praeguses kaadris juba olemas.
Kahjuks ei olnud mul võimalust SpeakerTrack 60 ise testida. Seetõttu tuleb järeldused teha „põllult pärit“ arvamuse ja alloleva esitlusvideo analüüsi tulemuste põhjal. Uuele saatejuhile osutades lugesin maksimaalseks viivituseks peaaegu 8 sekundit. Keskmine viivitus oli video järgi otsustades 2-3 sekundit.
HUAWEI intelligentne jälgimisvideokaamera VPT300
Selle lahenduseni sattusin Huaweilt juhuslikult. Süsteem maksab umbes 9 XNUMX dollarit. Töötab ainult Huawei terminalidega. Arendajad lisasid oma "triki" - videopaigutuse kahest kõlarist ühel ekraanil, kui ruumis pole kedagi teist. Omaduste ja deklareeritud funktsionaalsuse poolest on see automaatse juhtimissüsteemi väga huvitav versioon. Kuid kahjuks ei leidnud ma absoluutselt ühtegi demomaterjali. Ainus video, mis sellel teemal ilmus, oli lahenduse monteeritud videoülevaade, ilma originaalhelita, muusika peale seatud. Seega ei olnud võimalik süsteemi kvaliteeti hinnata. Sel põhjusel ma seda võimalust ei kaalu.
Näen, et Huaweil on aktiivne blogi Habré teemal – ehk saavad kolleegid selle toote kohta kasulikku infot avaldada.
SmartCam A12VT - monoplokk, sealhulgas kaks PTZ-kaamerat kõlarite jälgimiseks, kaks sisseehitatud kaamerat ruumi üldise paigutuse analüüsimiseks, samuti korpuse põhjale sisseehitatud mikrofoni massiiv - nagu näete, pole mahukaid ja haprad struktuurid nagu vastased.
Enne kui hakkan uut toodet kirjeldama, panen kokku Cisco ja Polycomi lahenduste omadused ja omadused, et saaksin võrrelda SmartCam A12VT olemasolevate pakkumistega.
Polycom EagleEye direktor
Süsteemi jaehind ilma terminalita - $ 13K
EagleEye Director + RealPresence Group 500 lahenduse minimaalne maksumus — $ 19K
Keskmine lülitusviivitus 3 sekundit
Hääljuhised + videoanalüüs
Kõrged nõudmised kõneleja näole – suud ei saa varjata
Lahenduse kahe peamise ja vaieldamatu eelisena SmartCam A12 hääle jälgimine Ma leian:
Ühenduvuse mitmekülgsus — HDMI kaudu integreerub süsteem nii riist- kui ka tarkvara videokonverentsi terminalisüsteemidega
Madal hind — sarnase funktsionaalsusega A12VT on eelarvega kordades soodsam kui ülalkirjeldatud ettepanekud.
Süsteemi toimimise demonstreerimiseks salvestasime videoülevaate. Ülesanne polnud niivõrd reklaam, kuivõrd funktsionaalne. Seetõttu puudub videol Polycomi reklaamvideo paatos. Esitluse toimumise kohaks ei valitud esindust, vaid meie koostööpartneri, ettevõtte IPMatika laboratoorset koosolekuruumi.
Minu eesmärk ei olnud varjata süsteemi vigu, vaid vastupidi, paljastada funktsionaalsuse kitsaskohad, sundida süsteemi vigu tegema.
Minu arvates läbis süsteem testid edukalt. Ütlen seda enesekindlalt, sest selle artikli kirjutamise ajal oli lahendus SmartCam A12 hääle jälgimine külastas tosinat meie klientide tõelist koosolekuruumi. Automaatika tõrkeid täheldati eranditult soovitatavate tööreeglite rikkumise korral. Eelkõige minimaalne kaugus lähedalasuvate osalejateni. Kui istud kaamerale väga lähedal, alla meetri, ei tunne mikrofoni massiiv sind ära ja objektiiv ei suuda sind jälgida.
Lisaks kaugusele on veel üks nõue – kaamera kõrgus.
Kui kaamera on paigaldatud liiga madalale, võib tekkida probleeme hääle positsioneerimisega. Teleri all olev valik kahjuks ei töötanud.
Kuid süsteemi paigaldamine kuvari kohale on seadme jaoks ideaalne viis. Kaamerariiul on komplektis, standardvarustuses on ainult seinakinnitus.
Kuidas SmartCam A12 hääljälgimine töötab
Põhilistel PTZ-objektiividel on võrdsed rollid - nende ülesanne on vaheldumisi jälgida saatejuhte ja kuvada üldist plaani. Ruumi üldpildi analüüs ja objektide kauguse määramine toimub kahelt süsteemi alusesse integreeritud kaameralt saadud videovoogude abil. See funktsioon võimaldab vähendada kõlari vahetamisel objektiivi reaktsiooniaega 1-2 sekundini. Kaameral õnnestub osalejate vahel mugavas rütmis vaheldumisi teha, isegi kui nad vahetavad lühikesi lauseid.
Süsteemi toimimise videoesitlus peegeldab täielikult selle funktsionaalsust SmartCam A12VT. Kuid neile, kes pole videot vaadanud, kirjeldan sõnadega automaatika tööpõhimõtet:
Tuba on tühi: üks objektiiv näitab üldplaani, teine on valmis - ootab inimesi
Inimesed sisenevad ruumi ja võtavad istet: vaba objektiiv leiab kaks äärmuslikku osalejat ja raamib nende ümber pildi, lõigates ruumist tühja osa.
Inimeste liikumise ajal jälgivad objektiivid kordamööda kõiki ruumis viibijaid, hoides neid kaadri keskel
Kõlar hakkab rääkima: objektiiv on aktiivne, kohandatud üldplaanile. Teine on suunatud kõlarile ja alles siis läheb saaterežiimi
Kõlar vahetub: esimesele kõlarile kohandatud objektiiv on aktiivne ja teine objektiiv langetab laikaadri ja kohandub uue kõlariga
Pildi vahetamise hetkel esimeselt kõlarilt teisele reguleeritakse vaba objektiiv koheselt ruumi üldplaaniga
Kui kõik on vait, näitab tasuta objektiiv ilma viivitusteta valmis üldplaani
Kui kõlar uuesti vahetub, läheb vaba objektiiv teda otsima
Järeldus
Minu arvates toob see eelmisel aastal ISE-l ja ISR-il esitletud lahendus kõrgtehnoloogia lähemale - kui mitte inimestele, siis ärile kindlasti. On selge, et 400 tuhande rubla eest ostavad vähesed inimesed sellist "mänguasja" koju, kuid äri jaoks, ettevõtte videokonverentside jaoks on see väga taskukohane ja mugav lahendus kaamera automaatse suunamise probleemile.
Arvestades mitmekülgsust SmartCam A12 hääle jälgimine, saab süsteemi kasutada nullist lahendusena või olemasoleva videokonverentsi infrastruktuuri funktsionaalsuse laiendusena. HDMI kaudu ühendamine on suur samm kasutaja poole, erinevalt ülalkirjeldatud tootjate patenteeritud süsteemidest.
Soovin tänada partnereid, kes testimisel abiks olid.
ettevõte IPMatika — Yealink VC880 terminali, koosolekuruumi ja Yakushina Yura jaoks.
ettevõte Smart-AV — lahenduse ja süsteemi pakkumise esmakordse ja eksklusiivse ülevaatamise õiguse eest SmartCam A12 hääle jälgimine testimiseks.