ProHoster > Blog > İdarə > Kameranın səslə hədəflənməsi funksiyası daha əlçatan oldu - universal həll SmartCam A12 Voice Tracking
Kameranın səslə hədəflənməsi funksiyası daha əlçatan oldu - universal həll SmartCam A12 Voice Tracking
Videokonfransda danışan iştirakçının izlənilməsi mövzusu son bir neçə ildə geniş vüsət alıb. Texnologiya real vaxt rejimində audio/video məlumatların emalı üçün mürəkkəb alqoritmləri həyata keçirməyə imkan verdi ki, bu da Polycom-u demək olar ki, 10 il əvvəl ağıllı avtomatik dinamik izləmə ilə dünyanın ilk əsas həllini təqdim etməyə sövq etdi. Bir neçə il ərzində onlar belə bir həllin yeganə sahibləri olaraq qalmağa müvəffəq oldular, lakin Cisco çox gözləməli olmadı və bazara Polycom-dan həll üçün ədalətli rəqib olan ağıllı iki kameralı sistem versiyasını gətirdi. Uzun illər ərzində videokonfransın bu seqmenti bir neçəsinin imkanları ilə məhdudlaşırdı mülkiyyətçi məhsullar, lakin bu məqalə birinciyə həsr edilmişdir universal video konfransın həm aparat, həm də proqram təminatı infrastrukturu ilə uyğun gələn səslə kamera rəhbərliyi üçün həll.
Həll yollarını təsvir etməyə və imkanları nümayiş etdirməyə keçməzdən əvvəl vacib bir hadisəni qeyd etmək istəyirəm: Mən Habra icmasına təqdim etməkdən şərəf duyuram yeni mərkəz, videokonfrans həllərinə (VCC) həsr olunmuşdur. İndi birgə səylər sayəsində (mina və UFO) Video konfrans Habré-də öz evi var və mən bu geniş və aktual mövzuda iştirak edən hər kəsi abunə olmağa dəvət edirəm yeni mərkəz.
Kameranı dinamikə yönəltmək üçün iki ssenari
Hal-hazırda, video konfrans həllərinin inteqratorları aparıcının hədəflənməsi vəzifəsini həyata keçirmək üçün özləri üçün iki fərqli yol seçirlər:
Avtomatik - Ağıllı
Yarı avtomatik - proqramlaşdırıla bilər
Birinci seçim yalnız Cisco, Polycom və digər istehsalçıların həlləridir, biz onları aşağıda nəzərdən keçirəcəyik. Burada biz videokonfransda danışan iştirakçıya kameranın yönəldilməsinin tam avtomatlaşdırılması ilə məşğul oluruq. Audio/video siqnalların işlənməsi üçün unikal alqoritmlər kameraya müstəqil olaraq istənilən mövqeyi seçməyə imkan verir.
İkinci seçim, müxtəlif xarici idarəetmə nəzarətçiləri əsasında avtomatlaşdırma sistemləridir, biz onları ətraflı nəzərdən keçirməyəcəyik, çünki Məqalə spesifik olaraq dinamiklərin avtomatik izlənməsinə həsr edilmişdir.
Kamera işarəsini tətbiq etmək üçün ikinci ssenarinin kifayət qədər tərəfdarları var və bunun səbəbləri var. Təcrübəli inteqratorlar başa düşürlər ki, Polycom və Cisco-nun ağıllı həlləri avtomatlaşdırmanın düzgün işləməsi üçün ideal iş şəraiti tələb edir. Ancaq bu cür şərtləri təmin etmək həmişə mümkün deyil, buna görə də sistemin işləməsi bəzən kamera işarəsi probleminin aşağıdakı həlli ilə təmin edilir:
1. Bütün lazımi parametrlər (PTZ cihazının mövqeləri və optik böyütmə amili) əvvəlcədən əl ilə kameranın yaddaşına (və ya bəzən idarəetmə nəzarətçisinə) daxil edilir. Bir qayda olaraq, bu, iclas zalının ümumi planı və hər bir konfrans iştirakçısının portret rejimində görünüşüdür.
2. Sonra, tələb olunan əvvəlcədən təyin edilmiş çağırış üçün təşəbbüskarlar müəyyən edilmiş yerlərdə quraşdırılır - bunlar ya mikrofon konsolları, ya da radio düymələri, ümumiyyətlə, idarəetmə nəzarətçisinə başa düşdüyü bir siqnal ilə təmin edə bilən hər hansı bir cihazdır.
3. Nəzarət tənzimləyicisi elə proqramlaşdırılıb ki, hər bir təşəbbüskarın öz ilkin təyinatı var. Otağın ümumi planı - bütün təşəbbüskarlar söndürülür.
Nəticədə, konqres sistemindən, məsələn, idarəetmə nəzarətçisindən istifadə edərkən, spiker çıxışına başlamazdan əvvəl şəxsi mikrofon konsolunu işə salır. Nəzarət sistemi saxlanmış kamera mövqeyini dərhal emal edir.
Bu ssenari qüsursuz işləyir - sistemin səs trianqulyasiyası və video analitikasını yerinə yetirməsinə ehtiyac yoxdur. Düyməni basdım və əvvəlcədən qurulan işlədi, gecikmələr və ya yanlış pozitivlər.
Nəzarət və avtomatlaşdırma sistemləri bəzən bir deyil, bir neçə videokamera quraşdırılan böyük, mürəkkəb otaqlarda istifadə olunur. Yaxşı, kiçik və orta ölçülü iclas otaqları üçün avtomatik sistemlər olduqca uyğundur (büdcəniz varsa).
Qurucu atalardan başlayaq.
Polycom EagleEye direktoru
Bu həll bir dəfə videokonfrans sahəsində sensasiya yaratdı. Polycom EagleEye Director ağıllı kamera rəhbərliyi sahəsində ilk həll yolu idi. Həll EagleEye Director baza blokundan və iki kameradan ibarətdir. Birinci tətbiqin özəlliyi ondan ibarətdir ki, bir kamera yalnız spikerin yaxından görünüşünə, ikincisi isə iclas zalının ümumi planına ayrılıb. Eyni zamanda, ümumi plan kamerası bazadan tamamilə ayrı olaraq iclas zalının başqa bir yerində yerləşdirilə bilər - o, avtomatik rəhbərlik prosesində birbaşa iştirak etmir.
Sistem aşağıdakı kimi işləyir:
Ümumi otaq kamerası aktivdir - hamı susur
Dinamik danışmağa başlayır - mikrofon massivi səsi götürür, kamera səs trianqulyasiyasını ehtiva edən patentləşdirilmiş texnologiyadan istifadə edərək səsə doğru hərəkət edir. Ümumi kamera hələ də aktivdir
Əsas kamera yenicə səs mənbəyini axtarmağa başlayır, video analitika aparır. Sistem dinamiki göz-burun-ağız əlaqəsi ilə müəyyən edir, dinamikin şəklini çərçivəyə salır və əsas kameradan axını göstərir.
Dinamik dəyişir. Mikrofon massivi səsin başqa yerdən gəldiyini anlayır. Ümumi plan yenidən işə salınır.
Və sonra 2-ci nöqtədən başlayaraq bir dairədə
Əgər yeni dinamik əvvəlki ilə çərçivədədirsə, sistem aktiv axını ümumi çəkilişə dəyişmədən “isti” yerləşdirmə dəyişikliyi edir.
Dezavantajı, mənim fikrimcə, yalnız bir əsas kameranın olmasıdır. Bu, dinamikləri dəyişdirərkən əhəmiyyətli bir gecikmə ilə nəticələnir. Və hər dəfə işarə edən anda sistem otağın ümumi planını işə salır - canlı söhbət zamanı bu titrəmə qıcıqlandırmağa başlayır.
Polycom EagleEye direktoru II
Bu, Polycom-dan nisbətən yaxınlarda buraxılmış həllin ikinci versiyasıdır. Əməliyyat prinsipi dəyişikliklərə məruz qaldı və daha çox Cisco-nun həllinə bənzədi. İndi hər iki PTZ kamerası əsasdır və kanalları bir aparıcıdan digərinə problemsiz keçirməyə xidmət edir. Yığıncaq otağının ümumi planı indi EagleEye Director II əsas bölməsinin korpusuna inteqrasiya edilmiş ayrıca kamera tərəfindən çəkilir. Nədənsə, bu geniş bucaqlı kameradan gələn axın ekranın küncündə əsas axının 1/9 hissəsini tutan əlavə pəncərədə göstərilir. Yerləşdirmə prinsipi eynidir - səs trianqulyasiyası və video axınının təhlili. Darboğazlar isə eynidir: sistem danışan ağzı görmürsə, kamera nişan almayacaq. Və bu vəziyyət kifayət qədər tez-tez baş verə bilər - natiq üz çevirdi, natiq yan tərəfə çevrildi, natiq ventriloqdur, natiq ağzını əli və ya sənədlə bağladı.
Hər iki reklam çarxı bacarıqla çəkilib - 2 nəfər növbə ilə danışır və loqopedlə görüşdə kimi ağızlarını açır. Ancaq belə zərif şəraitdə belə çox əhəmiyyətli bir gecikmə var. Ancaq çərçivə qüsursuzdur - rahat portret çəkilişi.
Cisco TelePresence SpeakerTrack 60
Bu həlli təsvir etmək üçün mən rəsmi broşüranın mətnindən istifadə edəcəyəm. SpeakerTrack 60 iştirakçılar arasında birbaşa keçid üçün unikal ikili kameralı yanaşma tətbiq edir. Bir kamera aktiv aparıcının yaxın planını tez tapır, digəri isə növbəti aparıcını axtarır və göstərir. MultiSpeaker funksiyası cari kadrda növbəti dinamik artıq varsa, lazımsız keçidin qarşısını alır.
Təəssüf ki, SpeakerTrack 60-ı özüm sınamaq imkanım olmadı. Buna görə də, “sahədən” rəy əsasında və aşağıdakı nümayiş videosunun təhlilinin nəticələrinə əsasən nəticələr çıxarılmalıdır. Yeni aparıcıya işarə edəndə maksimum 8 saniyə gecikmə saydım. Videoya görə orta gecikmə 2-3 saniyə idi.
HUAWEI Ağıllı İzləmə Video Kamerası VPT300
Təsadüfən Huawei-dən bu həllə rast gəldim. Sistemin qiyməti təxminən 9 min dollardır. Yalnız Huawei terminalları ilə işləyir. Tərtibatçılar öz "hiylələrini" əlavə etdilər - otaqda başqa heç kim yoxdursa, bir ekranda iki dinamikdən video təşkil etmək. Xüsusiyyətlər və elan edilmiş funksionallıq baxımından bu, avtomatik rəhbərlik sisteminin çox maraqlı bir versiyasıdır. Amma təəssüf ki, mən heç bir demo material tapmadım. Bu mövzuda ortaya çıxan yeganə video, orijinal səssiz, musiqiyə qoyulmuş həllin redaktə edilmiş video icmalı idi. Beləliklə, sistemin keyfiyyətini qiymətləndirmək mümkün olmadı. Bu səbəbdən bu variantı nəzərdən keçirməyəcəyəm.
Mən görürəm ki, Huawei-nin Habré-də aktiv bloqu var - bəlkə həmkarlar bu məhsul haqqında bəzi faydalı məlumatları dərc edə biləcəklər.
SmartCam A12VT - monoblok, o cümlədən dinamikləri izləmək üçün iki PTZ kamera, otağın ümumi planını təhlil etmək üçün iki quraşdırılmış kamera, həmçinin korpusun bazasına quraşdırılmış mikrofon massivi - gördüyünüz kimi, heç bir həcmli və həcmli yoxdur. rəqiblərinki kimi kövrək strukturlar.
Yeni məhsulu təsvir etməyə başlamazdan əvvəl Cisco və Polycom həllərinin xüsusiyyətlərini və xüsusiyyətlərini bir araya gətirəcəyəm ki, müqayisə edə biləcəm. SmartCam A12VT mövcud təkliflərlə.
Polycom EagleEye direktoru
Terminalsız sistemin pərakəndə satış qiyməti - $ 13K
EagleEye Director + RealPresence Group 500 həllinin minimum qiyməti - $ 19K
Orta keçid gecikməsi 3 saniyə
Səsli təlimat + video analitika
Natiqin üzündə yüksək tələblər - ağzınızı gizlədə bilməzsiniz
Üçüncü tərəf avadanlıqları ilə uyğunsuzluq
Cisco TelePresence SpeakerTrack 60
Terminalsız sistemin pərakəndə satış qiyməti - $ 15,9K
Həllin iki əsas və danılmaz üstünlüyü kimi SmartCam A12 Səs İzləmə Mən tapdım:
Bağlantının çox yönlülüyü — HDMI vasitəsilə sistem həm aparat, həm də proqram təminatı ilə video konfrans terminal sistemləri ilə inteqrasiya edir
Aşağı qiyməti — oxşar funksionallıqla A12VT yuxarıda təsvir edilən təkliflərdən bir neçə dəfə daha sərfəli büdcədir.
Sistemin necə işlədiyini nümayiş etdirmək üçün biz video baxış qeyd etdik. Vəzifə funksional olduğu qədər reklam deyildi. Buna görə də, video Polycom tanıtım videosunun pafosundan məhrumdur. Təqdimat üçün seçilmiş yer nümayəndəlik deyil, partnyorumuz IPMatika şirkətinin laboratoriya iclas zalı idi.
Məqsədim sistemin qüsurlarını gizlətmək yox, əksinə, funksionallığın darboğazlarını üzə çıxarmaq, sistemi səhvlərə məcbur etmək idi.
Məncə, sistem sınaqlardan uğurla keçdi. Bunu əminliklə deyirəm, çünki bu məqaləni yazarkən həll yolu SmartCam A12 Səs İzləmə müştərilərimizin onlarla real görüş otağına baş çəkdik. Avtomatlaşdırmanın nasazlıqları yalnız tövsiyə olunan istismar qaydalarının pozulması şəraitində müşahidə edilmişdir. Xüsusilə, yaxınlıqdakı iştirakçılara minimum məsafə. Kameraya çox yaxın, bir metrdən az otursanız, mikrofon massivi sizi tanıya bilməyəcək və obyektiv sizi izləyə bilməyəcək.
Məsafədən əlavə, başqa bir tələb də var - kameranın hündürlüyü.
Kamera çox aşağı quraşdırılıbsa, səsin yerləşdirilməsi ilə bağlı problemlər yarana bilər. Televiziyanın altındakı seçim təəssüf ki, işləmədi.
Lakin sistemin displey cihazının üstündə quraşdırılması cihazın işləməsi üçün ideal üsuldur. Kamera rəfi daxildir; standart olaraq yalnız divar montajı dəstəklənir.
SmartCam A12 Səs İzləmə necə işləyir
Əsas PTZ linzaları bərabər rollara malikdir - onların vəzifəsi alternativ olaraq aparıcıları izləmək və ümumi planı göstərməkdir. Otaqdakı ümumi mənzərənin analitikası və obyektlərə olan məsafənin təyini sistemin bazasına inteqrasiya olunmuş iki kameradan alınan video axınlardan istifadə etməklə həyata keçirilir. Bu xüsusiyyət dinamiki 1-2 saniyəyə dəyişdirərkən linzanın reaksiya müddətini azaltmağa imkan verir. Kamera iştirakçılar qısa cümlələr mübadiləsi etsələr də, rahat bir ritmlə bir-birini əvəz etməyi bacarır.
Sistemin işinin video nümayişi funksionallığı tam əks etdirir SmartCam A12VT. Ancaq videoya baxmayanlar üçün avtomatlaşdırmanın iş prinsipini sözlə təsvir edəcəyəm:
Otaq boşdur: linzalardan biri ümumi planı göstərir, ikincisi hazırdır - insanları gözləyir
İnsanlar otağa daxil olur və yerlərini tuturlar: pulsuz obyektiv iki ifrat iştirakçını tapır və ətrafdakı şəkli çərçivəyə salaraq otağın boş hissəsini kəsir.
İnsanlar hərəkət edərkən, linzalar növbə ilə otaqdakı hər kəsi izləyir, onları çərçivənin mərkəzində saxlayır
Natiq danışmağa başlayır: obyektiv aktivdir, ümumi plana uyğunlaşdırılır. İkincisi spikerə yönəldilir və yalnız bundan sonra yayım rejiminə keçir
Dinamik dəyişir: birinci dinamikə uyğunlaşdırılmış obyektiv aktivdir, ikinci obyektiv isə geniş çəkilişi azaldır və yeni dinamikə uyğunlaşır.
Şəkli birinci dinamikdən ikinciyə keçirərkən, pulsuz obyektiv dərhal otağın ümumi planına uyğunlaşdırılır.
Hər kəs susursa, pulsuz obyektiv heç bir gecikmə olmadan hazır ümumi planı göstərəcəkdir
Dinamik yenidən dəyişərsə, pulsuz obyektiv onu axtarmağa başlayacaq
Nəticə
Fikrimcə, keçən il ISE və ISR-də təqdim olunan bu həll yüksək texnologiyanı - insanlara deyilsə, şübhəsiz ki, biznesə yaxınlaşdırır. Aydındır ki, 400 min rubla az adam ev üçün belə bir "oyuncaq" alacaq, lakin iş üçün, korporativ video konfrans üçün bu, kameranın avtomatik hədəflənməsi probleminin çox əlverişli və rahat bir həllidir.
Çox yönlülüyünü nəzərə alaraq SmartCam A12 Səs İzləmə, sistem sıfırdan bir həll kimi və ya mövcud video konfrans infrastrukturunun funksionallığının genişləndirilməsi kimi istifadə edilə bilər. Yuxarıda təsvir olunan istehsalçıların mülkiyyət sistemlərindən fərqli olaraq, HDMI vasitəsilə əlaqə istifadəçiyə doğru böyük bir addımdır.
Sınaqda kömək edən tərəfdaşlara təşəkkür etmək istərdim.
Şirkət IPMatika — Yealink VC880 terminalı, görüş otağı və Yakushina Yura üçün.
Şirkət Smart-AV — sistemin həlli və təminatına ilk və müstəsna baxış hüququna görə SmartCam A12 Səs İzləmə sınaq üçün.