Ovoz orqali kamerani nishonlash funksiyasi yanada qulayroq bo'ldi - universal yechim SmartCam A12 Voice Tracking

Ovoz orqali kamerani nishonlash funksiyasi yanada qulayroq bo'ldi - universal yechim SmartCam A12 Voice TrackingVideokonferentsiyada so'zlayotgan ishtirokchini kuzatish mavzusi so'nggi bir necha yil ichida tezlashdi. Texnologiya real vaqt rejimida audio/video ma'lumotlarini qayta ishlash uchun murakkab algoritmlarni amalga oshirish imkonini berdi, bu deyarli 10 yil oldin Polycom kompaniyasini aqlli avtomatik dinamik kuzatuvi bilan dunyodagi birinchi asosiy yechimni joriy etishga undadi. Bir necha yillar davomida ular bunday yechimning yagona egalari bo'lib qolishga muvaffaq bo'lishdi, ammo Cisco uzoq kutishga to'g'ri kelmadi va Polycom kompaniyasining yechimiga adolatli raqobatchi bo'lgan ikki kamerali aqlli tizimning o'z versiyasini bozorga olib chiqdi. Ko'p yillar davomida ushbu videokonferentsaloqa segmenti bir nechta imkoniyatlar bilan cheklangan edi mulkiy mahsulotlar, ammo bu maqola birinchisiga bag'ishlangan universal video konferentsiyaning apparat va dasturiy infratuzilmasi bilan mos keladigan ovozli kamerani boshqarish uchun yechim.
Yechimlarni tavsiflash va qobiliyatlarni namoyish etishga o'tishdan oldin, men muhim voqeani qayd etmoqchiman:
Men Xabra hamjamiyatiga taqdim etishdan sharafman yangi markaz, videokonferentsaloqa yechimlariga (VCC) bag'ishlangan. Endi birgalikdagi sa'y-harakatlar tufayli (mina va NUJ) Video konferentsiya Habré-da o'z uyi bor va men ushbu keng va dolzarb mavzuga aloqador barchani obuna bo'lishga taklif qilaman yangi markaz.

Kamerani karnayga yo'naltirish uchun ikkita stsenariy

Hozirgi vaqtda videokonferentsaloqa yechimlarining integratorlari taqdimotchiga yo'naltirilgan vazifani amalga oshirishning ikki xil usulini tanlaydilar:

  1. Avtomatik - aqlli
  2. Yarim avtomatik - dasturlashtiriladigan

Birinchi variant - bu Cisco, Polycom va boshqa ishlab chiqaruvchilarning echimlari, biz ularni quyida ko'rib chiqamiz. Bu erda biz videokonferentsiyada gaplashayotgan ishtirokchiga kamerani yo'naltirishni to'liq avtomatlashtirish bilan shug'ullanamiz. Audio/video signallarni qayta ishlashning noyob algoritmlari kameraga kerakli pozitsiyani mustaqil ravishda tanlash imkonini beradi.

Ikkinchi variant - bu turli xil tashqi boshqaruv kontrollerlariga asoslangan avtomatlashtirish tizimlari, biz ularni batafsil ko'rib chiqmaymiz, chunki Maqola ma'ruzachilarni avtomatik kuzatishga bag'ishlangan.
Kamerani ko'rsatishni amalga oshirishning ikkinchi stsenariysi tarafdorlari juda ko'p va buning sabablari bor. Tajribali integratorlar Polycom va Cisco’ning aqlli yechimlari avtomatlashtirishning to‘g‘ri ishlashi uchun ideal ish sharoitlarini talab qilishini tushunishadi. Ammo bunday sharoitlarni ta'minlash har doim ham mumkin emas, shuning uchun tizimning ishlashi ba'zan kamerani ko'rsatish muammosining quyidagi echimi bilan kafolatlanadi:

1. Barcha kerakli sozlamalar (PTZ qurilmasining pozitsiyalari va optik masshtab koeffitsienti) qo'lda oldindan kamera xotirasiga (yoki ba'zan boshqaruv boshqaruvchisiga) kiritiladi. Qoida tariqasida, bu yig'ilish xonasining umumiy rejasi va har bir konferentsiya ishtirokchisining portret rejimida ko'rinishi.

2. Keyinchalik, kerakli oldindan o'rnatishni chaqirish uchun tashabbuskorlar belgilangan joylarda o'rnatiladi - bular mikrofon konsollari yoki radio tugmalari, umuman olganda, boshqaruv boshqaruvchisiga tushunadigan signal bilan ta'minlaydigan har qanday qurilma.

3. Boshqaruv boshqaruvchisi shunday dasturlashtirilganki, har bir initsiator o'zining oldindan sozlashiga ega. Xonaning umumiy rejasi - barcha tashabbuskorlar o'chirilgan.
Natijada, masalan, kongress tizimi va boshqaruv boshqaruvchisidan foydalanganda, ma'ruzachi nutqini boshlashdan oldin, shaxsiy mikrofon konsolini faollashtiradi. Boshqaruv tizimi saqlangan kamera holatini bir zumda qayta ishlaydi.

Ushbu stsenariy mukammal ishlaydi - tizim ovozli triangulyatsiya va video tahlilini amalga oshirishi shart emas. Men tugmani bosdim va oldindan o'rnatilgan ishladi, hech qanday kechikishlar yoki noto'g'ri pozitivlar.
Boshqarish va avtomatlashtirish tizimlari katta, murakkab xonalarda qo'llaniladi, bu erda ba'zan bir emas, balki bir nechta videokameralar o'rnatiladi. Kichik va o'rta o'lchamdagi yig'ilish xonalari uchun avtomatik tizimlar juda mos keladi (agar sizda byudjet bo'lsa).
Keling, asoschilardan boshlaylik.

Polycom EagleEye direktori

Ovoz orqali kamerani nishonlash funksiyasi yanada qulayroq bo'ldi - universal yechim SmartCam A12 Voice TrackingBu yechim bir vaqtlar videokonferensaloqa sohasida shov-shuv yaratdi. Polycom EagleEye Director aqlli kamerani boshqarish sohasidagi birinchi yechim edi. Yechim EagleEye Director asosiy bloki va ikkita kameradan iborat. Ushbu birinchi amalga oshirishning o'ziga xos xususiyati shundaki, bitta kamera faqat ma'ruzachining yaqindan ko'rinishi uchun, ikkinchisi - majlislar xonasining umumiy rejasi uchun ajratilgan. Shu bilan birga, umumiy reja kamerasi yig'ilish zalidagi boshqa joyga bazadan butunlay alohida joylashtirilishi mumkin - u avtomatik rahbarlik jarayonida bevosita ishtirok etmaydi.
Tizim quyidagicha ishlaydi:

  1. Umumiy xona kamerasi faol - hamma jim
  2. Karnay gapira boshlaydi - mikrofon massivi ovozni qabul qiladi, kamera ovozli triangulyatsiyani o'z ichiga olgan patentlangan texnologiyadan foydalangan holda ovoz tomon harakatlanadi. Umumiy kamera hali ham faol
  3. Asosiy kamera endigina ovoz manbasini qidira boshlaydi, video tahlilini o'tkazadi. Tizim karnayni ko'z-burun-og'iz aloqasi orqali aniqlaydi, karnayning rasmini ramkaga soladi va asosiy kameradan oqimni ko'rsatadi.
  4. Karnay o'zgaradi. Mikrofon massivi ovozning boshqa joydan kelayotganini tushunadi. Bosh reja yana yoqiladi.
  5. Va keyin aylanada, 2-banddan boshlab
  6. Agar yangi dinamik oldingisi bilan ramkada bo'lsa, tizim faol oqimni umumiy tortishish uchun o'zgartirmasdan "issiq" joylashishni o'zgartiradi.

Kamchiliklari, mening fikrimcha, faqat bitta asosiy kameraning mavjudligi. Bu karnaylarni almashtirishda sezilarli kechikishga olib keladi. Va har safar ishora qilish paytida tizim xonaning umumiy rejasini yoqadi - jonli suhbat paytida bu miltillash bezovta qila boshlaydi.

Polycom EagleEye direktori II

Ovoz orqali kamerani nishonlash funksiyasi yanada qulayroq bo'ldi - universal yechim SmartCam A12 Voice TrackingBu Polycom-dan nisbatan yaqinda chiqarilgan yechimning ikkinchi versiyasi. Ishlash printsipi o'zgarishlarga duch keldi va Cisco kompaniyasining yechimiga o'xshardi. Endi ikkala PTZ kamerasi ham asosiy bo'lib, kanallarni bir taqdimotchidan boshqasiga muammosiz almashtirishga xizmat qiladi. Yig‘ilish xonasining umumiy tartibi endi EagleEye Director II asosiy blokining korpusiga o‘rnatilgan alohida kamera tomonidan suratga olingan. Ba'zi sabablarga ko'ra, ushbu keng burchakli kameradan oqim asosiy oqimning 1/9 qismini egallagan holda ekranning burchagidagi qo'shimcha oynada ko'rsatiladi. Joylashtirish printsipi bir xil - ovozli triangulyatsiya va video oqimini tahlil qilish. Va to'siqlar bir xil: agar tizim gapiradigan og'izni ko'rmasa, kamera mo'ljallanmaydi. Va bu holat juda tez-tez sodir bo'lishi mumkin - ma'ruzachi yuz o'girdi, ma'ruzachi yon tomonga o'girildi, ma'ruzachi ventriloqist, ma'ruzachi og'zini qo'li yoki hujjat bilan yopdi.
Ikkala reklama roliklari ham malakali suratga olingan - 2 kishi navbatma-navbat gapiradi va nutq terapevti bilan uchrashganday og'zini ochadi. Ammo bunday nozik sharoitlarda ham juda muhim kechikish mavjud. Ammo ramka benuqson - qulay portret suratga olish.

Cisco TelePresence SpeakerTrack 60

Ovoz orqali kamerani nishonlash funksiyasi yanada qulayroq bo'ldi - universal yechim SmartCam A12 Voice TrackingUshbu yechimni tasvirlash uchun men rasmiy risoladagi matndan foydalanaman.
SpeakerTrack 60 toʻgʻridan-toʻgʻri ishtirokchilar oʻrtasida almashish uchun noyob ikki kamerali yondashuvni qoʻllaydi. Bir kamera tezda faol taqdimotchining yaqin planini topadi, ikkinchisi esa keyingi taqdimotchini qidiradi va ko'rsatadi. MultiSpeaker xususiyati, agar keyingi dinamik joriy kadrda allaqachon mavjud bo'lsa, keraksiz almashtirishni oldini oladi.
Afsuski, men SpeakerTrack 60 ni o'zim sinab ko'rish imkoniyatiga ega bo'lmadim. Shuning uchun, "maydondan" fikrga va quyida ko'rsatilgan videoni tahlil qilish natijalariga asoslanib, xulosalar chiqarish kerak. Men yangi taqdimotchiga ishora qilganda maksimal kechikish deyarli 8 soniyani hisobladim. Videoga ko'ra, o'rtacha kechikish 2-3 soniya edi.

HUAWEI Intelligent Tracking Video Camera VPT300

Ovoz orqali kamerani nishonlash funksiyasi yanada qulayroq bo'ldi - universal yechim SmartCam A12 Voice TrackingMen bu yechimni Huawei-dan tasodifan uchratdim. Tizim taxminan 9 ming dollar turadi. Faqat Huawei terminallari bilan ishlaydi. Ishlab chiquvchilar o'zlarining "hiylasini" qo'shdilar - agar xonada boshqa hech kim bo'lmasa, bitta ekranda ikkita dinamikdan video tartibi. Xususiyatlari va e'lon qilingan funksionalligi nuqtai nazaridan, bu avtomatik boshqaruv tizimining juda qiziqarli versiyasidir. Ammo, afsuski, men hech qanday demo material topmadim. Ushbu mavzu bo'yicha paydo bo'lgan yagona video asl ovozsiz, musiqaga o'rnatilgan yechimning tahrirlangan video sharhi edi. Shunday qilib, tizimning sifatini baholash mumkin emas edi. Shu sababli, men bu variantni ko'rib chiqmayman.
Men Huawei-ning Habré-da faol blogi borligini ko'rmoqdaman - ehtimol hamkasblar ushbu mahsulot haqida foydali ma'lumotlarni nashr etishlari mumkin.

Yangi - universal yechim SmartCam A12 Ovozli Kuzatuv

Ovoz orqali kamerani nishonlash funksiyasi yanada qulayroq bo'ldi - universal yechim SmartCam A12 Voice TrackingSmartCam A12VT - monoblok, shu jumladan dinamiklarni kuzatish uchun ikkita PTZ kamerasi, xonaning umumiy tartibini tahlil qilish uchun ikkita o'rnatilgan kamera, shuningdek korpus bazasiga o'rnatilgan mikrofon majmuasi - ko'rib turganingizdek, katta hajmli va katta hajmli kameralar mavjud emas. raqiblarniki kabi mo'rt tuzilmalar.
Yangi mahsulotni tavsiflashni boshlashdan oldin, men Cisco va Polycom yechimlarining xarakteristikalari va xususiyatlarini birlashtiraman, shunda men solishtiraman. SmartCam A12VT mavjud takliflar bilan.

Polycom EagleEye direktori

  • Terminalsiz tizimning chakana narxi - $ 13K
  • EagleEye Director + RealPresence Group 500 yechimining minimal narxi - $ 19K
  • O'rtacha almashtirish kechikishi 3 soniya
  • Ovozli ko'rsatma + video tahlili
  • Spikerning yuziga yuqori talablar - og'zingizni yashirolmaysiz
  • Uchinchi tomon uskunalari bilan mos kelmasligi

Cisco TelePresence SpeakerTrack 60

  • Terminalsiz tizimning chakana narxi - $ 15,9K
  • TelePresence SpeakerTrack 60 + SX80 kodek yechimining minimal narxi - $ 30K
  • O'rtacha almashtirish kechikishi 3 soniya
  • Ovozli ko'rsatma + video tahlili
  • Spikerning yuziga qo'yiladigan talablar - tekshirmadi, ma'lumot topmadi
  • Uchinchi tomon uskunalari bilan mos kelmasligi

SmartCam A12 Ovozli Kuzatuv

  • Terminalsiz tizimning chakana narxi - $ 6,2K
  • Yechimning minimal narxi SmartCam A12VT + Yealink VC880 - $ 10.8K
  • Yechimning minimal narxi SmartCam A12VT+ dasturiy terminali - $ 7,7K
  • O'rtacha almashtirish kechikishi 3 soniya
  • Ovozli ko'rsatma + video tahlili
  • Karnayning yuziga qo'yiladigan talablar - talablar yo'q
  • Uchinchi tomon mosligi - HDMI

Yechimning ikkita asosiy va inkor etilmaydigan afzalliklari sifatida SmartCam A12 Ovozli Kuzatuv Men topdim:

  1. Ulanishning ko'p qirraliligi — HDMI orqali tizim apparat va dasturiy taʼminot videokonferensaloqa terminal tizimlari bilan birlashadi
  2. Arzon — shunga o'xshash funksionallikka ega bo'lgan A12VT yuqorida tavsiflangan takliflarga qaraganda byudjetda bir necha baravar arzonroq.

Tizim qanday ishlashini ko'rsatish uchun biz video ko'rib chiqishni yozdik. Vazifa juda ko'p reklama emas, balki funktsional edi. Shuning uchun, video Polycom reklama videosining patosidan mahrum. Taqdimotni o‘tkazish joyi vakolatxona emas, balki hamkorimiz IPMatika kompaniyasining laboratoriya majlislar zali bo‘ldi.
Mening maqsadim tizimning kamchiliklarini yashirish emas, aksincha, funksionallikdagi to‘siqlarni fosh qilish, tizimni xato qilishga majburlash edi.

Menimcha, tizim sinovlardan muvaffaqiyatli o'tdi. Men buni ishonch bilan aytaman, chunki ushbu maqolani yozish vaqtida yechim SmartCam A12 Ovozli Kuzatuv mijozlarimizning o'nlab haqiqiy uchrashuv xonalariga tashrif buyurdi. Avtomatlashtirishning nosozliklari faqat tavsiya etilgan foydalanish qoidalarini buzish sharoitida kuzatildi. Xususan, yaqin atrofdagi ishtirokchilarga minimal masofa. Agar siz kameraga juda yaqin, bir metrdan kamroq o'tirsangiz, mikrofon majmuasi sizni tanimaydi va ob'ektiv sizni kuzata olmaydi.

Ovoz orqali kamerani nishonlash funksiyasi yanada qulayroq bo'ldi - universal yechim SmartCam A12 Voice Tracking

Masofadan tashqari yana bir talab bor - kameraning balandligi.

Ovoz orqali kamerani nishonlash funksiyasi yanada qulayroq bo'ldi - universal yechim SmartCam A12 Voice Tracking

Agar kamera juda past o'rnatilgan bo'lsa, ovozni joylashtirish bilan bog'liq muammolar paydo bo'lishi mumkin. Televizor ostidagi variant, afsuski, ishlamadi.
Ammo tizimni displey qurilmasi ustiga o'rnatish qurilmaning ishlashi uchun ideal usuldir. Kamera tokchasi kiritilgan; standart sifatida faqat devorga o'rnatish moslamasi qo'llab-quvvatlanadi.

SmartCam A12 Ovozli Kuzatuv qanday ishlaydi

Asosiy PTZ linzalari teng rollarga ega - ularning vazifasi navbat bilan taqdimotchilarni kuzatish va umumiy rejani ko'rsatishdir. Xonadagi umumiy rasmning tahlili va ob'ektlargacha bo'lgan masofani aniqlash tizim bazasiga o'rnatilgan ikkita kameradan olingan video oqimlar yordamida amalga oshiriladi. Bu xususiyat karnayni 1-2 soniyagacha o'zgartirganda linzaning reaktsiya vaqtini kamaytirish imkonini beradi. Kamera ishtirokchilarni qisqa jumlalar bilan almashishsa ham, qulay ritmda almashishga muvaffaq bo'ladi.
Tizimning ishlashining video namoyishi funksionallikni to'liq aks ettiradi SmartCam A12VT. Ammo, videoni ko'rmaganlar uchun men avtomatlashtirishning ishlash printsipini so'z bilan tasvirlab beraman:

  1. Xona bo'sh: linzalardan biri umumiy rejani ko'rsatadi, ikkinchisi tayyor - odamlarni kutmoqda
  2. Odamlar xonaga kirib, o'z joylarini egallaydilar: bepul ob'ektiv ikkita ekstremal ishtirokchini topadi va ularning atrofidagi tasvirni ramkaga solib, xonaning bo'sh qismini kesib tashlaydi.
  3. Odamlar harakatlanayotganda, linzalar navbatma-navbat xonadagi barchani kuzatib, ularni ramkaning markazida ushlab turadi
  4. Ma'ruzachi gapira boshlaydi: ob'ektiv faol, umumiy rejaga moslashtirilgan. Ikkinchisi karnayga qaratilgan va shundan keyingina translyatsiya rejimiga o'tadi
  5. Karnay o'zgaradi: birinchi karnayga o'rnatilgan ob'ektiv faol, ikkinchi ob'ektiv esa keng kadrni tushiradi va yangi dinamikga moslashadi.
  6. Tasvirni birinchi karnaydan ikkinchisiga o'tkazish vaqtida bepul ob'ektiv xonaning umumiy rejasiga bir zumda moslashtiriladi.
  7. Agar hamma jim bo'lsa, bepul ob'ektiv hech qanday kechikishlarsiz tayyor umumiy rejani ko'rsatadi
  8. Agar karnay yana o'zgarsa, bepul ob'ektiv uni qidirishga tushadi

xulosa

Menimcha, o'tgan yili ISE va ISRda taqdim etilgan ushbu yechim yuqori texnologiyalarni yaqinlashtiradi - agar odamlarga emas, balki biznesga. 400 ming rublga kam odam uy uchun bunday "o'yinchoq" sotib olishi aniq, ammo biznes uchun, korporativ video konferentsiya uchun bu kamerani avtomatik yo'naltirish muammosini hal qilish uchun juda qulay va qulay echimdir.
Ko'p qirralilikni hisobga olgan holda SmartCam A12 Ovozli Kuzatuv, tizim noldan yechim sifatida yoki mavjud videokonferensaloqa infratuzilmasi funksiyalarining kengaytmasi sifatida ishlatilishi mumkin. Yuqorida tavsiflangan ishlab chiqaruvchilarning xususiy tizimlaridan farqli o'laroq, HDMI orqali ulanish foydalanuvchi tomon katta qadamdir.

Sinovda yordam bergan hamkorlarga minnatdorchilik bildirmoqchiman.
Kompaniya IPMatika — Yealink VC880 terminali, majlislar zali va Yakushina Yura uchun.
Kompaniya Smart-AV — tizimning yechimi va taʼminlanishini birinchi va eksklyuziv koʻrib chiqish huquqi uchun SmartCam A12 Ovozli Kuzatuv sinov uchun.

Oxirgi maqolada Onlayn yig'ilish xonasi dizayneri - optimal video konferentsiya yechimini tanlash, veb-sayt reklamasi sifatida vc4u.ru и VKS dizayneri e’lon qildik 10% chegirma narxidan boshlab katalog kodli so'z bilan HABR 2019 yil yoz oxirigacha.

Chegirma quyidagi bo'limlardagi mahsulotlarga nisbatan qo'llaniladi:

Qarorga SmartCam A12 Ovozli Kuzatuv Men allaqachon mavjud 5% ga qo'shimcha 10% chegirma taklif qilaman - 15 yilning yozi oxirigacha jami 2019%.

So'rovnomada sharhlaringizni va javoblaringizni kutaman!

E'tiboringiz uchun rahmat.
Hurmat bilan,
Kirill Usikov (Usikoff)
rahbari
Video kuzatuv va video konferentsiya tizimlari
[elektron pochta bilan himoyalangan]
stss.ru
vc4u.ru

So'rovda faqat ro'yxatdan o'tgan foydalanuvchilar ishtirok etishlari mumkin. tizimga kirishiltimos.

SmartCam A12 Voice Tracking qanchalik foydali?

  • Nihoyat, dasturiy va apparat terminallari uchun universal yechim paydo bo'ldi!

  • Yechim yaxshi, lekin boshqa variantlar ham bor (izohlarda yozaman)

  • Tizim zaif, u Polycom va Cisco-ga etib bormaydi - nega 3 baravar ko'proq to'lash kerakligini izohlarda yozaman!

  • Uchrashuv xonasida avtomatik yo'l-yo'riq kimga kerak?

  • Uchrashuv xonasida PTZ kamerasi kimga kerak? — Men veb-kamerani uladim va hammasi yaxshi!

8 foydalanuvchi ovoz berdi. 5 nafar foydalanuvchi betaraf qolgan.

Manba: www.habr.com

a Izoh qo'shish