Камераны дауыспен бағыттау функциясы қол жетімді болды - SmartCam A12 Voice Tracking әмбебап шешімі

Камераны дауыспен бағыттау функциясы қол жетімді болды - SmartCam A12 Voice Tracking әмбебап шешіміБейнеконференцияда сөйлейтін қатысушыны қадағалау тақырыбы соңғы бірнеше жылда қарқын алды. Технология нақты уақыт режимінде аудио/бейне ақпаратты өңдеудің күрделі алгоритмдерін енгізуге мүмкіндік берді, бұл Polycom-ды 10 жыл бұрын зияткерлік автоматты динамикті бақылау арқылы әлемдегі бірінші негізгі шешімді енгізуге итермеледі. Бірнеше жыл бойы олар мұндай шешімнің жалғыз иелері болып қала алды, бірақ Cisco көп күтудің қажеті жоқ және нарыққа Polycom шешіміне әділ бәсекелес болған интеллектуалды екі камералы жүйенің нұсқасын әкелді. Көптеген жылдар бойы бейнеконференцияның бұл сегменті бірнеше мүмкіндіктермен шектелді меншік өнімдер, бірақ бұл мақала біріншіге арналған әмбебап бейнеконференцияның аппараттық және бағдарламалық инфрақұрылымымен үйлесімді дауыспен камераны басқаруға арналған шешім.
Шешімдерді сипаттауға және мүмкіндіктерді көрсетуге көшпес бұрын, мен маңызды оқиғаны атап өткім келеді:
Мен Хабра қауымдастығына ұсынуды мақтан тұтамын жаңа хаб, бейнеконференция шешімдеріне (VCC) арналған. Енді бірлескен күш-жігердің арқасында (шахта және НЛО) Бейнеконференция Хабреде өз үйі бар, мен осы кең және өзекті тақырыпқа қатысатындардың барлығын жазылуға шақырамын жаңа хаб.

Камераны динамикке бағыттаудың екі сценарийі

Қазіргі уақытта бейнеконференция шешімдерінің интеграторлары баяндамашыға бағытталған тапсырманы жүзеге асырудың екі түрлі әдісін таңдайды:

  1. Автоматты - интеллектуалды
  2. Жартылай автоматты - бағдарламаланатын

Бірінші нұсқа - бұл Cisco, Polycom және басқа өндірушілердің шешімдері, біз оларды төменде қарастырамыз. Мұнда біз бейнеконференцияда сөйлейтін қатысушыға камераны бағыттауды толық автоматтандырумен айналысамыз. Аудио/бейне сигналдарды өңдеудің бірегей алгоритмдері камераға қажетті орынды дербес таңдауға мүмкіндік береді.

Екінші нұсқа - әртүрлі сыртқы басқару контроллерлеріне негізделген автоматтандыру жүйелері, біз оларды егжей-тегжейлі қарастырмаймыз, өйткені Мақала спикерлерді автоматты түрде қадағалауға арнайы арналған.
Камераны меңзеуді жүзеге асырудың екінші сценарийін жақтаушылар өте аз және оның себептері бар. Тәжірибелі интеграторлар Polycom және Cisco интеллектуалды шешімдері автоматтандырудың дұрыс жұмыс істеуі үшін тамаша жұмыс жағдайларын қажет ететінін түсінеді. Бірақ мұндай шарттарды қамтамасыз ету әрқашан мүмкін емес, сондықтан жүйенің жұмысы кейде камераны көрсету мәселесіне келесі шешіммен кепілдік береді:

1. Барлық қажетті алдын ала орнатулар (PTZ құрылғысының позициялары және оптикалық масштабтау коэффициенті) камера жадына (немесе кейде басқару контроллеріне) алдын ала қолмен енгізіледі. Әдетте, бұл жиналыс бөлмесінің жалпы жоспары және портреттік режимдегі әрбір конференцияға қатысушының көрінісі.

2. Әрі қарай, қажетті алдын ала орнатуды шақыруға арналған инициаторлар белгіленген орындарда орнатылады - бұл микрофон консольдері немесе радио түймелері, жалпы алғанда, басқару контроллерін өзі түсінетін сигналмен қамтамасыз ете алатын кез келген құрылғы.

3. Басқару контроллері әрбір инициатордың өзінің алдын ала орнатуы болатындай бағдарламаланған. Бөлменің жалпы жоспары - барлық бастамашылар өшірілген.
Нәтижесінде конгресс жүйесін, мысалы, басқару контроллерін пайдаланған кезде спикер өз сөзін бастамас бұрын өзінің жеке микрофон консолін іске қосады. Басқару жүйесі сақталған камера орнын лезде өңдейді.

Бұл сценарий мінсіз жұмыс істейді - жүйеге дауыс триангуляциясы мен бейне талдауын орындау қажет емес. Мен түймені басып, алдын ала орнату жұмыс істеді, ешқандай кідіріс немесе жалған позитивтер болмады.
Басқару және автоматтандыру жүйелері кейде бір емес, бірнеше бейнекамера орнатылған үлкен, күрделі бөлмелерде қолданылады. Кіші және орташа мәжіліс залдары үшін автоматты жүйелер өте қолайлы (егер сізде бюджет болса).
Әңгіменің негізін қалаушылардан бастайық.

Polycom EagleEye директоры

Камераны дауыспен бағыттау функциясы қол жетімді болды - SmartCam A12 Voice Tracking әмбебап шешіміБұл шешім бір кездері бейнеконференциялар саласында сенсация тудырды. Polycom EagleEye Director интеллектуалды камераны басқару саласындағы бірінші шешім болды. Шешім EagleEye Director негізгі блогынан және екі камерадан тұрады. Бұл бірінші іске асырудың ерекшелігі - бір камера тек спикерді жақыннан көруге, ал екіншісі - жиналыс бөлмесінің жалпы жоспарына бөлінген. Сонымен қатар, бас жоспар камерасын мәжіліс залындағы басқа жерде негізден толығымен бөлек орналастыруға болады - ол автоматты түрде бағыттау процесіне тікелей қатыспайды.
Жүйе келесідей жұмыс істейді:

  1. Бөлменің жалпы камерасы белсенді - бәрі үнсіз
  2. Динамик сөйлей бастайды - микрофон массиві дауысты қабылдайды, камера дауыс триангуляциясын қамтитын патенттелген технологияны қолдана отырып, дыбысқа қарай жылжиды. Жалпы камера әлі де белсенді
  3. Негізгі камера дыбыс көзін іздей бастады, бейне талдауды жүргізеді. Жүйе динамикті көз-мұрын-ауыз байланысы арқылы анықтайды, динамиктің суретін жақтайды және негізгі камерадан ағынды көрсетеді
  4. Динамик өзгереді. Микрофон массиві дауыстың басқа жерден шыққанын түсінеді. Бас жоспар қайтадан қосылады.
  5. Содан кейін 2-тармақтан бастап шеңберде
  6. Жаңа динамик алдыңғысымен бірге кадрда болса, жүйе белсенді ағынды жалпы түсірілімге өзгертпестен «ыстық» орналасуды өзгертуді жасайды.

Кемшілігі, менің ойымша, бір ғана негізгі камераның болуы. Бұл динамиктерді ауыстыру кезінде айтарлықтай кешіктіруге әкеледі. Әр жолы нұсқау сәтінде жүйе бөлменің жалпы жоспарын қосады - жанды әңгіме кезінде бұл жыпылықтау тітіркенуді бастайды.

Polycom EagleEye директоры II

Камераны дауыспен бағыттау функциясы қол жетімді болды - SmartCam A12 Voice Tracking әмбебап шешіміБұл жақында шығарылған Polycom шешімінің екінші нұсқасы. Жұмыс принципі өзгерістерге ұшырады және Cisco-ның шешіміне көбірек ұқсады. Енді екі PTZ камерасы да негізгі болып табылады және арналарды бір баяндамашыдан екіншісіне үздіксіз ауыстыруға қызмет етеді. Жиналыс бөлмесінің жалпы орналасуы енді EagleEye Director II негізгі блогының корпусына біріктірілген жеке камера арқылы түсірілген. Қандай да бір себептермен, бұл кең бұрышты камераның ағыны негізгі ағынның 1/9 бөлігін алып, экранның бұрышындағы қосымша терезеде көрсетіледі. Позициялау принципі бірдей - дауыс триангуляциясы және бейне ағынын талдау. Ал тығырықтар бірдей: жүйе сөйлейтін ауызды көрмесе, камера көздемейді. Және бұл жағдай жиі орын алуы мүмкін - сөйлеуші ​​бұрылып кетті, сөйлеуші ​​бүйірден бұрылды, сөйлеуші ​​- вентрилокист, сөйлеуші ​​аузын қолымен немесе құжатпен жауып тастады.
Екі жарнамалық бейнеролик те сауатты түсірілген – 2 адам кезекпен сөйлеп, логопедтің қабылдауында болғандай ауыздарын ашады. Бірақ мұндай тазартылған жағдайларда да өте маңызды кешігу бар. Бірақ кадр мінсіз - ыңғайлы портреттік түсірілім.

Cisco TelePresence SpeakerTrack 60

Камераны дауыспен бағыттау функциясы қол жетімді болды - SmartCam A12 Voice Tracking әмбебап шешіміБұл шешімді сипаттау үшін мен ресми брошюрадағы мәтінді қолданамын.
SpeakerTrack 60 қатысушылар арасында тікелей ауысу үшін бірегей қос камералық тәсілді қолданады. Бір камера белсенді баяндамашының жақыннан түсірілген суретін жылдам табады, ал екіншісі келесі баяндамашыны іздейді және көрсетеді. MultiSpeaker мүмкіндігі келесі динамик ағымдағы кадрда бұрыннан бар болса, қажетсіз ауысудың алдын алады.
Өкінішке орай, SpeakerTrack 60-ты өзім сынау мүмкіндігім болмады. Сондықтан, «далалықтан» пікірге және төмендегі демонстрациялық бейнені талдау нәтижелеріне сүйене отырып, қорытынды жасау керек. Жаңа баяндамашыға нұсқау кезінде мен 8 секундқа жуық кешіктіруді санадым. Бейнеге қарағанда, орташа кідіріс 2-3 секунд болды.

HUAWEI интеллектуалды бақылау бейне камерасы VPT300

Камераны дауыспен бағыттау функциясы қол жетімді болды - SmartCam A12 Voice Tracking әмбебап шешіміМен бұл шешімді Huawei компаниясынан кездейсоқ кездестірдім. Жүйе шамамен 9 мың доллар тұрады. Тек Huawei терминалдарымен жұмыс істейді. Әзірлеушілер өздерінің «трюктерін» қосты - егер бөлмеде басқа ешкім болмаса, бір экрандағы екі динамиктен бейне орналасуы. Сипаттамалар мен мәлімделген функционалдылық тұрғысынан бұл автоматты басқару жүйесінің өте қызықты нұсқасы. Бірақ, өкінішке орай, мен демонстрациялық материал таппадым. Бұл тақырыпта пайда болған жалғыз бейне шешімнің өңделген бейне шолуы болды, түпнұсқа дыбыссыз, музыкаға орнатылған. Осылайша, жүйенің сапасын бағалау мүмкін болмады. Осы себепті мен бұл опцияны қарастырмаймын.
Мен Huawei компаниясының Habré сайтында белсенді блогы бар екенін көремін - мүмкін әріптестер осы өнім туралы пайдалы ақпаратты жариялай алады.

Жаңа - әмбебап шешім SmartCam A12 дауысты бақылау

Камераны дауыспен бағыттау функциясы қол жетімді болды - SmartCam A12 Voice Tracking әмбебап шешіміSmartCam A12VT - моноблок, оның ішінде динамиктерді бақылауға арналған екі PTZ камерасы, бөлменің жалпы орналасуын талдауға арналған екі кірістірілген камера, сондай-ақ корпустың негізіне орнатылған микрофон массиві - көріп отырғаныңыздай, үлкен және үлкен емес. қарсыластар сияқты нәзік құрылымдар.
Мен жаңа өнімді сипаттауды бастамас бұрын, салыстыру үшін Cisco және Polycom шешімдерінің сипаттамалары мен мүмкіндіктерін жинаймын. SmartCam A12VT бар ұсыныстармен.

Polycom EagleEye директоры

  • Терминалсыз жүйенің бөлшек құны - $ 13K
  • EagleEye Director + RealPresence Group 500 шешімінің минималды құны — $ 19K
  • Орташа ауысу кідірісі 3 секунд
  • Дауыстық нұсқаулық + бейне талдауы
  • Сөйлеушінің бет-әлпетіне қойылатын жоғары талап – аузыңызды жасыра алмайсыз
  • Үшінші тарап жабдықтарымен үйлеспеушілік

Cisco TelePresence SpeakerTrack 60

  • Терминалсыз жүйенің бөлшек құны - $ 15,9K
  • TelePresence SpeakerTrack 60 + SX80 Codec шешімінің минималды құны - $ 30K
  • Орташа ауысу кідірісі 3 секунд
  • Дауыстық нұсқаулық + бейне талдауы
  • Сөйлеушінің бет-әлпетіне қойылатын талаптар – тексерген жоқ, ақпарат таппады
  • Үшінші тарап жабдықтарымен үйлеспеушілік

SmartCam A12 дауысты бақылау

  • Терминалсыз жүйенің бөлшек құны - $ 6,2K
  • Ең аз шешім құны SmartCam A12VT + Yealink VC880 - $ 10.8K
  • Ең аз шешім құны SmartCam A12VT+ бағдарламалық құрал терминалы - $ 7,7K
  • Орташа ауысу кідірісі 3 секунд
  • Дауыстық нұсқаулық + бейне талдауы
  • Сөйлеушінің бет-әлпетіне қойылатын талаптар – талаптар жоқ
  • Үшінші тарап үйлесімділігі - HDMI

Шешімнің екі негізгі және даусыз артықшылығы ретінде SmartCam A12 дауысты бақылау Мен табамын:

  1. Қосылу әмбебаптығы — HDMI арқылы жүйе аппараттық және бағдарламалық бейнеконференция терминалдық жүйелерімен біріктірілген
  2. Төмен баға — ұқсас функционалдығы бар A12VT жоғарыда сипатталған ұсыныстарға қарағанда бюджетте бірнеше есе қолжетімді.

Жүйенің қалай жұмыс істейтінін көрсету үшін біз бейне шолуды жаздык. Тапсырма функционалды емес, жарнамалық болды. Сондықтан бейнеде Polycom жарнамалық бейнесінің пафосы жоқ. Тұсаукесерді өткізу орны өкілдік емес, серіктесіміз IPMatika компаниясының зертханалық мәжіліс залы таңдалды.
Менің мақсатым жүйенің кемшіліктерін жасыру емес, керісінше, функционалдық мүмкіндіктердің тар жолын ашу, жүйені қателесуге мәжбүрлеу болды.

Менің ойымша, жүйе сынақтардан сәтті өтті. Мен мұны сенімді түрде айтамын, өйткені бұл мақаланы жазу кезінде шешім SmartCam A12 дауысты бақылау клиенттеріміздің ондаған нақты жиналыс бөлмелерін аралады. Автоматтандырудың ақаулары тек ұсынылған пайдалану ережелерін бұзу жағдайында байқалды. Атап айтқанда, жақын жердегі қатысушыларға ең аз қашықтық. Егер сіз камераға өте жақын, бір метрден аз отырсаңыз, микрофон массиві сізді тани алмайды және объектив сізді бақылай алмайды.

Камераны дауыспен бағыттау функциясы қол жетімді болды - SmartCam A12 Voice Tracking әмбебап шешімі

Қашықтықтан басқа тағы бір талап бар - камераның биіктігі.

Камераны дауыспен бағыттау функциясы қол жетімді болды - SmartCam A12 Voice Tracking әмбебап шешімі

Камера тым төмен орнатылған болса, дауысты орналастыруға қатысты мәселелер туындауы мүмкін. Теледидардың астындағы опция, өкінішке орай, жұмыс істемеді.
Бірақ жүйені дисплей құрылғысының үстіне орнату құрылғының жұмыс істеуінің тамаша тәсілі болып табылады. Камера сөресі жинақта берілген; стандартты ретінде тек қабырға аспасына қолдау көрсетіледі.

SmartCam A12 дауысты бақылау қалай жұмыс істейді

Негізгі PTZ линзаларының рөлдері бірдей - олардың міндеті - баяндамашыларды кезекпен қадағалау және жалпы жоспарды көрсету. Бөлмедегі жалпы суретті талдау және объектілерге дейінгі қашықтықты анықтау жүйенің негізіне біріктірілген екі камерадан алынған бейне ағындарды қолдану арқылы жүзеге асырылады. Бұл мүмкіндік динамикті 1-2 секундқа ауыстырған кезде линзаның реакция уақытын азайтуға мүмкіндік береді. Камера қатысушылардың арасында қысқа сөйлемдермен алмасса да, ыңғайлы ырғақпен ауыса алады.
Жүйе жұмысының бейне көрсетілімі функционалдылықты толығымен көрсетеді SmartCam A12VT. Бірақ, бейнені көрмегендер үшін автоматиканың жұмыс принципін сөзбен сипаттаймын:

  1. Бөлме бос: линзалардың бірі жалпы жоспарды көрсетеді, екіншісі дайын - адамдарды күтуде
  2. Адамдар бөлмеге кіріп, орындарына отырады: бос объектив екі экстремалды қатысушыны тауып, олардың айналасындағы кескінді жақтап, бөлменің бос бөлігін кесіп тастайды.
  3. Адамдар қозғалып жатқанда, линзалар бөлмедегі барлық адамдарды қадағалап, оларды кадрдың ортасында ұстайды
  4. Сөйлеуші ​​сөйлей бастайды: объектив белсенді, жалпы жоспарға бейімделген. Екіншісі динамикке бағытталған, содан кейін ғана хабар тарату режиміне өтеді
  5. Динамик өзгереді: бірінші динамикке реттелген объектив белсенді, ал екінші объектив кең кадрды түсіріп, жаңа динамикке реттеледі.
  6. Суретті бірінші динамиктен екіншісіне ауыстырған кезде бос объектив бөлменің жалпы жоспарына бірден реттеледі.
  7. Егер бәрі үнсіз болса, бос объектив ешбір кідіріссіз дайын жалпы жоспарды көрсетеді
  8. Динамик қайтадан өзгерсе, бос объектив оны іздеуге шығады

қорытынды

Менің ойымша, өткен жылы ISE және ISR-де ұсынылған бұл шешім жоғары технологияларды жақындатады - егер адамдарға болмаса, бизнеске. 400 мың рубльге мұндай «ойыншықты» аз адамдар үйге сатып алатыны анық, бірақ бизнес үшін, корпоративтік бейнеконференциялар үшін бұл камераны автоматты түрде бағыттау мәселесінің өте қолжетімді және ыңғайлы шешімі.
Әмбебаптығын ескере отырып SmartCam A12 дауысты бақылау, жүйені нөлден бастап шешім ретінде немесе бар бейнеконференция инфрақұрылымының функционалдығын кеңейту ретінде пайдалануға болады. Жоғарыда сипатталған өндірушілердің меншік жүйелерінен айырмашылығы, HDMI арқылы қосылу пайдаланушыға үлкен қадам болып табылады.

Тестілеуге көмектескен серіктестерге алғыс айтқым келеді.
Компания IPMatika — Yealink VC880 терминалы, жиналыс бөлмесі және Якушина Юра үшін.
Компания Smart-AV — жүйенің шешімі мен қамтамасыз етілуін бірінші және эксклюзивті қарау құқығы үшін SmartCam A12 дауысты бақылау тестілеу үшін.

Соңғы мақалада Онлайн жиналыс бөлмесінің дизайнері - бейнеконференцияның оңтайлы шешімін таңдау, веб-сайтты жылжыту ретінде vc4u.ru и VKS дизайнері жарияладык 10% жеңілдік бағасынан бастап анықтамалық кодтық сөз арқылы HABR 2019 жылдың жазының соңына дейін.

Жеңілдік келесі бөлімдердегі өнімдерге қолданылады:

Шешімге SmartCam A12 дауысты бақылау Мен бұрыннан бар 5% -ға қосымша 10% жеңілдік ұсынамын - 15 жылдың жазының соңына дейін барлығы 2019%.

Сауалнамадағы пікірлеріңіз бен жауаптарыңызды күтемін!

Назарларыңызға рахмет.
Құрметпен,
Кирилл Усиков (Усикофф)
басшысы
Бейнебақылау және бейнеконференция жүйелері
[электрондық пошта қорғалған]
stss.ru
vc4u.ru

Сауалнамаға тек тіркелген пайдаланушылар қатыса алады. Кіру, өтінемін.

SmartCam A12 дауысты бақылау қаншалықты пайдалы?

  • Соңында бағдарламалық және аппараттық терминалдарға арналған әмбебап шешім пайда болды!

  • Шешім жақсы, бірақ басқа нұсқалар бар (түсініктемелерде жазамын)

  • Жүйе әлсіз, ол Polycom және Cisco-ға жетпейді - мен түсініктемелерде неге 3 есе көп төлеу керек екенін жазамын!

  • Жиналыс бөлмесінде автоматты нұсқау кімге керек?

  • Жиналыс бөлмесінде PTZ камерасы кімге керек? — Мен веб-камера қостым, бәрі жақсы болды!

8 пайдаланушы дауыс берді. 5 пайдаланушы қалыс қалды.

Ақпарат көзі: www.habr.com

пікір қалдыру