Funksioni i synimit të kamerës me zë është bërë më i arritshëm - zgjidhja universale SmartCam A12 Voice Tracking

Funksioni i synimit të kamerës me zë është bërë më i arritshëm - zgjidhja universale SmartCam A12 Voice TrackingTema e gjurmimit të një pjesëmarrësi që flet në një video-konferencë ka marrë vrull gjatë viteve të fundit. Teknologjia ka bërë të mundur zbatimin e algoritmeve komplekse për përpunimin e informacionit audio/video në kohë reale, gjë që e shtyu Polycom-in, pothuajse 10 vjet më parë, të prezantojë zgjidhjen e parë të zakonshme në botë me gjurmimin inteligjent automatik të altoparlantëve. Për disa vite ata arritën të mbeten pronarët e vetëm të një zgjidhjeje të tillë, por Cisco nuk u desh të priste gjatë dhe solli në treg versionin e tyre të një sistemi inteligjent me dy kamera, i cili ishte një konkurrent i drejtë i zgjidhjes nga Polycom. Për shumë vite, ky segment i videokonferencave ishte i kufizuar nga aftësitë e disa pronësore produkteve, por ky artikull i dedikohet të parës universale zgjidhje për drejtimin e kamerës me zë, e përputhshme me infrastrukturën harduerike dhe softuerike të videokonferencave.
Para se të kaloj në përshkrimin e zgjidhjeve dhe demonstrimin e aftësive, dua të vërej një ngjarje të rëndësishme:
Jam i nderuar t'ia prezantoj komunitetit Habra qendër e re, dedikuar zgjidhjeve të videokonferencave (VCC). Tani, falë përpjekjeve të përbashkëta (e imja dhe UFO), Video konferenca ka shtëpinë e vet në Habré, dhe ftoj të gjithë të përfshirë në këtë temë të gjerë dhe aktuale të abonohen qendër e re.

Dy skenarë për të drejtuar kamerën drejt altoparlantit

Për momentin, integruesit e zgjidhjeve të video-konferencave zgjedhin vetë dy mënyra të ndryshme për të zbatuar detyrën e synimit të prezantuesit:

  1. Automatik - Inteligjent
  2. Gjysmë automatik - i programueshëm

Opsioni i parë është vetëm zgjidhje nga Cisco, Polycom dhe prodhues të tjerë; ne do t'i shqyrtojmë ato më poshtë. Këtu kemi të bëjmë me automatizimin e plotë të drejtimit të kamerës drejt pjesëmarrësit që flet në videokonferencë. Algoritmet unike për përpunimin e sinjaleve audio/video lejojnë kamerën të zgjedhë pozicionin e dëshiruar në mënyrë të pavarur.

Opsioni i dytë është sistemet e automatizimit të bazuara në kontrollues të ndryshëm të kontrollit të jashtëm; ne nuk do t'i shqyrtojmë ato në detaje, sepse Artikulli i kushtohet posaçërisht gjurmimit automatik të altoparlantëve.
Ka mjaft mbështetës të skenarit të dytë për zbatimin e drejtimit të kamerës, dhe ka arsye për këtë. Integruesit me përvojë e kuptojnë se zgjidhjet inteligjente nga Polycom dhe Cisco kërkojnë kushte ideale operimi që automatizimi të funksionojë siç duhet. Por nuk është gjithmonë e mundur të sigurohen kushte të tilla, kështu që funksionimi i sistemit ndonjëherë garantohet nga zgjidhja e mëposhtme për problemin e drejtimit të kamerës:

1. Të gjitha paracaktimet e nevojshme (pozicionet e pajisjes PTZ dhe faktori i zmadhimit optik) futen paraprakisht manualisht në kujtesën e kamerës (ose ndonjëherë në kontrolluesin e kontrollit). Si rregull, ky është një plan i përgjithshëm i dhomës së takimeve dhe një pamje e secilit pjesëmarrës të konferencës në modalitetin e portretit.

2. Tjetra, iniciatorët për thirrjen e paracaktimit të kërkuar janë instaluar në vendet e specifikuara - këto janë ose tastierë mikrofoni ose butona radio, në përgjithësi, çdo pajisje që mund t'i japë kontrolluesit të kontrollit një sinjal që ai e kupton.

3. Kontrolluesi i kontrollit është programuar në atë mënyrë që çdo iniciator të ketë paracaktimin e vet. Plani i përgjithshëm i dhomës - të gjithë iniciatorët janë të fikur.
Si rezultat, kur përdor një sistem kongresi, për shembull, dhe një kontrollues kontrolli, folësi, përpara se të fillojë fjalimin e tij, aktivizon konsolën e tij personale të mikrofonit. Sistemi i kontrollit përpunon në çast pozicionin e ruajtur të kamerës.

Ky skenar funksionon pa të meta - sistemi nuk ka nevojë të kryejë trekëndëshim zanor dhe analitikë video. Shtypa butonin dhe paravendosja funksionoi, pa vonesa ose rezultate false.
Sistemet e kontrollit dhe automatizimit përdoren në dhoma të mëdha komplekse, ku nganjëherë instalohen jo një, por disa kamera video. Epo, për dhomat e mbledhjeve të vogla dhe të mesme, sistemet automatike janë mjaft të përshtatshme (nëse keni buxhet).
Le të fillojmë me baballarët themelues.

Drejtori i Polycom EagleEye

Funksioni i synimit të kamerës me zë është bërë më i arritshëm - zgjidhja universale SmartCam A12 Voice TrackingKjo zgjidhje dikur krijoi një sensacion në fushën e videokonferencave. Polycom EagleEye Director ishte zgjidhja e parë në fushën e drejtimit inteligjent të kamerës. Zgjidhja përbëhet nga një njësi bazë EagleEye Director dhe dy kamera. E veçanta e zbatimit të parë është se një kamerë i është caktuar vetëm një pamje nga afër të folësit, dhe e dyta - për një plan të përgjithshëm të dhomës së mbledhjeve. Në të njëjtën kohë, kamera e planit të përgjithshëm mund të vendoset plotësisht veçmas nga baza në një vend tjetër në sallën e mbledhjeve - nuk përfshihet drejtpërdrejt në procesin e drejtimit automatik.
Sistemi funksionon si më poshtë:

  1. Kamera e përgjithshme e dhomës është aktive - të gjithë janë të heshtur
  2. Altoparlanti fillon të flasë - grupi i mikrofonit kap zërin, kamera lëviz drejt zërit duke përdorur teknologjinë e patentuar që përfshin trekëndëshimin e zërit. Kamera e përgjithshme është ende aktive
  3. Kamera kryesore sapo ka filluar të kërkojë burimin e zërit, duke kryer analiza video. Sistemi identifikon altoparlantin nga lidhja sy-hundë-gojë, kornizon foton e altoparlantit dhe shfaq transmetimin nga kamera kryesore
  4. Altoparlanti ndryshon. Grupimi i mikrofonit kupton që zëri vjen nga një vend tjetër. Plani i përgjithshëm ndizet përsëri.
  5. Dhe pastaj në një rreth, duke filluar nga pika 2
  6. Nëse altoparlanti i ri është në kornizë me atë të mëparshëm, sistemi bën një ndryshim pozicionimi "të nxehtë" pa ndryshuar rrjedhën aktive në pamjen e përgjithshme.

Ana negative, për mendimin tim, është prania e vetëm një kamere kryesore. Kjo rezulton në një vonesë të konsiderueshme gjatë ndërrimit të altoparlantëve. Dhe sa herë që në momentin e drejtimit, sistemi ndez planin e përgjithshëm të dhomës - gjatë një bisede të gjallë, kjo dridhje fillon të irritojë.

Drejtori i Polycom EagleEye II

Funksioni i synimit të kamerës me zë është bërë më i arritshëm - zgjidhja universale SmartCam A12 Voice TrackingKy është versioni i dytë i zgjidhjes nga Polycom, i cili u lëshua relativisht kohët e fundit. Parimi i funksionimit ka pësuar ndryshime dhe është bërë më shumë si një zgjidhje nga Cisco. Tani të dyja kamerat PTZ janë ato kryesore dhe shërbejnë për të ndërruar kanalet pa probleme nga një prezantues në tjetrin. Paraqitja e përgjithshme e dhomës së mbledhjeve është kapur tani nga një kamerë e veçantë e integruar në trupin e njësisë bazë EagleEye Director II. Për disa arsye, transmetimi nga kjo kamerë me kënd të gjerë shfaqet në një dritare shtesë në cep të ekranit, duke zënë 1/9 e rrymës kryesore. Parimi i pozicionimit është i njëjtë - trekëndëshimi i zërit dhe analiza e transmetimit të videos. Dhe pengesat janë të njëjta: nëse sistemi nuk e sheh gojën që flet, kamera nuk do të synojë. Dhe kjo situatë mund të ndodhë mjaft shpesh - folësi është larguar, folësi është kthyer anash, folësi është ventrilokuist, folësi e ka mbuluar gojën me dorë ose një dokument.
Të dy videot promovuese janë xhiruar me kompetencë - 2 persona flasin me radhë dhe hapin gojën sikur në një takim me një terapist të të folurit. Por edhe në kushte të tilla të rafinuara ka një vonesë shumë të konsiderueshme. Por inkuadrimi është i patëmetë - një shkrepje e rehatshme portreti.

Cisco TelePresence SpeakerTrack 60

Funksioni i synimit të kamerës me zë është bërë më i arritshëm - zgjidhja universale SmartCam A12 Voice TrackingPër të përshkruar këtë zgjidhje, unë do të përdor tekst nga broshura zyrtare.
SpeakerTrack 60 merr një qasje unike me kamera të dyfishtë për të kaluar shpejt drejtpërdrejt ndërmjet pjesëmarrësve. Njëra kamerë gjen shpejt një pamje nga afër të prezantuesit aktiv, ndërsa tjetra kërkon dhe shfaq prezantuesin tjetër. Veçoria MultiSpeaker parandalon ndërrimin e panevojshëm nëse altoparlanti tjetër është tashmë i pranishëm në kuadrin aktual.
Fatkeqësisht, nuk pata një shans për të testuar vetë SpeakerTrack 60. Prandaj, konkluzionet duhet të nxirren duke u bazuar në opinionin “nga terreni” dhe në bazë të rezultateve të analizës së videos demonstruese më poshtë. Kam numëruar një vonesë maksimale prej gati 8 sekondash kur tregoja një prezantues të ri. Vonesa mesatare ishte 2-3 sekonda, duke gjykuar nga video.

Kamera video inteligjente gjurmuese HUAWEI VPT300

Funksioni i synimit të kamerës me zë është bërë më i arritshëm - zgjidhja universale SmartCam A12 Voice TrackingE hasa këtë zgjidhje nga Huawei rastësisht. Sistemi kushton rreth 9 mijë dollarë. Punon vetëm me terminalet Huawei. Zhvilluesit shtuan "mashtrimin" e tyre - një paraqitje video nga dy altoparlantë në një ekran nëse nuk ka njeri tjetër në dhomë. Për sa i përket karakteristikave dhe funksionalitetit të deklaruar, ky është një version shumë interesant i sistemit të drejtimit automatik. Por, për fat të keq, nuk gjeta absolutisht asnjë material demo. Videoja e vetme që u shfaq në këtë temë ishte një përmbledhje video e redaktuar e zgjidhjes, pa zë origjinal, e vendosur në muzikë. Kështu, nuk ishte e mundur të vlerësohej cilësia e sistemit. Për këtë arsye, unë nuk do ta konsideroj këtë opsion.
Unë shoh që Huawei ka një blog aktiv në Habré - ndoshta kolegët do të jenë në gjendje të publikojnë disa informacione të dobishme për këtë produkt.

Zgjidhje e re - universale Ndjekja e zërit SmartCam A12

Funksioni i synimit të kamerës me zë është bërë më i arritshëm - zgjidhja universale SmartCam A12 Voice TrackingSmartCam A12VT - një monobllok, duke përfshirë dy kamera PTZ për gjurmimin e altoparlantëve, dy kamera të integruara për analizimin e paraqitjes së përgjithshme të dhomës, si dhe një grup mikrofoni të integruar në bazën e kutisë - siç mund ta shihni, nuk ka asnjë të rëndë dhe struktura të brishta si ato të kundërshtarëve.
Përpara se të filloj të përshkruaj produktin e ri, do të bashkoj karakteristikat dhe veçoritë e zgjidhjeve nga Cisco dhe Polycom në mënyrë që të mund të krahasoj SmartCam A12VT me ofertat ekzistuese.

Drejtori i Polycom EagleEye

  • Kostoja me pakicë e sistemit pa terminal - $ 13K
  • Kostoja minimale e zgjidhjes EagleEye Director + RealPresence Group 500 — $ 19K
  • Vonesa mesatare e ndërrimit 3 sekonda
  • Udhëzime me zë + analitikë video
  • Kërkesa të larta në fytyrën e folësit - nuk mund ta fshihni gojën
  • Mospërputhje me pajisjet e palëve të treta

Cisco TelePresence SpeakerTrack 60

  • Kostoja me pakicë e sistemit pa terminal - $ 15,9K
  • Kostoja minimale e zgjidhjes TelePresence SpeakerTrack 60 + SX80 Codec - $ 30K
  • Vonesa mesatare e ndërrimit 3 sekonda
  • Udhëzime me zë + analitikë video
  • Kërkesat për fytyrën e folësit - nuk kontrolluan, nuk gjetën informacion
  • Mospërputhje me pajisjet e palëve të treta

Ndjekja e zërit SmartCam A12

  • Kostoja me pakicë e sistemit pa terminal - $ 6,2K
  • Kostoja minimale e zgjidhjes SmartCam A12VT + Yealink VC880 - $ 10.8K
  • Kostoja minimale e zgjidhjes Terminali i softuerit SmartCam A12VT+ - $ 7,7K
  • Vonesa mesatare e ndërrimit 3 sekonda
  • Udhëzime me zë + analitikë video
  • Kërkesat për fytyrën e folësit - nuk ka kërkesa
  • Përputhshmëria e palëve të treta - HDMI

Si dy avantazhe kryesore dhe të pamohueshme të zgjidhjes Ndjekja e zërit SmartCam A12 Unë gjej:

  1. Shkathtësia e lidhjes — nëpërmjet HDMI, sistemi integrohet me sistemet e terminalit të konferencave video me harduer dhe softuer
  2. Kosto e ulet — me funksionalitet të ngjashëm, A12VT është shumë herë më i përballueshëm me një buxhet sesa propozimet e përshkruara më sipër.

Për të demonstruar se si funksionon sistemi, ne regjistruam një rishikim video. Detyra nuk ishte aq shumë reklamuese sa funksionale. Prandaj, videoja është e lirë nga patosi i një videoje promovuese të Polycom. Vendi i zgjedhur për prezantimin nuk ishte një zyrë përfaqësuese, por një sallë takimesh laboratorike e partnerit tonë, kompanisë IPMatika.
Qëllimi im nuk ishte të fshihja të metat e sistemit, por, përkundrazi, të ekspozoja pengesat e funksionalitetit, të detyroja sistemin të bënte gabime.

Sipas mendimit tim, sistemi i kaloi me sukses testet. E them këtë me besim sepse në momentin e shkrimit të këtij artikulli, zgjidhja Ndjekja e zërit SmartCam A12 vizituam një duzinë salla takimesh reale të klientëve tanë. Mosfunksionimet e automatizimit janë vërejtur ekskluzivisht në kushtet e shkeljes së rregullave të rekomanduara të funksionimit. Në veçanti, distanca minimale për pjesëmarrësit aty pranë. Nëse uleni shumë afër kamerës, më pak se një metër, grupi i mikrofonit nuk do t'ju njohë dhe lentja nuk do t'ju gjurmojë.

Funksioni i synimit të kamerës me zë është bërë më i arritshëm - zgjidhja universale SmartCam A12 Voice Tracking

Përveç distancës, ekziston një kërkesë tjetër - lartësia e kamerës.

Funksioni i synimit të kamerës me zë është bërë më i arritshëm - zgjidhja universale SmartCam A12 Voice Tracking

Nëse kamera është instaluar shumë poshtë, mund të shfaqen probleme me pozicionimin e zërit. Opsioni nën TV, për fat të keq, nuk funksionoi.
Por instalimi i sistemit mbi një pajisje ekrani është një mënyrë ideale për funksionimin e pajisjes. Përfshihet rafti i kamerës; vetëm montimi në mur mbështetet si standard.

Si funksionon ndjekja e zërit SmartCam A12

Lentet kryesore PTZ kanë role të barabarta - detyra e tyre është të gjurmojnë në mënyrë alternative prezantuesit dhe të shfaqin planin e përgjithshëm. Analiza e figurës së përgjithshme në dhomë dhe përcaktimi i distancës nga objektet kryhet duke përdorur transmetime video të marra nga dy kamera të integruara në bazën e sistemit. Kjo veçori ju lejon të zvogëloni kohën e reagimit të lentës kur ndryshoni altoparlantin në 1-2 sekonda. Kamera arrin të alternojë pjesëmarrësit me një ritëm të rehatshëm, edhe nëse ata shkëmbejnë fjali të shkurtra.
Një demonstrim video i funksionimit të sistemit pasqyron plotësisht funksionalitetin SmartCam A12VT. Por, për ata që nuk e kanë parë videon, unë do të përshkruaj me fjalë parimin e funksionimit të automatizimit:

  1. Dhoma është bosh: njëra nga lentet tregon planin e përgjithshëm, e dyta është gati - duke pritur për njerëzit
  2. Njerëzit hyjnë në dhomë dhe zënë vendet e tyre: lentja e lirë gjen dy pjesëmarrësit ekstremë dhe kornizon imazhin rreth tyre, duke prerë pjesën e zbrazët të dhomës
  3. Ndërsa njerëzit janë duke lëvizur, lentet ndjekin me radhë të gjithë në dhomë, duke i mbajtur ata në qendër të kornizës
  4. Altoparlanti fillon të flasë: thjerrëza është aktive, e përshtatur me planin e përgjithshëm. E dyta ka për qëllim altoparlantin dhe vetëm atëherë kalon në modalitetin e transmetimit
  5. Altoparlanti ndryshon: lentja e rregulluar me altoparlantin e parë është aktive, dhe lentja e dytë e lëshon pamjen e gjerë dhe përshtatet me altoparlantin e ri
  6. Në momentin e kalimit të figurës nga altoparlanti i parë në të dytin, lentja e lirë përshtatet menjëherë në planin e përgjithshëm të dhomës
  7. Nëse të gjithë heshtin, lentet e lira do të shfaqin një plan të përgjithshëm të gatshëm pa asnjë vonesë
  8. Nëse altoparlanti ndryshon përsëri, lentet e lira do të shkojnë në kërkim të tij

Përfundim

Sipas mendimit tim, kjo zgjidhje, e prezantuar në ISE dhe ISR vitin e kaluar, sjell teknologjinë e lartë më afër - nëse jo me njerëzit, atëherë me siguri me biznesin. Është e qartë se për 400 mijë rubla, pak njerëz do të blejnë një "lodër" të tillë për shtëpi, por për biznes, për video konferenca të korporatave, kjo është një zgjidhje shumë e përballueshme dhe e përshtatshme për problemin e synimit automatik të një kamere.
Duke pasur parasysh shkathtësinë Ndjekja e zërit SmartCam A12, sistemi mund të përdoret si një zgjidhje nga e para, ose si një zgjatje e funksionalitetit të një infrastrukture ekzistuese videokonferencash. Lidhja nëpërmjet HDMI është një hap i madh drejt përdoruesit, në kontrast me sistemet e pronarit të prodhuesve të përshkruar më sipër.

Dua të falënderoj partnerët që ndihmuan në testim.
kompania IPMatika — për terminalin Yealink VC880, dhomën e takimeve dhe Yakushina Yura.
kompania Smart-AV — për të drejtën e shqyrtimit të parë dhe ekskluziv të zgjidhjes dhe ofrimit të sistemit Ndjekja e zërit SmartCam A12 për testim.

Në artikullin e fundit Projektuesi i dhomës së takimeve në internet - zgjedhja e zgjidhjes optimale të konferencave video, si promovim i faqes në internet vc4u.ru и Dizajneri i VKS kemi njoftuar 10% zbritje nga çmimi në drejtoria me fjalë kodi HABR deri në fund të verës 2019.

Zbritja vlen për produktet në seksionet e mëposhtme:

Për vendimin Ndjekja e zërit SmartCam A12 Unë ofroj një zbritje shtesë prej 5% për 10% ekzistues - gjithsej 15% deri në fund të verës 2019.

Pres komentet dhe përgjigjet tuaja në sondazh!

Faleminderit për vëmendjen tuaj.
Sinqerisht,
Kirill Usikov (Usikoff)
Kreu i
Sistemet e video survejimit dhe videokonferencave
[email mbrojtur]
stss.ru
vc4u.ru

Vetëm përdoruesit e regjistruar mund të marrin pjesë në anketë. Hyni, te lutem

Sa i dobishëm është gjurmimi i zërit SmartCam A12?

  • Më në fund, është shfaqur një zgjidhje universale për terminalet softuerike dhe harduerike!

  • Zgjidhja është e mirë, por ka mundësi të tjera të disponueshme (do të shkruaj në komente)

  • Sistemi është i dobët, nuk arrin në Polycom dhe Cisco - Do të shkruaj në komente pse duhet të paguani 3 herë më shumë!

  • Kush ka nevojë gjithsesi për udhëzim automatik në një dhomë takimesh?

  • Kush ka nevojë për një aparat fotografik PTZ në një dhomë takimesh gjithsesi? — E lidha webkamerën dhe ishte mirë!

8 përdorues votuan. 5 përdorues abstenuan.

Burimi: www.habr.com

Shto një koment