Virkni myndavélamiðunar með rödd er orðin aðgengilegri - alhliða lausnin SmartCam A12 raddmæling

Virkni myndavélamiðunar með rödd er orðin aðgengilegri - alhliða lausnin SmartCam A12 raddmælingUmfjöllunarefnið um að fylgjast með tala þátttakanda í myndbandsráðstefnu hefur tekið miklum hraða á undanförnum árum. Tæknin hefur gert það mögulegt að innleiða flóknar reiknirit fyrir vinnslu hljóð-/myndupplýsinga í rauntíma, sem varð til þess að Polycom, fyrir tæpum 10 árum, kynnti fyrstu almennu lausn heimsins með snjöllum sjálfvirkum hátalararakningu. Í nokkur ár tókst þeim að vera áfram einir eigendur slíkrar lausnar, en Cisco þurfti ekki að bíða lengi og kom með sína útgáfu af snjöllu tveggja myndavélakerfi á markað, sem var sanngjarn keppinautur við lausnina frá Polycom. Í mörg ár var þessi hluti myndfunda takmarkaður af getu margra séreign vörur, en þessi grein er tileinkuð þeirri fyrstu alhliða lausn fyrir myndavélaleiðsögn með rödd, samhæf við bæði vélbúnaðar- og hugbúnaðarinnviði myndfunda.
Áður en ég held áfram að lýsa lausnum og sýna fram á getu vil ég benda á mikilvægan atburð:
Mér er heiður að kynna fyrir Habra samfélaginu ný miðstöð, tileinkað myndfundalausnum (VCC). Nú, þökk sé sameiginlegri viðleitni (mitt og UFO), Vídeó fundur á sitt eigið heimili á Habré og ég býð öllum sem koma að þessu umfangsmikla og líðandi efni að gerast áskrifendur að ný miðstöð.

Tvær aðstæður til að beina myndavélinni að hátalaranum

Í augnablikinu velja samþættingar myndfundalausna fyrir sig tvær mismunandi leiðir til að framkvæma verkefnið að miða á kynnirinn:

  1. Sjálfvirkt - Greindur
  2. Hálfsjálfvirkur - forritanlegur

Fyrsti kosturinn er bara lausnir frá Cisco, Polycom og öðrum framleiðendum; við munum íhuga þær hér að neðan. Hér erum við að fást við fulla sjálfvirkni sem felst í því að beina myndavélinni að tala þátttakanda í myndbandsráðstefnunni. Einstök reiknirit til að vinna úr hljóð-/myndmerki gera myndavélinni kleift að velja viðkomandi stöðu sjálfstætt.

Annar valkosturinn er sjálfvirknikerfi byggð á ýmsum ytri stýristýringum; við munum ekki íhuga þau í smáatriðum, vegna þess Greinin er sérstaklega helguð sjálfvirkri mælingu hátalara.
Það eru allmargir stuðningsmenn seinni atburðarásarinnar til að útfæra myndavélabendingu og það eru ástæður fyrir því. Reyndir samþættingaraðilar skilja að snjallar lausnir frá Polycom og Cisco krefjast kjöraðstæðna til að sjálfvirknin virki rétt. En það er ekki alltaf hægt að veita slíkar aðstæður, þannig að virkni kerfisins er stundum tryggð með eftirfarandi lausn á vandamálinu með að beina myndavélinni:

1. Allar nauðsynlegar forstillingar (staðsetningar PTZ tækisins og optískur aðdráttarstuðull) eru færðar inn handvirkt fyrirfram í minni myndavélarinnar (eða stundum í stjórnstýringuna). Að jafnaði er þetta almennt skipulag fundarherbergisins og útsýni yfir hvern ráðstefnuþátttakanda í andlitsmynd.

2. Næst eru frumkvöðlar til að hringja í nauðsynlega forstillingu uppsettir á tilgreindum stöðum - þetta eru annaðhvort hljóðnematölvur eða útvarpshnappar, almennt hvaða tæki sem getur veitt stjórnstýringunni merki sem hann skilur.

3. Stjórnstýringin er forrituð þannig að hver ræsibúnaður hefur sína forstillingu. Almenn áætlun um herbergið - slökkt er á öllum frumkvöðlum.
Þar af leiðandi, þegar þú notar þingkerfi, til dæmis, og stjórnstýringu, virkjar ræðumaðurinn, áður en hann byrjar ræðu sína, persónulegu hljóðnemaborðið sitt. Stýrikerfið vinnur samstundis úr vistuðu myndavélarstöðunni.

Þessi atburðarás virkar óaðfinnanlega - kerfið þarf ekki að framkvæma raddþríhyrning og myndbandsgreiningu. Ég ýtti á takkann og forstillingin virkaði, engar tafir eða rangar jákvæðar.
Stýri- og sjálfvirknikerfi eru notuð í stórum, flóknum herbergjum, þar sem stundum er ekki ein heldur nokkrar myndbandsupptökuvélar settar upp. Jæja, fyrir lítil og meðalstór fundarherbergi eru sjálfvirk kerfi mjög hentug (ef þú hefur fjárhagsáætlun).
Byrjum á stofnfeðrum.

Polycom EagleEye leikstjóri

Virkni myndavélamiðunar með rödd er orðin aðgengilegri - alhliða lausnin SmartCam A12 raddmælingÞessi lausn skapaði einu sinni tilfinningu á sviði myndbandsfunda. Polycom EagleEye Director var fyrsta lausnin á sviði snjallrar myndavélaleiðsagnar. Lausnin samanstendur af EagleEye Director grunneiningu og tveimur myndavélum. Sérkenni þessarar fyrstu útfærslu er að einni myndavélinni er aðeins úthlutað til nærmyndar af ræðumanni og sú seinni - til almennrar áætlunar um fundarherbergið. Á sama tíma er hægt að setja aðalskipulagsmyndavélina alveg aðskilda frá grunninum á öðrum stað í fundarherberginu - hún tekur ekki beint þátt í sjálfvirku leiðsögninni.
Kerfið virkar sem hér segir:

  1. Almenna herbergismyndavélin er virk - allir þegja
  2. Hátalarinn byrjar að tala - hljóðnemafylkingin tekur upp röddina, myndavélin færist í átt að hljóðinu með einkaleyfisbundinni tækni sem felur í sér raddþríhyrning. Almenna myndavélin er enn virk
  3. Aðalmyndavélin er rétt að byrja að leita að hljóðgjafanum og stundar myndbandsgreiningar. Kerfið auðkennir hátalarann ​​með auga-nef-munntengingunni, rammar inn mynd af hátalaranum og sýnir strauminn frá aðalmyndavélinni
  4. Hátalarinn breytist. Hljóðnemahópurinn skilur að röddin kemur frá öðrum stað. Kveikt er á aðalskipulagi aftur.
  5. Og svo í hring, byrjað á lið 2
  6. Ef nýi hátalarinn er í rammanum með þeim fyrri gerir kerfið „heita“ staðsetningarbreytingu án þess að breyta virku flæðinu í almenna skotið.

Gallinn, að mínu mati, er tilvist aðeins einnar aðalmyndavélar. Þetta veldur verulegri töf þegar skipt er um hátalara. Og í hvert sinn á því augnabliki sem bent er á það kveikir kerfið á almennu skipulagi herbergisins - í líflegu samtali byrjar þetta flökt að pirra.

Polycom EagleEye leikstjóri II

Virkni myndavélamiðunar með rödd er orðin aðgengilegri - alhliða lausnin SmartCam A12 raddmælingÞetta er önnur útgáfan af lausninni frá Polycom sem kom út tiltölulega nýlega. Reglan um rekstur hefur tekið breytingum og hefur orðið meira eins og lausn frá Cisco. Nú eru báðar PTZ myndavélarnar þær helstu og þjóna þeim til að skipta óaðfinnanlega um rásir frá einum kynningaraðila til annars. Almennt skipulag fundarherbergisins er nú tekið upp af sérstakri myndavél sem er innbyggð í meginhluta EagleEye Director II grunneiningarinnar. Einhverra hluta vegna er straumurinn frá þessari gleiðhornsmyndavél sýndur í viðbótarglugga í horni skjásins, sem tekur 1/9 af aðalstraumnum. Meginreglan um staðsetningu er sú sama - raddþríhyrningur og vídeóstraumsgreining. Og flöskuhálsarnir eru þeir sömu: Ef kerfið sér ekki munninn sem talar mun myndavélin ekki miða. Og þetta ástand getur gerst nokkuð oft - ræðumaðurinn hefur snúið sér frá, ræðumaðurinn hefur snúið sér til hliðar, ræðumaðurinn er slegill, ræðumaðurinn hefur hulið munninn með hendinni eða skjalinu.
Bæði kynningarmyndböndin voru tekin á hæfileikaríkan hátt - 2 einstaklingar tala til skiptis og opna munninn eins og við stefnumót hjá talþjálfa. En jafnvel við svo fágaðar aðstæður er mjög veruleg töf. En innrömmunin er óaðfinnanleg - þægileg andlitsmynd.

Cisco TelePresence SpeakerTrack 60

Virkni myndavélamiðunar með rödd er orðin aðgengilegri - alhliða lausnin SmartCam A12 raddmælingTil að lýsa þessari lausn mun ég nota texta úr opinbera bæklingnum.
SpeakerTrack 60 notar einstaka nálgun með tveimur myndavélum til að skipta fljótt beint á milli þátttakenda. Önnur myndavél finnur fljótt nærmynd af virkum kynningaraðila en hin leitar að og sýnir næsta kynningaraðila. MultiSpeaker eiginleikinn kemur í veg fyrir óþarfa skiptingu ef næsti hátalari er þegar til staðar í núverandi ramma.
Því miður hafði ég ekki tækifæri til að prófa SpeakerTrack 60 sjálfur. Þess vegna verður að draga ályktanir byggðar á álitinu „frá vettvangi“ og byggðar á niðurstöðum greiningar á sýnikennslumyndbandinu hér að neðan. Ég taldi hámarks seinkun upp á tæpar 8 sekúndur þegar ég benti á nýjan kynnir. Meðaltöfin var 2-3 sekúndur, af myndbandinu að dæma.

HUAWEI Intelligent Rekja myndbandsmyndavél VPT300

Virkni myndavélamiðunar með rödd er orðin aðgengilegri - alhliða lausnin SmartCam A12 raddmælingÉg rakst á þessa lausn frá Huawei óvart. Kerfið kostar um $9K. Virkar aðeins með Huawei skautunum. Hönnuðir bættu við sínu eigin „bragði“ - myndbandsuppsetningu frá tveimur hátölurum á einum skjá ef enginn annar er í herberginu. Hvað varðar eiginleika og yfirlýsta virkni er þetta mjög áhugaverð útgáfa af sjálfvirka leiðsögukerfinu. En því miður fann ég nákvæmlega ekkert kynningarefni. Eina myndbandið sem birtist um þetta efni var ritstýrt myndbandsúttekt á lausninni, án upprunalegs hljóðs, stillt á tónlist. Þannig var ekki hægt að leggja mat á gæði kerfisins. Af þessum sökum mun ég ekki íhuga þennan kost.
Ég sé að Huawei er með virkt blogg á Habré - kannski munu samstarfsmenn geta birt gagnlegar upplýsingar um þessa vöru.

Ný - alhliða lausn SmartCam A12 raddmæling

Virkni myndavélamiðunar með rödd er orðin aðgengilegri - alhliða lausnin SmartCam A12 raddmælingSmartCam A12VT - einblokk, þar á meðal tvær PTZ myndavélar til að rekja hátalara, tvær innbyggðar myndavélar til að greina almennt skipulag herbergisins, auk hljóðnema sem er innbyggður í botninn á hulstrinu - eins og þú sérð eru engin fyrirferðarmikil og brothætt mannvirki eins og andstæðinga.
Áður en ég byrja að lýsa nýju vörunni mun ég setja saman eiginleika og eiginleika lausna frá Cisco og Polycom svo ég geti borið saman SmartCam A12VT með fyrirliggjandi tilboðum.

Polycom EagleEye leikstjóri

  • Smásölukostnaður kerfisins án útstöðvar - $ 13K
  • Lágmarkskostnaður við EagleEye Director + RealPresence Group 500 lausn — $ 19K
  • Meðaltöf 3 sekúndur
  • Raddleiðsögn + myndbandsgreining
  • Miklar kröfur til andlits hátalarans - þú getur ekki falið munninn
  • Ósamrýmanleiki við búnað þriðja aðila

Cisco TelePresence SpeakerTrack 60

  • Smásölukostnaður kerfisins án útstöðvar - $ 15,9K
  • Lágmarkskostnaður við TelePresence SpeakerTrack 60 + SX80 merkjamál lausn - $ 30K
  • Meðaltöf 3 sekúndur
  • Raddleiðsögn + myndbandsgreining
  • Kröfur um andlit ræðumanns - athugaði ekki, fann ekki upplýsingar
  • Ósamrýmanleiki við búnað þriðja aðila

SmartCam A12 raddmæling

  • Smásölukostnaður kerfisins án útstöðvar - $ 6,2K
  • Lágmarkskostnaður við lausn SmartCam A12VT + Yealink VC880 - $ 10.8K
  • Lágmarkskostnaður við lausn SmartCam A12VT+ hugbúnaðarútstöð - $ 7,7K
  • Meðaltöf 3 sekúndur
  • Raddleiðsögn + myndbandsgreining
  • Kröfur um andlit hátalarans - engar kröfur
  • Samhæfni þriðja aðila - HDMI

Sem tveir helstu og óneitanlega kostir lausnarinnar SmartCam A12 raddmæling Mér finnst:

  1. Fjölhæfni tengimöguleika — í gegnum HDMI samþættist kerfið bæði vélbúnaðar- og hugbúnaðarmyndfundakerfi
  2. Lítill kostnaður — með svipaða virkni er A12VT margfalt hagkvæmara á kostnaðarhámarki en tillögurnar sem lýst er hér að ofan.

Til að sýna fram á hvernig kerfið virkar tókum við upp myndbandsskoðun. Verkefnið var ekki svo mikið að auglýsa heldur hagnýtt. Þess vegna er myndbandið laust við andúð Polycom kynningarmyndbands. Vettvangurinn sem valinn var fyrir kynninguna var ekki umboðsskrifstofa, heldur fundarherbergi á rannsóknarstofu samstarfsaðila okkar, IPMatika fyrirtækisins.
Markmið mitt var ekki að fela galla kerfisins, heldur þvert á móti að afhjúpa flöskuhálsa virkninnar, þvinga kerfið til að gera mistök.

Að mínu mati stóðst kerfið prófin með góðum árangri. Ég segi þetta með sjálfstrausti vegna þess að þegar ég skrifa þessa grein er lausnin SmartCam A12 raddmæling heimsótti tugi alvöru fundarherbergja viðskiptavina okkar. Bilanir í sjálfvirkninni komu eingöngu fram við brot á ráðlögðum rekstrarreglum. Einkum lágmarksfjarlægð til nálægra þátttakenda. Ef þú situr mjög nálægt myndavélinni, innan við metra, mun hljóðnemahópurinn ekki þekkja þig og linsan mun ekki geta fylgst með þér.

Virkni myndavélamiðunar með rödd er orðin aðgengilegri - alhliða lausnin SmartCam A12 raddmæling

Til viðbótar við fjarlægðina er önnur krafa - hæð myndavélarinnar.

Virkni myndavélamiðunar með rödd er orðin aðgengilegri - alhliða lausnin SmartCam A12 raddmæling

Ef myndavélin er sett of lágt geta vandamál komið upp með raddstaðsetningu. Valkosturinn undir sjónvarpinu virkaði því miður ekki.
En að setja upp kerfið fyrir ofan skjátæki er tilvalin leið fyrir tækið til að starfa. Myndavélahillan fylgir; aðeins veggfestingin er studd sem staðalbúnaður.

Hvernig SmartCam A12 raddmæling virkar

Helstu PTZ linsurnar gegna jöfnu hlutverki - verkefni þeirra er að fylgjast með kynningum til skiptis og sýna heildaráætlunina. Greining á heildarmyndinni í herberginu og ákvörðun á fjarlægð til hluta fer fram með því að nota myndbandsstrauma sem berast frá tveimur myndavélum sem eru innbyggðar í grunn kerfisins. Þessi eiginleiki gerir þér kleift að minnka viðbragðstíma linsunnar þegar skipt er um hátalara í 1-2 sekúndur. Myndavélin nær að skipta á milli þátttakenda á þægilegum takti, jafnvel þótt þeir skiptust á stuttum setningum.
Myndbandssýning á virkni kerfisins endurspeglar virknina að fullu SmartCam A12VT. En fyrir þá sem hafa ekki horft á myndbandið mun ég lýsa í orðum meginreglunni um rekstur sjálfvirkninnar:

  1. Herbergið er tómt: ein af linsunum sýnir almenna áætlunina, önnur er tilbúin - bíður eftir fólki
  2. Fólk fer inn í herbergið og sest í sæti sín: lausa linsan finnur hina öfgafullu þátttakendurna tvo og rammar inn myndina í kringum þá og sker tóman hluta herbergisins af
  3. Á meðan fólk er á hreyfingu skiptast linsurnar á að fylgjast með öllum í herberginu og halda þeim í miðju rammans
  4. Ræðumaðurinn byrjar að tala: linsan er virk, aðlöguð að almennu skipulagi. Sá síðari er beint að hátalaranum og fer þá fyrst í útsendingarham
  5. Hátalarinn breytist: linsan sem er stillt á fyrsta hátalarann ​​er virk og önnur linsan sleppir víðmyndinni og aðlagast nýja hátalaranum
  6. Á því augnabliki sem skipt er um mynd frá fyrsta hátalara yfir í þann seinni, er lausa linsan samstundis stillt að almennu skipulagi herbergisins
  7. Ef allir þegja mun ókeypis linsan sýna tilbúna almenna áætlun án tafa
  8. Ef hátalarinn breytist aftur mun lausa linsan fara í leit að honum

Ályktun

Að mínu mati færir þessi lausn, sem kynnt var á ISE og ISR á síðasta ári, hátækni nær - ef ekki fólkinu, þá að sjálfsögðu viðskiptalífinu. Það er ljóst að fyrir 400 þúsund rúblur munu fáir kaupa slíkt „leikfang“ fyrir heimilið, en fyrir fyrirtæki, fyrir myndbandsráðstefnur fyrirtækja, er þetta mjög hagkvæm og þægileg lausn á vandamálinu við sjálfvirka miðun myndavélar.
Miðað við fjölhæfnina SmartCam A12 raddmæling, kerfið er hægt að nota sem lausn frá grunni, eða sem framlengingu á virkni núverandi myndfundauppbyggingar. Tenging í gegnum HDMI er stórt skref í átt að notandanum, öfugt við sérkerfi framangreindra framleiðenda.

Ég vil þakka samstarfsaðilum sem aðstoðuðu við prófanir.
fyrirtæki IPMatika — fyrir Yealink VC880 flugstöðina, fundarherbergi og Yakushina Yura.
fyrirtæki Smart-AV — um rétt til fyrstu endurskoðunar á lausn og útvegun kerfisins SmartCam A12 raddmæling til prófunar.

Í síðustu grein Hönnuður fundarherbergja á netinu - val á bestu myndfundalausninni, sem vefsíðukynning vc4u.ru и VKS hönnuður við tilkynntum 10% afsláttur frá verði inn Skrá með kóðaorði HABR til loka sumars 2019.

Afslátturinn gildir fyrir vörur í eftirfarandi hlutum:

Að ákvörðuninni SmartCam A12 raddmæling Ég býð 5% afslátt til viðbótar við 10% sem þegar eru til - samtals 15% til sumarloka 2019.

Ég bíð spenntur eftir athugasemdum þínum og svörum í könnuninni!

Þakka þér fyrir athygli þína.
Með kveðju,
Kirill Usikov (Usikoff)
Yfirmaður
Myndbandseftirlit og myndfundakerfi
[netvarið]
stss.ru
vc4u.ru

Aðeins skráðir notendur geta tekið þátt í könnuninni. Skráðu þig inn, takk.

Hversu gagnlegt er SmartCam A12 raddmæling?

  • Loksins er komin fram alhliða lausn fyrir hugbúnaðar- og vélbúnaðarútstöðvar!

  • Lausnin er góð, en það eru aðrir valkostir í boði (ég mun skrifa í athugasemdum)

  • Kerfið er veikt, það nær ekki til Polycom og Cisco - ég skal skrifa í athugasemdirnar hvers vegna þú ættir að borga þrisvar sinnum meira!

  • Hver þarf sjálfvirka leiðsögn í fundarherbergi?

  • Hver þarf PTZ myndavél í fundarherbergi? — Ég tengdi vefmyndavélina og það var í lagi!

8 notendur kusu. 5 notendur sátu hjá.

Heimild: www.habr.com

Bæta við athugasemd