Sesle kamera hedefleme işlevi daha erişilebilir hale geldi - evrensel çözüm SmartCam A12 Ses Takibi

Sesle kamera hedefleme işlevi daha erişilebilir hale geldi - evrensel çözüm SmartCam A12 Ses TakibiVideo konferansta konuşan bir katılımcıyı takip etme konusu son birkaç yılda ivme kazandı. Teknoloji, ses/video bilgilerinin gerçek zamanlı olarak işlenmesi için karmaşık algoritmaların uygulanmasını mümkün kıldı ve bu da Polycom'un neredeyse 10 yıl önce akıllı otomatik hoparlör izleme özelliğine sahip dünyanın ilk ana akım çözümünü tanıtmasına neden oldu. Birkaç yıl boyunca böyle bir çözümün tek sahibi olmayı başardılar, ancak Cisco'nun uzun süre beklemesi gerekmedi ve Polycom'un çözümüne adil bir rakip olan akıllı iki kameralı sistemin kendi versiyonunu pazara sundu. Uzun yıllar boyunca, video konferansın bu segmenti çeşitli cihazların yetenekleriyle sınırlıydı. tescilli ürünler, ancak bu makale ilkine adanmıştır evrensel Video konferans için hem donanım hem de yazılım altyapısıyla uyumlu, sesli kamera yönlendirme çözümü.
Çözümleri açıklamaya ve yetenekleri göstermeye geçmeden önce önemli bir olaya dikkat çekmek istiyorum:
Habra topluluğuna sunmaktan onur duyuyorum yeni merkez, video konferans çözümlerine (VCC) adanmıştır. Şimdi ortak çabalar sayesinde (mayın ve UFO), Video konferans Habré'de kendi evi var ve bu kapsamlı ve güncel konuyla ilgilenen herkesi abone olmaya davet ediyorum. yeni merkez.

Kamerayı hoparlöre doğrultmak için iki senaryo

Şu anda, video konferans çözümlerinin entegratörleri, sunum yapan kişiyi hedefleme görevini uygulamak için kendileri için iki farklı yol seçmektedir:

  1. Otomatik - Akıllı
  2. Yarı otomatik - programlanabilir

İlk seçenek yalnızca Cisco, Polycom ve diğer üreticilerin çözümleridir; bunları aşağıda ele alacağız. Burada kameranın video konferansta konuşan katılımcıya doğrultulmasının tam otomasyonuyla ilgileniyoruz. Ses/video sinyallerini işlemeye yönelik benzersiz algoritmalar, kameranın istenen konumu bağımsız olarak seçmesine olanak tanır.

İkinci seçenek, çeşitli harici kontrol kontrolörlerine dayanan otomasyon sistemleridir; çünkü bunları ayrıntılı olarak ele almayacağız; Makale özellikle konuşmacıların otomatik takibine ayrılmıştır.
Kamerayla işaretlemeyi uygulamaya yönelik ikinci senaryonun pek çok destekçisi var ve bunun nedenleri var. Deneyimli entegratörler, Polycom ve Cisco'nun akıllı çözümlerinin, otomasyonun düzgün çalışması için ideal çalışma koşullarına ihtiyaç duyduğunu biliyor. Ancak bu tür koşulları sağlamak her zaman mümkün olmadığından sistemin çalışması bazen kamera işaretleme sorununa yönelik aşağıdaki çözümle garanti altına alınır:

1. Gerekli tüm ön ayarlar (PTZ cihazının konumları ve optik yakınlaştırma faktörü), kameranın belleğine (veya bazen kontrol denetleyicisine) önceden manuel olarak girilir. Kural olarak bu, toplantı odasının genel bir planıdır ve her konferans katılımcısının portre modundaki görünümüdür.

2. Daha sonra, gerekli ön ayarı çağırmak için başlatıcılar belirtilen yerlere kurulur - bunlar ya mikrofon konsolları ya da radyo düğmeleridir, genel olarak kontrol denetleyicisine anlayacağı bir sinyal sağlayabilen herhangi bir cihazdır.

3. Kontrol kontrolörü, her başlatıcının kendi ön ayarına sahip olacağı şekilde programlanmıştır. Odanın genel planı - tüm başlatıcılar kapalı.
Sonuç olarak, örneğin bir kongre sistemi ve bir kontrol kumandası kullanıldığında, konuşmacı konuşmasına başlamadan önce kişisel mikrofon konsolunu etkinleştirir. Kontrol sistemi kaydedilen kamera konumunu anında işler.

Bu senaryo kusursuz bir şekilde çalışıyor; sistemin ses üçgenlemesi ve video analizi yapmasına gerek yok. Düğmeye bastım ve ön ayar çalıştı, gecikme veya hatalı pozitif sonuç yok.
Kontrol ve otomasyon sistemleri, bazen bir değil birden fazla video kameranın kurulu olduğu büyük, karmaşık odalarda kullanılır. Küçük ve orta büyüklükteki toplantı odaları için otomatik sistemler oldukça uygundur (eğer bütçeniz varsa).
Kurucu babalarla başlayalım.

Polycom EagleEye Direktörü

Sesle kamera hedefleme işlevi daha erişilebilir hale geldi - evrensel çözüm SmartCam A12 Ses TakibiBu çözüm bir zamanlar video konferans alanında sansasyon yaratmıştı. Polycom EagleEye Director, akıllı kamera rehberliği alanında ilk çözümdü. Çözüm bir EagleEye Director ana ünitesinden ve iki kameradan oluşur. Bu ilk uygulamanın özelliği, bir kameranın yalnızca konuşmacının yakın görünümüne, ikincisinin ise toplantı odasının genel planına tahsis edilmiş olmasıdır. Aynı zamanda genel plan kamerası, toplantı odasındaki başka bir yere tabandan tamamen ayrı olarak yerleştirilebilir - otomatik yönlendirme sürecine doğrudan dahil değildir.
Sistem şu şekilde çalışır:

  1. Genel oda kamerası aktif, herkes sessiz
  2. Konuşmacı konuşmaya başlar; mikrofon dizisi sesi alır, kamera ses üçgenlemeyi içeren patentli teknolojiyi kullanarak sese doğru hareket eder. Genel kamera hala aktif
  3. Ana kamera, video analizi yaparak ses kaynağını aramaya yeni başlıyor. Sistem konuşmacıyı göz-burun-ağız bağlantısıyla tanımlar, konuşmacının resmini çerçeveler ve ana kameradan gelen akışı görüntüler.
  4. Konuşmacı değişir. Mikrofon dizisi sesin başka bir yerden geldiğini anlar. Genel plan yeniden devreye girer.
  5. Ve sonra 2. noktadan başlayarak bir daire çizin
  6. Yeni hoparlör öncekiyle aynı karedeyse sistem, genel çekime yönelik aktif akışı değiştirmeden "sıcak" bir konumlandırma değişikliği yapar.

Bana göre dezavantajı tek bir ana kameranın bulunması. Bu, hoparlörleri değiştirirken önemli bir gecikmeye neden olur. Ve her işaret etme anında sistem odanın genel planını açar - canlı bir konuşma sırasında bu titreme rahatsız etmeye başlar.

Polycom EagleEye Direktör II

Sesle kamera hedefleme işlevi daha erişilebilir hale geldi - evrensel çözüm SmartCam A12 Ses TakibiBu, Polycom'un nispeten yakın zamanda piyasaya sürülen çözümünün ikinci versiyonudur. Çalışma prensibi değişikliklere uğradı ve daha çok Cisco'nun bir çözümü haline geldi. Artık her iki PTZ kamera da ana kameralar ve kanalları bir sunucudan diğerine sorunsuz bir şekilde değiştirmeye hizmet ediyor. Toplantı odasının genel düzeni artık EagleEye Director II ana ünitesinin gövdesine entegre edilmiş ayrı bir kamera tarafından yakalanıyor. Bazı nedenlerden dolayı, bu geniş açılı kameradan gelen akış, ekranın köşesinde, ana akışın 1/9'unu kaplayan ek bir pencerede görüntüleniyor. Konumlandırma ilkesi aynıdır; ses üçgenleme ve video akışı analizi. Darboğazlar da aynı: Sistem konuşan ağzı göremezse kamera nişan almayacaktır. Ve bu durum oldukça sık meydana gelebilir - konuşmacı arkasını dönmüştür, konuşmacı yana dönmüştür, konuşmacı vantriloktur, konuşmacı ağzını eliyle veya bir belgeyle kapatmıştır.
Her iki tanıtım videosu da yetkin bir şekilde çekildi - 2 kişi sırayla konuşuyor ve sanki bir konuşma terapistiyle randevudaymış gibi ağızlarını açıyor. Ancak bu kadar hassas koşullarda bile çok önemli bir gecikme var. Ancak kadraj kusursuz; rahat bir portre çekimi.

Cisco TelePresence Hoparlör Parçası 60

Sesle kamera hedefleme işlevi daha erişilebilir hale geldi - evrensel çözüm SmartCam A12 Ses TakibiBu çözümü açıklamak için resmi broşürdeki metni kullanacağım.
SpeakerTrack 60, katılımcılar arasında hızla doğrudan geçiş yapmak için benzersiz bir çift kamera yaklaşımını benimser. Bir kamera, aktif sunum yapan kişinin yakın çekimini hızlı bir şekilde bulurken, diğeri bir sonraki sunum yapan kişiyi arar ve görüntüler. Çoklu Hoparlör özelliği, bir sonraki hoparlörün geçerli karede zaten mevcut olması durumunda gereksiz geçiş yapılmasını önler.
Ne yazık ki SpeakerTrack 60'ı kendim test etme şansım olmadı. Bu nedenle, "sahadan gelen" görüşlere ve aşağıdaki tanıtım videosunun analiz sonuçlarına dayanarak sonuçlar çıkarılmalıdır. Yeni bir sunum yapan kişiyi işaret ederken neredeyse 8 saniyelik maksimum gecikme saydım. Videoya bakılırsa ortalama gecikme 2-3 saniyeydi.

HUAWEI Akıllı Takip Video Kamerası VPT300

Sesle kamera hedefleme işlevi daha erişilebilir hale geldi - evrensel çözüm SmartCam A12 Ses TakibiHuawei'nin bu çözümüne tesadüfen rastladım. Sistemin maliyeti yaklaşık 9 bin dolar. Yalnızca Huawei terminalleriyle çalışır. Geliştiriciler kendi "numaralarını" eklediler - odada başka kimse yoksa iki hoparlörden tek ekranda video düzeni. Özellikler ve beyan edilen işlevsellik açısından bu, otomatik yönlendirme sisteminin çok ilginç bir versiyonudur. Ancak ne yazık ki kesinlikle hiçbir demo materyali bulamadım. Bu konuyla ilgili ortaya çıkan tek video, çözümün orijinal ses olmadan müzikle ayarlanmış düzenlenmiş video incelemesiydi. Bu nedenle sistemin kalitesini değerlendirmek mümkün olmadı. Bu nedenle bu seçeneği dikkate almayacağım.
Huawei'nin Habré'de aktif bir blogu olduğunu görüyorum; belki meslektaşları bu ürün hakkında bazı yararlı bilgiler yayınlayabilir.

Yeni - evrensel çözüm SmartCam A12 Ses Takibi

Sesle kamera hedefleme işlevi daha erişilebilir hale geldi - evrensel çözüm SmartCam A12 Ses TakibiSmartCam A12VT - hoparlörleri izlemek için iki PTZ kamera, odanın genel düzenini analiz etmek için iki yerleşik kamera ve kasanın tabanına yerleştirilmiş bir mikrofon dizisi içeren bir monoblok - görebileceğiniz gibi, hantal ve rakiplerinki gibi kırılgan yapılar.
Yeni ürünü anlatmaya başlamadan önce Cisco ve Polycom çözümlerinin özelliklerini ve özelliklerini bir araya getirip karşılaştıracağım. SmartCam A12VT Mevcut tekliflerle.

Polycom EagleEye Direktörü

  • Terminalsiz sistemin perakende maliyeti - $ 13K
  • EagleEye Director + RealPresence Group 500 çözümünün minimum maliyeti — $ 19K
  • Ortalama anahtarlama gecikmesi 3 saniye
  • Sesli yönlendirme + video analizi
  • Konuşmacının yüzünde yüksek beklentiler var; ağzınızı gizleyemezsiniz
  • Üçüncü taraf ekipmanlarıyla uyumsuzluk

Cisco TelePresence Hoparlör Parçası 60

  • Terminalsiz sistemin perakende maliyeti - $ 15,9K
  • TelePresence SpeakerTrack 60 + SX80 Codec çözümünün minimum maliyeti - $ 30K
  • Ortalama anahtarlama gecikmesi 3 saniye
  • Sesli yönlendirme + video analizi
  • Konuşmacının yüzüne ilişkin gereksinimler - kontrol etmedi, bilgi bulamadı
  • Üçüncü taraf ekipmanlarıyla uyumsuzluk

SmartCam A12 Ses Takibi

  • Terminalsiz sistemin perakende maliyeti - $ 6,2K
  • Minimum çözüm maliyeti SmartCam A12VT + Yealink VC880 - $ 10.8K
  • Minimum çözüm maliyeti SmartCam A12VT+ yazılım terminali - $ 7,7K
  • Ortalama anahtarlama gecikmesi 3 saniye
  • Sesli yönlendirme + video analizi
  • Konuşmacının yüzüne ilişkin gereksinimler - gereksinim yok
  • Üçüncü Taraf Uyumluluğu - HDMI

Çözümün iki ana ve yadsınamaz avantajı olarak SmartCam A12 Ses Takibi Buldum:

  1. Bağlantı çok yönlülüğü — HDMI aracılığıyla sistem hem donanım hem de yazılım video konferans terminal sistemleriyle entegre olur
  2. Düşük maliyetli - Benzer işlevselliğe sahip A12VT, bütçe açısından yukarıda açıklanan tekliflerden kat kat daha uygun maliyetlidir.

Sistemin nasıl çalıştığını göstermek için bir video incelemesi kaydettik. Görev, işlevsel olduğu kadar reklam yapmak değildi. Bu nedenle video, Polycom tanıtım videosunun dokunaklılığından yoksundur. Sunum için seçilen mekan temsilcilik ofisi değil, ortağımız IPMatika şirketinin laboratuvar toplantı odasıydı.
Amacım sistemin kusurlarını gizlemek değil, tam tersine işlevselliğin darboğazlarını ortaya çıkarmak, sistemi hata yapmaya zorlamaktı.

Bana göre sistem testleri başarıyla geçti. Bunu güvenle söylüyorum çünkü bu makaleyi yazdığım sırada çözüm SmartCam A12 Ses Takibi müşterilerimizin bir düzine gerçek toplantı odasını ziyaret ettik. Otomasyonun arızaları yalnızca önerilen çalışma kurallarının ihlal edildiği durumlarda gözlemlendi. Özellikle yakındaki katılımcılara olan minimum mesafe. Kameraya çok yakın (bir metreden daha yakın) oturursanız mikrofon dizisi sizi tanıyamayacak ve lens de sizi izleyemeyecektir.

Sesle kamera hedefleme işlevi daha erişilebilir hale geldi - evrensel çözüm SmartCam A12 Ses Takibi

Mesafeye ek olarak başka bir gereksinim daha var - kameranın yüksekliği.

Sesle kamera hedefleme işlevi daha erişilebilir hale geldi - evrensel çözüm SmartCam A12 Ses Takibi

Kamera çok alçakta kurulursa ses konumlandırmayla ilgili sorunlar ortaya çıkabilir. TV'nin altındaki seçenek maalesef işe yaramadı.
Ancak sistemi bir görüntüleme cihazının üzerine kurmak cihazın çalışması için ideal bir yoldur. Kamera rafı dahildir; yalnızca duvara montaj parçası standart olarak desteklenir.

SmartCam A12 Ses Takibi nasıl çalışır?

Ana PTZ lensleri eşit rollere sahiptir; görevleri dönüşümlü olarak sunum yapanları izlemek ve genel planı görüntülemektir. Odadaki genel resmin analizi ve nesnelere olan mesafenin belirlenmesi, sistemin tabanına entegre edilmiş iki kameradan alınan video akışları kullanılarak gerçekleştirilir. Bu özellik, hoparlörü değiştirirken merceğin tepki süresini 1-2 saniyeye düşürmenizi sağlar. Kamera, kısa cümleler kursalar bile katılımcılar arasında rahat bir ritimle geçiş yapmayı başarıyor.
Sistemin çalışmasını gösteren bir video gösterimi, işlevselliği tam olarak yansıtmaktadır SmartCam A12VT. Ancak videoyu izlemeyenler için otomasyonun çalışma prensibini kelimelerle anlatacağım:

  1. Oda boş: merceklerden biri genel planı gösteriyor, ikincisi hazır - insanları bekliyor
  2. İnsanlar odaya girer ve yerlerine oturur: Serbest mercek iki uçtaki katılımcıyı bulur ve görüntüyü etraflarında çerçeveleyerek odanın boş kısmını keser.
  3. İnsanlar hareket ederken lensler odadaki herkesi sırayla takip ederek onları çerçevenin merkezinde tutar
  4. Konuşmacı konuşmaya başlıyor: Mercek aktif, genel plana göre ayarlanmış. İkincisi konuşmacıya yöneliktir ve ancak o zaman yayın moduna geçer
  5. Hoparlör değişir: İlk hoparlöre ayarlanan lens etkindir ve ikinci lens geniş çekimi bırakır ve yeni hoparlöre ayarlanır.
  6. Resmin ilk hoparlörden ikinciye geçtiği anda, serbest lens anında odanın genel planına göre ayarlanır.
  7. Herkes susarsa, ücretsiz mercek herhangi bir gecikme olmadan hazır bir genel plan gösterecektir.
  8. Konuşmacı tekrar değişirse, serbest lens onu aramaya gidecek

Sonuç

Bana göre geçen yıl İMKB ve ISR'de sunulan bu çözüm, yüksek teknolojiyi insanlara olmasa da elbette iş dünyasına yaklaştırıyor. 400 bin ruble için çok az kişinin ev için böyle bir "oyuncak" satın alacağı açık, ancak iş için, kurumsal video konferans için bu, kamerayı otomatik olarak hedefleme sorununa çok uygun fiyatlı ve kullanışlı bir çözüm.
Çok yönlülük göz önüne alındığında SmartCam A12 Ses Takibisistem sıfırdan bir çözüm olarak kullanılabileceği gibi mevcut bir video konferans altyapısının işlevselliğinin bir uzantısı olarak da kullanılabilir. Yukarıda açıklanan üreticilerin tescilli sistemlerinin aksine, HDMI aracılığıyla bağlanmak kullanıcıya yönelik büyük bir adımdır.

Teste yardımcı olan ortaklara teşekkür etmek isterim.
şirket IPMatika — Yealink VC880 terminali, toplantı odası ve Yakushina Yura için.
şirket Akıllı-AV — sistemin çözümü ve sağlanmasına ilişkin ilk ve münhasır inceleme hakkı için SmartCam A12 Ses Takibi test için.

Son makalede Çevrimiçi toplantı odası tasarımcısı - en uygun video konferans çözümünün seçimi, web sitesi tanıtımı olarak vc4u.ru и VKS tasarımcısı duyurduk 10 indirim fiyattan itibaren rehber kod kelimesine göre HABR 2019 yazının sonuna kadar.

İndirim aşağıdaki bölümlerdeki ürünler için geçerlidir:

Karara SmartCam A12 Ses Takibi Mevcut %5'a ilave %10 indirim sunuyorum - 15 yaz sonuna kadar toplam %2019.

Ankete yorumlarınızı ve cevaplarınızı bekliyorum!

İlginiz için teşekkür ederiz.
Saygılarımızla,
Kirill Usikov (Usikoff)
Başı
Video gözetim ve video konferans sistemleri
[e-posta korumalı]
stss.ru
vc4u.ru

Ankete sadece kayıtlı kullanıcılar katılabilir. Giriş yapLütfen.

SmartCam A12 Ses Takibi ne kadar kullanışlıdır?

  • Sonunda yazılım ve donanım terminalleri için evrensel bir çözüm ortaya çıktı!

  • Çözüm güzel ama başka seçenekler de var (Yorumlara yazacağım)

  • Sistem zayıf, Polycom ve Cisco'ya ulaşmıyor - neden 3 kat daha fazla ödemeniz gerektiğini yorumlara yazacağım!

  • Zaten toplantı odasında kimin otomatik rehberliğe ihtiyacı var ki?

  • Zaten toplantı odasında PTZ kameraya kimin ihtiyacı var ki? — Web kamerasını bağladım ve sorun olmadı!

8 kullanıcı oy kullandı. 5 kişi çekimser kaldı.

Kaynak: habr.com

Yorum ekle