Fungsi penyasaran kamera melalui suara telah menjadi lebih mudah diakses - penyelesaian universal Penjejakan Suara SmartCam A12

Fungsi penyasaran kamera melalui suara telah menjadi lebih mudah diakses - penyelesaian universal Penjejakan Suara SmartCam A12Topik menjejaki peserta bercakap dalam sidang video telah mendapat momentum sejak beberapa tahun lalu. Teknologi telah memungkinkan untuk melaksanakan algoritma kompleks untuk memproses maklumat audio/video dalam masa nyata, yang mendorong Polycom, hampir 10 tahun yang lalu, untuk memperkenalkan penyelesaian arus perdana pertama di dunia dengan penjejakan pembesar suara automatik pintar. Selama beberapa tahun mereka berjaya kekal sebagai satu-satunya pemilik penyelesaian sedemikian, tetapi Cisco tidak perlu menunggu lama dan membawa ke pasaran versi sistem dua kamera pintar mereka, yang merupakan pesaing yang adil kepada penyelesaian daripada Polycom. Selama bertahun-tahun, segmen persidangan video ini dihadkan oleh keupayaan beberapa hak milik produk, tetapi artikel ini khusus untuk yang pertama universal penyelesaian untuk panduan kamera melalui suara, serasi dengan kedua-dua perkakasan dan infrastruktur perisian persidangan video.
Sebelum meneruskan untuk menerangkan penyelesaian dan menunjukkan keupayaan, saya ingin ambil perhatian satu peristiwa penting:
Saya berbesar hati untuk menyampaikan kepada komuniti Habra hab baru, khusus untuk penyelesaian persidangan video (VCC). Sekarang, terima kasih kepada usaha bersama (lombong dan UFO), Persidangan video mempunyai rumah sendiri di Habré, dan saya menjemput semua yang terlibat dalam topik yang meluas dan semasa ini untuk melanggan hab baru.

Dua senario untuk menghalakan kamera ke pembesar suara

Pada masa ini, penyepadu penyelesaian persidangan video memilih sendiri dua cara berbeza untuk melaksanakan tugas menyasarkan penyampai:

  1. Automatik - Pintar
  2. Separa automatik - boleh diprogramkan

Pilihan pertama hanyalah penyelesaian daripada Cisco, Polycom dan pengeluar lain; kami akan mempertimbangkannya di bawah. Di sini kita berurusan dengan automasi penuh menghalakan kamera ke arah peserta yang bercakap dalam persidangan video. Algoritma unik untuk memproses isyarat audio/video membolehkan kamera memilih kedudukan yang dikehendaki secara bebas.

Pilihan kedua ialah sistem automasi berdasarkan pelbagai pengawal kawalan luaran; kami tidak akan mempertimbangkannya secara terperinci, kerana Artikel ini dikhaskan khusus untuk penjejakan automatik pembesar suara.
Terdapat sebilangan besar penyokong senario kedua untuk melaksanakan penunjuk kamera, dan terdapat sebab untuk ini. Penyepadu yang berpengalaman memahami bahawa penyelesaian pintar daripada Polycom dan Cisco memerlukan keadaan operasi yang ideal untuk automasi berfungsi dengan baik. Tetapi tidak selalu mungkin untuk menyediakan syarat sedemikian, jadi operasi sistem kadangkala dijamin oleh penyelesaian berikut untuk masalah penunjuk kamera:

1. Semua pratetap yang diperlukan (kedudukan peranti PTZ dan faktor zum optik) dimasukkan secara manual terlebih dahulu ke dalam memori kamera (atau kadangkala ke dalam pengawal kawalan). Sebagai peraturan, ini ialah pelan umum bilik mesyuarat dan pandangan setiap peserta persidangan dalam mod potret.

2. Seterusnya, pemula untuk memanggil pratetap yang diperlukan dipasang di tempat yang ditentukan - ini sama ada konsol mikrofon atau butang radio, secara umum, mana-mana peranti yang boleh memberikan pengawal kawalan dengan isyarat yang ia fahami.

3. Pengawal kawalan diprogramkan sedemikian rupa sehingga setiap pemula mempunyai pratetap sendiri. Pelan am bilik - semua pemula dimatikan.
Akibatnya, apabila menggunakan sistem kongres, sebagai contoh, dan pengawal kawalan, pembesar suara, sebelum memulakan ucapannya, mengaktifkan konsol mikrofon peribadinya. Sistem kawalan segera memproses kedudukan kamera yang disimpan.

Senario ini berfungsi dengan sempurna - sistem tidak perlu melakukan triangulasi suara dan analitik video. Saya menekan butang dan pratetap berfungsi, tiada kelewatan atau positif palsu.
Sistem kawalan dan automasi digunakan dalam bilik yang besar dan kompleks, di mana kadangkala bukan satu, tetapi beberapa kamera video dipasang. Nah, untuk bilik mesyuarat bersaiz kecil dan sederhana, sistem automatik agak sesuai (jika anda mempunyai bajet).
Mari kita mulakan dengan bapa pengasas.

Pengarah Polycom EagleEye

Fungsi penyasaran kamera melalui suara telah menjadi lebih mudah diakses - penyelesaian universal Penjejakan Suara SmartCam A12Penyelesaian ini pernah mencipta sensasi dalam bidang persidangan video. Pengarah Polycom EagleEye ialah penyelesaian pertama dalam bidang bimbingan kamera pintar. Penyelesaiannya terdiri daripada unit asas Pengarah EagleEye dan dua kamera. Keistimewaan pelaksanaan pertama itu ialah satu kamera diperuntukkan hanya untuk paparan dekat pembesar suara, dan yang kedua - kepada pelan umum bilik mesyuarat. Pada masa yang sama, kamera pelan am boleh diletakkan sepenuhnya secara berasingan daripada pangkalan di tempat lain di dalam bilik mesyuarat - ia tidak terlibat secara langsung dalam proses bimbingan automatik.
Sistem berfungsi seperti berikut:

  1. Kamera bilik umum aktif - semua orang senyap
  2. Pembesar suara mula bercakap - susunan mikrofon mengambil suara, kamera bergerak ke arah bunyi menggunakan teknologi berpaten yang termasuk triangulasi suara. Kamera am masih aktif
  3. Kamera utama baru mula mencari sumber bunyi, menjalankan analisis video. Sistem mengenal pasti pembesar suara melalui sambungan mata-hidung-mulut, membingkai gambar pembesar suara dan memaparkan strim daripada kamera utama
  4. Pembesar suara bertukar. Susunan mikrofon memahami bahawa suara itu datang dari tempat lain. Pelan am dihidupkan semula.
  5. Dan kemudian dalam bulatan, bermula dari titik 2
  6. Jika pembesar suara baharu berada dalam bingkai dengan yang sebelumnya, sistem membuat perubahan kedudukan "panas" tanpa menukar aliran aktif kepada tangkapan umum.

Kelemahannya, pada pendapat saya, adalah kehadiran hanya satu kamera utama. Ini mengakibatkan kelewatan yang ketara apabila menukar pembesar suara. Dan setiap kali pada saat menunjuk, sistem menghidupkan pelan umum bilik - semasa perbualan yang rancak, kerlipan ini mula menjengkelkan.

Polycom EagleEye Pengarah II

Fungsi penyasaran kamera melalui suara telah menjadi lebih mudah diakses - penyelesaian universal Penjejakan Suara SmartCam A12Ini adalah versi kedua penyelesaian daripada Polycom, yang dikeluarkan agak baru-baru ini. Prinsip operasi telah mengalami perubahan dan telah menjadi lebih seperti penyelesaian daripada Cisco. Kini kedua-dua kamera PTZ adalah yang utama dan berfungsi untuk menukar saluran dengan lancar dari satu penyampai ke penyampai yang lain. Reka letak umum bilik mesyuarat kini ditangkap oleh kamera berasingan yang disepadukan ke dalam badan unit asas EagleEye Director II. Atas sebab tertentu, strim daripada kamera sudut lebar ini dipaparkan dalam tetingkap tambahan di sudut skrin, menduduki 1/9 daripada strim utama. Prinsip penentududukan adalah sama - triangulasi suara dan analisis aliran video. Dan kesesakan adalah sama: jika sistem tidak melihat mulut yang bercakap, kamera tidak akan membidik. Dan situasi ini boleh berlaku agak kerap - pembesar suara telah berpaling, pembesar suara telah berpaling ke sisi, pembesar suara adalah ventriloquist, pembesar suara telah menutup mulutnya dengan tangan atau dokumen.
Kedua-dua video promosi telah dirakam dengan cekap - 2 orang bercakap secara bergilir-gilir, dan membuka mulut mereka seolah-olah berjanji temu dengan ahli terapi pertuturan. Tetapi walaupun dalam keadaan halus seperti itu terdapat kelewatan yang sangat ketara. Tetapi pembingkaiannya sempurna - gambar potret yang selesa.

Cisco TelePresence SpeakerTrack 60

Fungsi penyasaran kamera melalui suara telah menjadi lebih mudah diakses - penyelesaian universal Penjejakan Suara SmartCam A12Untuk menerangkan penyelesaian ini, saya akan menggunakan teks daripada risalah rasmi.
SpeakerTrack 60 menggunakan pendekatan dwi-kamera yang unik untuk bertukar terus antara peserta dengan cepat. Satu kamera dengan cepat mencari jarak dekat penyampai yang aktif, manakala yang lain mencari dan memaparkan penyampai seterusnya. Ciri MultiSpeaker menghalang penukaran yang tidak perlu jika pembesar suara seterusnya sudah ada dalam bingkai semasa.
Malangnya, saya tidak mempunyai peluang untuk menguji sendiri SpeakerTrack 60. Oleh itu, kesimpulan perlu dibuat berdasarkan pendapat "dari lapangan" dan berdasarkan hasil analisis video demonstrasi di bawah. Saya mengira kelewatan maksimum hampir 8 saat apabila menunjuk ke arah penyampai baharu. Purata kelewatan ialah 2-3 saat, berdasarkan video.

Kamera Video Penjejakan Pintar HUAWEI VPT300

Fungsi penyasaran kamera melalui suara telah menjadi lebih mudah diakses - penyelesaian universal Penjejakan Suara SmartCam A12Saya terjumpa penyelesaian ini daripada Huawei secara tidak sengaja. Sistem ini berharga kira-kira $9K. Berfungsi hanya dengan terminal Huawei. Pembangun menambah "helah" mereka sendiri - susun atur video daripada dua pembesar suara pada satu skrin jika tiada orang lain di dalam bilik. Dari segi ciri dan kefungsian yang diisytiharkan, ini adalah versi sistem panduan automatik yang sangat menarik. Tetapi, malangnya, saya sama sekali tidak menemui bahan demo. Satu-satunya video yang muncul mengenai topik ini ialah ulasan video yang diedit tentang penyelesaian, tanpa bunyi asal, ditetapkan kepada muzik. Oleh itu, adalah tidak mungkin untuk menilai kualiti sistem. Atas sebab ini, saya tidak akan mempertimbangkan pilihan ini.
Saya melihat bahawa Huawei mempunyai blog aktif di Habré - mungkin rakan sekerja akan dapat menerbitkan beberapa maklumat berguna tentang produk ini.

Baru - penyelesaian universal Penjejakan Suara SmartCam A12

Fungsi penyasaran kamera melalui suara telah menjadi lebih mudah diakses - penyelesaian universal Penjejakan Suara SmartCam A12SmartCam A12VT - monoblock, termasuk dua kamera PTZ untuk menjejak pembesar suara, dua kamera terbina dalam untuk menganalisis susun atur umum bilik, serta tatasusunan mikrofon yang dibina pada dasar sarung - seperti yang anda lihat, tidak ada yang besar dan struktur rapuh seperti pihak lawan.
Sebelum saya mula menerangkan produk baharu, saya akan mengumpulkan ciri dan ciri penyelesaian daripada Cisco dan Polycom supaya saya boleh membandingkan SmartCam A12VT dengan tawaran sedia ada.

Pengarah Polycom EagleEye

  • Kos runcit sistem tanpa terminal - $ 13K
  • Kos minimum bagi penyelesaian EagleEye Director + RealPresence Group 500 - $ 19K
  • Purata kelewatan penukaran 3 saat
  • Panduan suara + analisis video
  • Permintaan tinggi pada wajah pembesar suara - anda tidak boleh menyembunyikan mulut anda
  • Ketidakserasian dengan peralatan pihak ketiga

Cisco TelePresence SpeakerTrack 60

  • Kos runcit sistem tanpa terminal - $ 15,9K
  • Kos minimum penyelesaian TelePresence SpeakerTrack 60 + SX80 Codec - $ 30K
  • Purata kelewatan penukaran 3 saat
  • Panduan suara + analisis video
  • Keperluan untuk wajah penceramah - tidak menyemak, tidak mencari maklumat
  • Ketidakserasian dengan peralatan pihak ketiga

Penjejakan Suara SmartCam A12

  • Kos runcit sistem tanpa terminal - $ 6,2K
  • Kos penyelesaian minimum SmartCam A12VT + Yealink VC880 - $ 10.8K
  • Kos penyelesaian minimum Terminal perisian SmartCam A12VT+ - $ 7,7K
  • Purata kelewatan penukaran 3 saat
  • Panduan suara + analisis video
  • Keperluan untuk muka pembesar suara - tiada keperluan
  • Keserasian Pihak Ketiga - HDMI

Sebagai dua kelebihan utama dan tidak dapat dinafikan penyelesaian Penjejakan Suara SmartCam A12 Saya jumpa:

  1. Ketersambungan serba boleh — melalui HDMI, sistem ini disepadukan dengan sistem terminal persidangan video perkakasan dan perisian
  2. Kos rendah — dengan kefungsian yang serupa, A12VT berkali-kali lebih mampu milik pada belanjawan daripada cadangan yang diterangkan di atas.

Untuk menunjukkan cara sistem berfungsi, kami merakam semakan video. Tugasnya tidak begitu banyak pengiklanan sebagai berfungsi. Oleh itu, video itu tidak mempunyai kesedihan video promosi Polycom. Tempat yang dipilih untuk pembentangan bukanlah pejabat perwakilan, tetapi bilik mesyuarat makmal rakan kongsi kami iaitu syarikat IPMatika.
Matlamat saya bukan untuk menyembunyikan kelemahan sistem, tetapi, sebaliknya, untuk mendedahkan kesesakan fungsi, untuk memaksa sistem membuat kesilapan.

Pada pendapat saya, sistem ini berjaya lulus ujian. Saya mengatakan ini dengan yakin kerana pada masa menulis artikel ini, penyelesaiannya Penjejakan Suara SmartCam A12 melawat sedozen bilik mesyuarat sebenar pelanggan kami. Kerosakan automasi diperhatikan secara eksklusif dalam keadaan pelanggaran peraturan operasi yang disyorkan. Khususnya, jarak minimum ke peserta berdekatan. Jika anda duduk sangat dekat dengan kamera, kurang daripada satu meter, susunan mikrofon tidak akan dapat mengecam anda dan kanta tidak akan dapat menjejaki anda.

Fungsi penyasaran kamera melalui suara telah menjadi lebih mudah diakses - penyelesaian universal Penjejakan Suara SmartCam A12

Sebagai tambahan kepada jarak, terdapat keperluan lain - ketinggian kamera.

Fungsi penyasaran kamera melalui suara telah menjadi lebih mudah diakses - penyelesaian universal Penjejakan Suara SmartCam A12

Jika kamera dipasang terlalu rendah, masalah dengan kedudukan suara mungkin berlaku. Pilihan di bawah TV, malangnya, tidak berfungsi.
Tetapi memasang sistem di atas peranti paparan ialah cara yang ideal untuk peranti itu beroperasi. Rak kamera disertakan; hanya pelekap di dinding disokong sebagai standard.

Cara Penjejakan Suara SmartCam A12 berfungsi

Kanta PTZ utama mempunyai peranan yang sama - tugas mereka adalah untuk menjejak penyampai secara bergilir-gilir dan memaparkan rancangan keseluruhan. Analitis gambaran keseluruhan di dalam bilik dan penentuan jarak ke objek dijalankan menggunakan aliran video yang diterima daripada dua kamera yang disepadukan ke dalam pangkalan sistem. Ciri ini membolehkan anda mengurangkan masa tindak balas kanta apabila menukar pembesar suara kepada 1-2 saat. Kamera berjaya bersilih ganti antara peserta pada irama yang selesa, walaupun mereka bertukar ayat pendek.
Demonstrasi video operasi sistem mencerminkan sepenuhnya fungsi SmartCam A12VT. Tetapi, bagi mereka yang belum menonton video, saya akan menerangkan dengan kata-kata prinsip operasi automasi:

  1. Bilik itu kosong: salah satu kanta menunjukkan pelan umum, yang kedua sudah siap - menunggu orang
  2. Orang ramai memasuki bilik dan mengambil tempat duduk mereka: kanta bebas menemui dua peserta ekstrem dan membingkai imej di sekeliling mereka, memotong bahagian kosong bilik itu
  3. Semasa orang bergerak, kanta bergilir-gilir menjejaki semua orang di dalam bilik, memastikan mereka berada di tengah-tengah bingkai
  4. Pembesar suara mula bercakap: kanta aktif, disesuaikan dengan pelan umum. Yang kedua ditujukan kepada pembesar suara, dan hanya kemudian masuk ke mod siaran
  5. Pembesar suara berubah: lensa yang dilaraskan kepada pembesar suara pertama aktif, dan lensa kedua melepaskan tangkapan lebar dan melaraskan kepada pembesar suara baharu
  6. Pada saat menukar gambar daripada pembesar suara pertama kepada pembesar suara kedua, kanta percuma dilaraskan serta-merta kepada pelan umum bilik
  7. Jika semua orang senyap, kanta percuma akan menunjukkan pelan am yang sudah siap tanpa sebarang kelewatan
  8. Jika pembesar suara bertukar lagi, kanta percuma akan pergi mencarinya

Kesimpulan

Pada pendapat saya, penyelesaian ini, yang dibentangkan di ISE dan ISR tahun lepas, membawa teknologi tinggi lebih dekat - jika tidak kepada orang ramai, maka kepada perniagaan pastinya. Sudah jelas bahawa untuk 400 ribu rubel, hanya sedikit orang yang akan membeli "mainan" seperti itu untuk rumah, tetapi untuk perniagaan, untuk persidangan video korporat, ini adalah penyelesaian yang sangat berpatutan dan mudah untuk masalah membidik kamera secara automatik.
Memandangkan serba boleh Penjejakan Suara SmartCam A12, sistem ini boleh digunakan sebagai penyelesaian dari awal, atau sebagai lanjutan kefungsian infrastruktur persidangan video sedia ada. Menyambung melalui HDMI adalah satu langkah besar ke arah pengguna, berbeza dengan sistem proprietari pengeluar yang diterangkan di atas.

Saya ingin mengucapkan terima kasih kepada rakan kongsi yang membantu dalam ujian.
syarikat IPMatika — untuk terminal Yealink VC880, bilik mesyuarat dan Yakushina Yura.
syarikat Smart-AV — untuk hak semakan pertama dan eksklusif penyelesaian dan penyediaan sistem Penjejakan Suara SmartCam A12 untuk ujian.

Dalam artikel lepas Pereka bentuk bilik mesyuarat dalam talian - pemilihan penyelesaian persidangan video yang optimum, sebagai promosi laman web vc4u.ru и Pereka VKS kami umumkan 10% diskaun dari harga masuk direktori dengan perkataan kod HABR sehingga akhir musim panas 2019.

Diskaun terpakai kepada produk dalam bahagian berikut:

Kepada keputusan Penjejakan Suara SmartCam A12 Saya menawarkan diskaun tambahan 5% kepada 10% yang sedia ada - sejumlah 15% sehingga akhir musim panas 2019.

Saya menantikan komen dan jawapan anda dalam tinjauan!

Terima kasih atas perhatian anda.
Yang Ikhlas,
Kirill Usikov (Usikoff)
Ketua
Sistem pengawasan video dan persidangan video
[e-mel dilindungi]
stss.ru
vc4u.ru

Hanya pengguna berdaftar boleh mengambil bahagian dalam tinjauan. Log masuk, Sama-sama.

Sejauh manakah Penjejakan Suara SmartCam A12 berguna?

  • Akhirnya, penyelesaian universal untuk terminal perisian dan perkakasan telah muncul!

  • Penyelesaiannya adalah baik, tetapi terdapat pilihan lain yang tersedia (saya akan menulis dalam komen)

  • Sistem ini lemah, ia tidak mencapai Polycom dan Cisco - Saya akan menulis dalam komen mengapa anda perlu membayar 3 kali ganda!

  • Siapa yang memerlukan bimbingan automatik dalam bilik mesyuarat?

  • Siapa yang memerlukan kamera PTZ di bilik mesyuarat pula? — Saya menyambungkan kamera web dan ia baik-baik saja!

8 pengguna mengundi. 5 pengguna berpantang.

Sumber: www.habr.com

Tambah komen