Google merilis data dan model pembelajaran mesin untuk memisahkan suara

Google ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° database beranotasi dari referensi suara campuran yang dapat digunakan dalam sistem pembelajaran mesin yang digunakan untuk memisahkan suara campuran sewenang-wenang ke dalam komponen masing-masing. Model pembelajaran mesin mendalam yang umum (TDCN++) juga telah dipublikasikan yang dapat digunakan di Tensorflow untuk memisahkan suara. Data disusun berdasarkan pengumpulan suara bebas.org ΠΈ diterbitkan berlisensi di bawah CC BY 4.0.

Proyek FUSS (Pemisahan Suara Universal Gratis) yang disajikan bertujuan untuk memecahkan masalah pemisahan sejumlah suara arbitrer, yang sifatnya tidak diketahui sebelumnya. Sistem serupa lainnya umumnya terbatas pada tugas membedakan suara tertentu, seperti suara dan bukan suara, atau orang yang berbicara berbeda.

Basis data berisi sekitar 20 ribu campuran. Kit ini juga mencakup respons impuls ruangan yang telah dihitung sebelumnya menggunakan simulator ruangan yang dibuat khusus yang memperhitungkan pantulan dinding, lokasi sumber suara, dan lokasi mikrofon.

Sumber: opennet.ru

Tambah komentar