Google mengeluarkan data dan model pembelajaran mesin untuk memisahkan bunyi

Google ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° pangkalan data beranotasi bagi bunyi campuran rujukan yang boleh digunakan dalam sistem pembelajaran mesin yang digunakan untuk memisahkan bunyi bercampur arbitrari ke dalam komponen individunya. Model pembelajaran mesin dalam generik (TDCN++) juga telah diterbitkan yang boleh digunakan dalam Tensorflow untuk memisahkan bunyi. Data disediakan berdasarkan pengumpulan freesound.org ΠΈ diterbitkan dilesenkan di bawah CC BY 4.0.

Projek yang dibentangkan FUSS (Free Universal Sound Separation) bertujuan untuk menyelesaikan masalah memisahkan sebarang bilangan bunyi sewenang-wenangnya, yang sifatnya tidak diketahui terlebih dahulu. Sistem lain yang serupa biasanya terhad kepada tugas membezakan antara bunyi tertentu, seperti suara dan bukan suara, atau orang lain yang bercakap.

Pangkalan data mengandungi kira-kira 20 ribu campuran. Kit ini juga termasuk tindak balas impuls bilik yang diprakira menggunakan simulator bilik tersuai yang mengambil kira pantulan dinding, lokasi sumber bunyi dan lokasi mikrofon.

Sumber: opennet.ru

Tambah komen