Google, sesleri ayırmak için veri ve makine öğrenimi modelini yayınladı

Google yayınlanan Rastgele karışık sesleri kendi bileşenlerine ayırmak için kullanılan makine öğrenimi sistemlerinde kullanılabilecek, referans karışık seslerden oluşan açıklamalı bir veritabanı. Tensorflow'ta sesleri ayırmak için kullanılabilecek genel bir derin makine öğrenme modeli (TDCN++) da yayınlandı. Koleksiyona dayalı olarak hazırlanan veriler freesound.org и yayınlanan CC BY 4.0 kapsamında lisanslanmıştır.

Sunulan proje FUSS (Ücretsiz Evrensel Ses Ayırma), doğası önceden bilinmeyen herhangi bir sayıda rastgele sesin ayrılması sorununu çözmeyi amaçlamaktadır. Diğer benzer sistemler genellikle belirli sesleri (örneğin sesler ve ses olmayanlar) veya konuşan farklı insanları ayırt etme göreviyle sınırlıdır.

Veritabanı yaklaşık 20 bin karışım içeriyor. Kit ayrıca duvar yansımasını, ses kaynağı konumunu ve mikrofon konumunu hesaba katan özel yapım bir oda simülatörü kullanılarak önceden hesaplanmış oda dürtü yanıtlarını da içerir.

Kaynak: opennet.ru

Yorum ekle