Google səsləri bölmək üçün məlumat və maşın öyrənmə modelini buraxır

Google nəşr olundu ixtiyari qarışıq səsləri ayrı-ayrı komponentlərə ayırmaq üçün istifadə edilən maşın öyrənmə sistemlərində istifadə oluna bilən annotasiya edilmiş istinad qarışıq səs verilənlər bazası. Həmçinin səsləri ayırmaq üçün Tensorflow-da istifadə edilə bilən ümumi dərin öyrənmə modeli (TDCN++) dərc edilmişdir. Məlumat toplama əsasında hazırlanmışdır freesound.org и nəşr olundu CCBY 4.0 altında lisenziyalıdır.

Təqdim olunan FUSS (Free Universal Sound Separation) layihəsi təbiəti əvvəlcədən məlum olmayan istənilən sayda ixtiyari səslərin ayrılması probleminin həllinə yönəlib. Digər belə sistemlər ümumiyyətlə səslər və səssizlər və ya fərqli danışan insanlar kimi müəyyən səsləri ayırmaq vəzifəsi ilə məhdudlaşır.

Verilənlər bazasında təxminən 20 min qarışıq var. Suite həmçinin divar əksini, səs mənbəyinin yerini və mikrofon yerini nəzərə alan xüsusi hazırlanmış otaq simulyatoru ilə hazırlanmış əvvəlcədən hesablanmış otaq impuls cavablarını da əhatə edir.

Mənbə: opennet.ru

Добавить комментарий