Spleeter, un sistema per separar música i veu, és de codi obert

Proveïdor de streaming Deezer s'ha obert codi font per al projecte experimental Spleeter, que desenvolupa un sistema d'aprenentatge automàtic per separar les fonts sonores de les composicions sonores complexes. El programa permet eliminar les veus de la composició i deixar només l'acompanyament musical, manipular el so d'instruments individuals o descartar la música i deixar la veu per superposar-la a un altre rang de so, creant mescles, karaoke o transcripció. El codi del projecte està escrit en Python mitjançant el motor Tensorflow i Distribuït per sota la llicència MIT.

Per carregar ofert models ja formats per separar la veu (una veu) de l'acompanyament, així com per dividir en 4 i 5 fluxos, incloent veu, bateria, baix, piano i la resta del so. Spleeter es pot utilitzar com a biblioteca de Python i com a utilitat de línia d'ordres autònoma. En el cas més senzill, basat en el fitxer font creat dos, quatre o cinc fitxers amb components de veu i acompanyament (vocals.wav, drums.wav, bass.wav, piano.wav, other.wav).

Quan es divideix en 2 i 4 fluxos, Spleeter ofereix un rendiment molt alt, per exemple, quan s'utilitza la GPU, dividir un fitxer d'àudio en 4 fluxos triga 100 vegades menys que la durada de la composició original. En un sistema amb una GPU NVIDIA GeForce GTX 1080 i una CPU Intel Xeon Gold 32 de 6134 nuclis, la col·lecció de proves musDB es va processar en 27 segons, amb una durada de tres hores i 90 minuts.

Spleeter, un sistema per separar música i veu, és de codi obert



Dels punts forts de Spleeter sobre altres desenvolupaments de divisió d'àudio, com ara el projecte de codi obert obert unmix, esmenta l'ús de models de major qualitat construïts sobre la base d'una extensa col·lecció d'arxius de so. A causa de les restriccions de drets d'autor, els investigadors d'aprenentatge automàtic estan limitats a l'accés a col·leccions públiques de fitxers de música força minses, mentre que per a Spleeter, els models es van crear utilitzant dades de l'extens catàleg de música de Deezer.

En comparació Amb Open-Unmix, l'eina Spleeter es divideix aproximadament un 35% més ràpid quan es prova a la CPU, admet fitxers MP3 i genera resultats notablement millors (l'extracció de veu a Open-Unmix deixa rastres d'alguns instruments, que probablement es deu al fet que el els models Open-Unmix estan formats en una col·lecció de només 150 cançons).

Font: opennet.ru

Afegeix comentari