Open source per Spleeter, un sistema per separare musica e voce
Fornitore di streaming Deezer ho aperto Testi originali del progetto sperimentale Spleeter, che sviluppa un sistema di machine learning per separare sorgenti sonore da composizioni audio complesse. Il programma ti consente di rimuovere la voce da una composizione e lasciare solo l'accompagnamento musicale, manipolare il suono dei singoli strumenti o scartare la musica e lasciare la voce per sovrapporla con un'altra serie di suoni, creando mix, karaoke o trascrizioni. Il codice del progetto Γ¨ scritto in Python utilizzando il motore Tensorflow e distribuito da con licenza MIT.
Quando si divide in 2 e 4 thread, Spleeter fornisce prestazioni molto elevate, ad esempio, quando si utilizza la GPU, la divisione di un file audio in 4 thread richiede 100 volte meno tempo della durata della composizione originale. Su un sistema con una GPU NVIDIA GeForce GTX 1080 e una CPU Intel Xeon Gold 32 a 6134 core, la raccolta di test musDB, che Γ¨ durata tre ore e 27 minuti, Γ¨ stata elaborata in 90 secondi.
Su al confronto con Open-Unmix, lo strumento di separazione di Spleeter Γ¨ circa il 35% piΓΉ veloce quando testato sulla CPU, supporta file MP3 e genera risultati notevolmente migliori (singolare le voci in Open-Unmix lascia tracce di alcuni strumenti, il che Γ¨ probabilmente dovuto al fatto che lo strumento di separazione i modelli Open-Unmix sono addestrati su una raccolta di sole 150 composizioni).