Nyílt forráskódú Spleeter, a zene és a hang elválasztására szolgáló rendszer
Streaming szolgáltató Deezer megnyílt A Spleeter kísérleti projekt forrásszövegei, amely gépi tanulási rendszert fejleszt a hangforrások komplex hangkompozícióktól való elkülönítésére. A program lehetővé teszi az ének eltávolítását egy kompozícióból, és csak a zenei kíséretet hagyja meg, manipulálja az egyes hangszerek hangját, vagy dobja el a zenét, és hagyja a hangot egy másik hangsorozatra átfedni, mixek, karaoke vagy átirat létrehozására. A projekt kódja Pythonban van megírva a Tensorflow motor és a forgalmazza az MIT engedélye alapján.
A rakodáshoz felajánlott már kiképzett modellek az ének (egy hang) és a kíséret elválasztására, valamint a 4 és 5 folyamra való felosztásra, beleértve az éneket, a dobot, a basszust, a zongorát és a hang többi részét. A Spleeter Python-könyvtárként és önálló parancssori segédprogramként is használható. A legegyszerűbb esetben a forrásfájl alapján létre két, négy vagy öt fájl hang- és kíséretkomponensekkel (vocals.wav, drums.wav, bass.wav, piano.wav, other.wav).
2 és 4 szálra való felosztáskor a Spleeter nagyon nagy teljesítményt biztosít, például a GPU használatakor egy hangfájl 4 szálra bontása 100-szor kevesebb időt vesz igénybe, mint az eredeti kompozíció időtartama. Az NVIDIA GeForce GTX 1080 GPU-val és 32 magos Intel Xeon Gold 6134 CPU-val rendelkező rendszeren a musDB tesztgyűjtemény, amely három óra 27 percig tartott, 90 másodperc alatt készült el.
On összehasonlítás Az Open-Unmix segítségével a Spleeter elválasztó eszköze körülbelül 35%-kal gyorsabb a CPU-n tesztelve, támogatja az MP3 fájlokat, és észrevehetően jobb eredményeket produkál (az Open-Unmixben az egyes hangok nyomokat hagynak bizonyos eszközökben, ami valószínűleg annak köszönhető, hogy a Az Open-Unmix modellek mindössze 150 kompozícióból álló gyűjteményre vannak kiképezve).