Burim i hapur për Spleeter, një sistem për ndarjen e muzikës dhe zërit

Ofruesi i transmetimit Deezer I hapur Tekstet burimore të projektit eksperimental Spleeter, i cili zhvillon një sistem të mësimit të makinës për ndarjen e burimeve të tingullit nga kompozimet komplekse audio. Programi ju lejon të hiqni vokalin nga një kompozim dhe të lini vetëm shoqërimin muzikor, të manipuloni tingullin e instrumenteve individuale ose të hiqni muzikën dhe ta lini zërin për t'u mbivendosur me një seri tjetër tingulli, duke krijuar përzierje, karaoke ose transkriptim. Kodi i projektit është shkruar në Python duke përdorur motorin Tensorflow dhe shperndare nga nën licencën MIT.

Për ngarkim ofruar modele tashmë të trajnuara për ndarjen e vokalit (një zë) nga shoqërimi, si dhe për ndarjen në 4 dhe 5 prurje, duke përfshirë vokalin, baterinë, basin, pianon dhe pjesën tjetër të tingullit. Spleeter mund të përdoret si një bibliotekë Python dhe si një mjet i pavarur i linjës së komandës. Në rastin më të thjeshtë, bazuar në skedarin burimor krijuar dy, katër ose pesë skedarë me komponentë zëri dhe shoqërues (vocals.wav, drums.wav, bas.wav, piano.wav, other.wav).

Kur ndahet në 2 dhe 4 fije, Spleeter ofron performancë shumë të lartë, për shembull, kur përdorni GPU, ndarja e një skedari audio në 4 fije kërkon 100 herë më pak kohë sesa kohëzgjatja e përbërjes origjinale. Në një sistem me një GPU NVIDIA GeForce GTX 1080 dhe një CPU me 32 bërthama Intel Xeon Gold 6134, koleksioni i testit musDB, i cili zgjati tre orë e 27 minuta, u përpunua në 90 sekonda.

Burim i hapur për Spleeter, një sistem për ndarjen e muzikës dhe zërit



Ndër avantazhet e Spleeter, krahasuar me zhvillimet e tjera në fushën e ndarjes audio, siç është projekti me kod të hapur Hapur-Unpërzier, përmend përdorimin e modeleve me cilësi më të lartë të ndërtuara nga një koleksion i gjerë skedarësh zanor. Për shkak të kufizimeve të së drejtës së autorit, studiuesit e mësimit të makinerive janë të kufizuar në akses në koleksione publike mjaft të rralla të skedarëve muzikorë, ndërsa modelet e Spleeter u ndërtuan duke përdorur të dhëna nga katalogu i madh muzikor i Deezer.

Mbi krahasimi me Open-Unmix, mjeti i ndarjes së Spleeter është rreth 35% më i shpejtë kur testohet në CPU, mbështet skedarët MP3 dhe gjeneron rezultate dukshëm më të mira (të vetmet zëra në Open-Unmix lë gjurmë të disa mjeteve, gjë që ka të ngjarë për faktin se modelet Open-Unmix janë trajnuar në një koleksion prej vetëm 150 kompozimesh).

Burimi: opennet.ru

Shto një koment