Ffynhonnell agored ar gyfer Spleeter, system ar gyfer gwahanu cerddoriaeth a llais

Darparwr ffrydio Deezer agorwyd Testunau ffynhonnell y prosiect arbrofol Spleeter, sy'n datblygu system ddysgu peirianyddol ar gyfer gwahanu ffynonellau sain oddi wrth gyfansoddiadau sain cymhleth. Mae'r rhaglen yn caniatáu ichi dynnu lleisiau o gyfansoddiad a gadael y cyfeiliant cerddorol yn unig, trin sain offerynnau unigol, neu daflu'r gerddoriaeth i ffwrdd a gadael y llais i'w droshaenu â chyfres sain arall, gan greu cymysgeddau, carioci neu drawsgrifiad. Mae cod y prosiect wedi'i ysgrifennu yn Python gan ddefnyddio'r injan Tensorflow a dosbarthu gan dan drwydded MIT.

Ar gyfer llwytho a gynigir modelau sydd eisoes wedi’u hyfforddi ar gyfer gwahanu lleisiau (un llais) oddi wrth gyfeiliant, yn ogystal ag ar gyfer rhannu’n 4 a 5 ffrwd, gan gynnwys lleisiau, drymiau, bas, piano a gweddill y sain. Gellir defnyddio Spleeter fel llyfrgell Python ac fel cyfleustodau llinell orchymyn annibynnol. Yn yr achos symlaf, yn seiliedig ar y ffeil ffynhonnell creu dwy, pedair neu bum ffeil gyda chydrannau llais a chyfeiliant (vocals.wav, drums.wav, bass.wav, piano.wav, other.wav).

Pan gaiff ei rannu'n 2 a 4 ffrwd, mae Spleeter yn darparu perfformiad uchel iawn, er enghraifft, wrth ddefnyddio'r GPU, mae rhannu ffeil sain yn 4 ffrwd yn cymryd 100 gwaith yn llai o amser na hyd y cyfansoddiad gwreiddiol. Ar system gyda GPU NVIDIA GeForce GTX 1080 a CPU 32-core Intel Xeon Gold 6134, proseswyd y casgliad prawf musDB, a barhaodd dair awr a 27 munud, mewn 90 eiliad.

Ffynhonnell agored ar gyfer Spleeter, system ar gyfer gwahanu cerddoriaeth a llais



Ymhlith manteision Spleeter, o'i gymharu â datblygiadau eraill ym maes gwahanu sain, megis y prosiect ffynhonnell agored Agor-Unmix, yn sôn am ddefnyddio modelau o ansawdd uwch a adeiladwyd o gasgliad helaeth o ffeiliau sain. Oherwydd cyfyngiadau hawlfraint, mae ymchwilwyr dysgu peirianyddol wedi'u cyfyngu i fynediad i gasgliadau cyhoeddus gweddol denau o ffeiliau cerddoriaeth, tra bod modelau Spleeter wedi'u hadeiladu gan ddefnyddio data o gatalog cerddoriaeth helaeth Deezer.

Ar cymhariaeth Gydag Open-Unmix, mae teclyn gwahanu Spleeter tua 35% yn gyflymach pan gaiff ei brofi ar y CPU, mae'n cefnogi ffeiliau MP3, ac yn cynhyrchu canlyniadau amlwg gwell (mae canu lleisiau yn Open-Unmix yn gadael olion rhai offer, sy'n debygol oherwydd y ffaith bod y modelau Open-Unmix yn cael eu hyfforddi ar gasgliad o ddim ond 150 o gyfansoddiadau).

Ffynhonnell: opennet.ru

Ychwanegu sylw