Отворени код за Сплеетер, систем за раздвајање музике и гласа

Провајдер за стриминг Деезер отворен Изворни текстови експерименталног пројекта Сплеетер, који развија систем машинског учења за одвајање извора звука од сложених аудио композиција. Програм вам омогућава да уклоните вокале из композиције и оставите само музичку пратњу, манипулишете звуком појединачних инструмената или одбаците музику и оставите глас за преклапање са другом звучном серијом, креирајући миксеве, караоке или транскрипцију. Код пројекта је написан у Питхон-у помоћу Тенсорфлов мотора и дистрибуира под лиценцом МИТ-а.

За утовар нуде се већ обучени модели за одвајање вокала (једног гласа) од пратње, као и за поделу на 4 и 5 токова, укључујући вокал, бубњеве, бас, клавир и остатак звука. Сплеетер се може користити и као Питхон библиотека и као самостални услужни програм командне линије. У најједноставнијем случају, на основу изворне датотеке створио два, четири или пет фајлова са компонентама гласа и пратње (вокал.вав, друмс.вав, басс.вав, пиано.вав, отхер.вав).

Када се дели на 2 и 4 нити, Сплеетер пружа веома високе перформансе, на пример, када се користи ГПУ, подела аудио датотеке на 4 нити траје 100 пута мање времена од трајања оригиналне композиције. На систему са НВИДИА ГеФорце ГТКС 1080 ГПУ-ом и 32-језгарним Интел Ксеон Голд 6134 ЦПУ-ом, мусДБ тест збирка, која је трајала три сата и 27 минута, обрађена је за 90 секунди.

Отворени код за Сплеетер, систем за раздвајање музике и гласа



Међу предностима Сплеетер-а, у поређењу са другим развојима у области аудио раздвајања, као што је пројекат отвореног кода Опен-Унмик, помиње употребу модела вишег квалитета направљених од обимне колекције звучних датотека. Због ограничења ауторских права, истраживачи машинског учења су ограничени на приступ прилично ретким јавним збиркама музичких датотека, док су Сплеетерови модели направљени коришћењем података из Деезеровог огромног музичког каталога.

На поређење са Опен-Унмик-ом, Сплеетер-ов алат за раздвајање је око 35% бржи када се тестира на ЦПУ-у, подржава МП3 датотеке и генерише приметно боље резултате (издвајање гласова у Опен-Унмик-у оставља трагове неких алатки, што је вероватно због чињенице да модели Опен-Унмик су обучени на колекцији од само 150 композиција).

Извор: опеннет.ру

Купите поуздан хостинг за сајтове са ДДоС заштитом, ВПС ВДС сервере 🔥 Купите поуздан веб хостинг са DDoS заштитом, VPS VDS сервере | ProHoster