స్ప్లీటర్ కోసం ఓపెన్ సోర్స్, సంగీతం మరియు వాయిస్‌ని వేరు చేసే వ్యవస్థ

స్ట్రీమింగ్ ప్రొవైడర్ డీజర్ తెరిచింది కాంప్లెక్స్ ఆడియో కంపోజిషన్‌ల నుండి సౌండ్ సోర్స్‌లను వేరు చేయడానికి మెషీన్ లెర్నింగ్ సిస్టమ్‌ను అభివృద్ధి చేసే ప్రయోగాత్మక ప్రాజెక్ట్ స్ప్లీటర్ యొక్క మూల గ్రంథాలు. ప్రోగ్రామ్ మిమ్మల్ని కంపోజిషన్ నుండి గాత్రాన్ని తీసివేయడానికి మరియు సంగీత సహవాయిద్యాన్ని మాత్రమే వదిలివేయడానికి, వ్యక్తిగత వాయిద్యాల ధ్వనిని మార్చడానికి లేదా సంగీతాన్ని విస్మరించడానికి మరియు మరొక సౌండ్ సిరీస్‌తో అతివ్యాప్తి చేయడానికి, మిక్స్‌లు, కచేరీ లేదా ట్రాన్స్‌క్రిప్షన్‌ను రూపొందించడానికి వాయిస్‌ని వదిలివేయడానికి మిమ్మల్ని అనుమతిస్తుంది. ప్రాజెక్ట్ కోడ్ Tensorflow ఇంజిన్ ఉపయోగించి పైథాన్‌లో వ్రాయబడింది మరియు ద్వారా పంపిణీ చేయబడింది MIT లైసెన్స్ కింద.

లోడ్ చేయడం కోసం ఇచ్చింది వోకల్స్, డ్రమ్స్, బాస్, పియానో ​​మరియు మిగిలిన సౌండ్‌లతో సహా 4 మరియు 5 స్ట్రీమ్‌లుగా విభజించడానికి, అలాగే XNUMX మరియు XNUMX స్ట్రీమ్‌లుగా విభజించడానికి గాత్రాన్ని (ఒక వాయిస్) వేరు చేయడానికి ఇప్పటికే శిక్షణ పొందిన నమూనాలు. స్ప్లీటర్‌ను పైథాన్ లైబ్రరీగా మరియు స్వతంత్ర కమాండ్ లైన్ యుటిలిటీగా ఉపయోగించవచ్చు. సరళమైన సందర్భంలో, సోర్స్ ఫైల్ ఆధారంగా సృష్టించారు వాయిస్ మరియు అనుబంధ భాగాలతో రెండు, నాలుగు లేదా ఐదు ఫైల్‌లు (vocals.wav, drums.wav, bass.wav, piano.wav, other.wav).

2 మరియు 4 స్ట్రీమ్‌లుగా విభజించబడినప్పుడు, స్ప్లీటర్ చాలా ఎక్కువ పనితీరును అందిస్తుంది, ఉదాహరణకు, GPUని ఉపయోగిస్తున్నప్పుడు, ఆడియో ఫైల్‌ను 4 స్ట్రీమ్‌లుగా విభజించడానికి అసలు కూర్పు వ్యవధి కంటే 100 రెట్లు తక్కువ సమయం పడుతుంది. NVIDIA GeForce GTX 1080 GPU మరియు 32-కోర్ ఇంటెల్ జియాన్ గోల్డ్ 6134 CPU ఉన్న సిస్టమ్‌లో, మూడు గంటల 27 నిమిషాల పాటు ఉండే musDB పరీక్ష సేకరణ 90 సెకన్లలో ప్రాసెస్ చేయబడింది.

స్ప్లీటర్ కోసం ఓపెన్ సోర్స్, సంగీతం మరియు వాయిస్‌ని వేరు చేసే వ్యవస్థ



స్ప్లీటర్ యొక్క ప్రయోజనాలలో, ఓపెన్ సోర్స్ ప్రాజెక్ట్ వంటి ఆడియో సెపరేషన్ రంగంలోని ఇతర పరిణామాలతో పోలిస్తే ఓపెన్-అన్‌మిక్స్, సౌండ్ ఫైల్‌ల యొక్క విస్తృతమైన సేకరణ నుండి నిర్మించబడిన అధిక నాణ్యత మోడల్‌ల వినియోగాన్ని ప్రస్తావిస్తుంది. కాపీరైట్ పరిమితుల కారణంగా, మెషీన్ లెర్నింగ్ పరిశోధకులు సంగీత ఫైళ్ల యొక్క చాలా తక్కువ పబ్లిక్ సేకరణలకు ప్రాప్యత చేయడానికి పరిమితం చేయబడ్డారు, అయితే స్ప్లీటర్ యొక్క నమూనాలు డీజర్ యొక్క విస్తారమైన సంగీత కేటలాగ్ నుండి డేటాను ఉపయోగించి నిర్మించబడ్డాయి.

పోలిక ఓపెన్-అన్‌మిక్స్‌తో, స్ప్లీటర్ యొక్క విభజన సాధనం CPUలో పరీక్షించినప్పుడు దాదాపు 35% వేగంగా ఉంటుంది, MP3 ఫైల్‌లకు మద్దతు ఇస్తుంది మరియు గమనించదగ్గ మెరుగైన ఫలితాలను ఉత్పత్తి చేస్తుంది (ఓపెన్-అన్‌మిక్స్‌లో సింగిల్ వాయిస్‌లు కొన్ని సాధనాల జాడలను వదిలివేస్తాయి, దీనికి కారణం మోడల్స్ ఓపెన్-అన్మిక్స్ కేవలం 150 కంపోజిషన్ల సేకరణపై శిక్షణ పొందింది).

మూలం: opennet.ru

ఒక వ్యాఖ్యను జోడించండి