స్ప్లీటర్ కోసం ఓపెన్ సోర్స్, సంగీతం మరియు వాయిస్ని వేరు చేసే వ్యవస్థ
స్ట్రీమింగ్ ప్రొవైడర్ డీజర్ తెరిచింది కాంప్లెక్స్ ఆడియో కంపోజిషన్ల నుండి సౌండ్ సోర్స్లను వేరు చేయడానికి మెషీన్ లెర్నింగ్ సిస్టమ్ను అభివృద్ధి చేసే ప్రయోగాత్మక ప్రాజెక్ట్ స్ప్లీటర్ యొక్క మూల గ్రంథాలు. ప్రోగ్రామ్ మిమ్మల్ని కంపోజిషన్ నుండి గాత్రాన్ని తీసివేయడానికి మరియు సంగీత సహవాయిద్యాన్ని మాత్రమే వదిలివేయడానికి, వ్యక్తిగత వాయిద్యాల ధ్వనిని మార్చడానికి లేదా సంగీతాన్ని విస్మరించడానికి మరియు మరొక సౌండ్ సిరీస్తో అతివ్యాప్తి చేయడానికి, మిక్స్లు, కచేరీ లేదా ట్రాన్స్క్రిప్షన్ను రూపొందించడానికి వాయిస్ని వదిలివేయడానికి మిమ్మల్ని అనుమతిస్తుంది. ప్రాజెక్ట్ కోడ్ Tensorflow ఇంజిన్ ఉపయోగించి పైథాన్లో వ్రాయబడింది మరియు ద్వారా పంపిణీ చేయబడింది MIT లైసెన్స్ కింద.
లోడ్ చేయడం కోసం ఇచ్చింది వోకల్స్, డ్రమ్స్, బాస్, పియానో మరియు మిగిలిన సౌండ్లతో సహా 4 మరియు 5 స్ట్రీమ్లుగా విభజించడానికి, అలాగే XNUMX మరియు XNUMX స్ట్రీమ్లుగా విభజించడానికి గాత్రాన్ని (ఒక వాయిస్) వేరు చేయడానికి ఇప్పటికే శిక్షణ పొందిన నమూనాలు. స్ప్లీటర్ను పైథాన్ లైబ్రరీగా మరియు స్వతంత్ర కమాండ్ లైన్ యుటిలిటీగా ఉపయోగించవచ్చు. సరళమైన సందర్భంలో, సోర్స్ ఫైల్ ఆధారంగా సృష్టించారు వాయిస్ మరియు అనుబంధ భాగాలతో రెండు, నాలుగు లేదా ఐదు ఫైల్లు (vocals.wav, drums.wav, bass.wav, piano.wav, other.wav).
2 మరియు 4 స్ట్రీమ్లుగా విభజించబడినప్పుడు, స్ప్లీటర్ చాలా ఎక్కువ పనితీరును అందిస్తుంది, ఉదాహరణకు, GPUని ఉపయోగిస్తున్నప్పుడు, ఆడియో ఫైల్ను 4 స్ట్రీమ్లుగా విభజించడానికి అసలు కూర్పు వ్యవధి కంటే 100 రెట్లు తక్కువ సమయం పడుతుంది. NVIDIA GeForce GTX 1080 GPU మరియు 32-కోర్ ఇంటెల్ జియాన్ గోల్డ్ 6134 CPU ఉన్న సిస్టమ్లో, మూడు గంటల 27 నిమిషాల పాటు ఉండే musDB పరీక్ష సేకరణ 90 సెకన్లలో ప్రాసెస్ చేయబడింది.
న పోలిక ఓపెన్-అన్మిక్స్తో, స్ప్లీటర్ యొక్క విభజన సాధనం CPUలో పరీక్షించినప్పుడు దాదాపు 35% వేగంగా ఉంటుంది, MP3 ఫైల్లకు మద్దతు ఇస్తుంది మరియు గమనించదగ్గ మెరుగైన ఫలితాలను ఉత్పత్తి చేస్తుంది (ఓపెన్-అన్మిక్స్లో సింగిల్ వాయిస్లు కొన్ని సాధనాల జాడలను వదిలివేస్తాయి, దీనికి కారణం మోడల్స్ ఓపెన్-అన్మిక్స్ కేవలం 150 కంపోజిషన్ల సేకరణపై శిక్షణ పొందింది).