سپلیٹر کے لیے اوپن سورس، موسیقی اور آواز کو الگ کرنے کا نظام

اسٹریمنگ فراہم کنندہ ڈیزر کھلا تجرباتی پروجیکٹ سپلیٹر کے ماخذ متن، جو آواز کے ذرائع کو پیچیدہ آڈیو کمپوزیشن سے الگ کرنے کے لیے مشین لرننگ سسٹم تیار کرتا ہے۔ یہ پروگرام آپ کو کسی کمپوزیشن سے آواز کو ہٹانے اور صرف موسیقی کے ساتھ چھوڑنے، انفرادی آلات کی آواز میں ہیرا پھیری کرنے، یا موسیقی کو ضائع کرنے اور آواز کو کسی اور ساؤنڈ سیریز کے ساتھ اوورلینگ کے لیے چھوڑنے، مکس، کراوکی یا ٹرانسکرپشن بنانے کی اجازت دیتا ہے۔ پروجیکٹ کوڈ Tensorflow انجن کا استعمال کرتے ہوئے Python میں لکھا گیا ہے۔ نے بانٹا MIT لائسنس کے تحت.

لوڈنگ کے لیے پیش کیے جاتے ہیں آواز (ایک آواز) کو ساتھ سے الگ کرنے کے ساتھ ساتھ 4 اور 5 اسٹریمز میں تقسیم کرنے کے لیے پہلے سے تربیت یافتہ ماڈلز، جن میں آواز، ڈرم، باس، پیانو اور باقی آواز شامل ہیں۔ سپلیٹر کو ازگر کی لائبریری اور اسٹینڈ اکیلی کمانڈ لائن یوٹیلیٹی کے طور پر استعمال کیا جا سکتا ہے۔ آسان ترین صورت میں، سورس فائل کی بنیاد پر پیدا کیا آواز اور ساتھ والے اجزاء والی دو، چار یا پانچ فائلیں (vocals.wav، drums.wav، bass.wav، piano.wav، other.wav)۔

2 اور 4 تھریڈز میں تقسیم ہونے پر، Spleeter بہت اعلی کارکردگی فراہم کرتا ہے، مثال کے طور پر، GPU استعمال کرتے وقت، ایک آڈیو فائل کو 4 تھریڈز میں تقسیم کرنے میں اصل کمپوزیشن کی مدت سے 100 گنا کم وقت لگتا ہے۔ NVIDIA GeForce GTX 1080 GPU اور 32-core Intel Xeon Gold 6134 CPU والے سسٹم پر، musDB ٹیسٹ کلیکشن، جو تین گھنٹے اور 27 منٹ تک جاری رہا، 90 سیکنڈ میں پروسیس ہوا۔

سپلیٹر کے لیے اوپن سورس، موسیقی اور آواز کو الگ کرنے کا نظام



سپلیٹر کے فوائد میں، آڈیو علیحدگی کے میدان میں ہونے والی دیگر پیشرفتوں کے مقابلے، جیسے اوپن سورس پروجیکٹ اوپن-ان مکس، صوتی فائلوں کے وسیع مجموعہ سے بنائے گئے اعلی معیار کے ماڈلز کے استعمال کا ذکر کرتا ہے۔ کاپی رائٹ کی پابندیوں کی وجہ سے، مشین لرننگ کے محققین موسیقی کی فائلوں کے کافی کم عوامی مجموعوں تک رسائی تک محدود ہیں، جبکہ Spleeter کے ماڈل Deezer کے وسیع میوزک کیٹلاگ کے ڈیٹا کا استعمال کرتے ہوئے بنائے گئے تھے۔

پر موازنہ Open-Unmix کے ساتھ، Spleeter کا الگ کرنے والا ٹول تقریباً 35% تیز ہوتا ہے جب CPU پر ٹیسٹ کیا جاتا ہے، MP3 فائلوں کو سپورٹ کرتا ہے، اور نمایاں طور پر بہتر نتائج پیدا کرتا ہے (Open-Unmix میں گانے والی آوازیں کچھ ٹولز کے نشانات چھوڑ دیتی ہیں، جس کی وجہ ممکنہ طور پر اس حقیقت کی وجہ ہے۔ Open-Unmix ماڈلز کو صرف 150 کمپوزیشنز کے مجموعے پر تربیت دی جاتی ہے)۔

ماخذ: opennet.ru

نیا تبصرہ شامل کریں