RHVoice 1.6.0 اسپیچ سنتھیسائزر کی ریلیز

RHVoice 1.6.0، ایک اوپن سورس اسپیچ سنتھیسس سسٹم، جاری کیا گیا ہے۔ ابتدائی طور پر روسی کے لیے اعلیٰ معیار کی مدد فراہم کرنے کے لیے تیار کیا گیا تھا، اس کے بعد اسے انگریزی، پرتگالی، یوکرینی، کرغیز، تاتار اور جارجیائی سمیت دیگر زبانوں کے لیے ڈھال لیا گیا ہے۔ کوڈ C++ میں لکھا گیا ہے اور LGPL 2.1 لائسنس کے تحت تقسیم کیا گیا ہے۔ GNU/Linux سپورٹ بھی سپورٹ ہے۔Linux, Windows и Android. یہ پروگرام متن کو تقریر میں تبدیل کرنے کے لیے عام TTS (ٹیکسٹ ٹو اسپیچ) انٹرفیس کے ساتھ مطابقت رکھتا ہے: SAPI5 (Windows)، اسپیچ ڈسپیچر (GNU/Linux) اور Android ٹیکسٹ ٹو اسپیچ API، لیکن NVDA اسکرین ریڈر کے ساتھ بھی استعمال کیا جا سکتا ہے۔ RHVoice کی خالق اور مرکزی ڈویلپر اولگا Yakovleva ہیں، جو مکمل طور پر نابینا ہونے کے باوجود اس پروجیکٹ کو تیار کرنا جاری رکھے ہوئے ہیں۔

نئے ورژن میں روسی تقریر کے لیے آواز کے 5 نئے اختیارات شامل کیے گئے ہیں۔ البانی زبان کی حمایت کو نافذ کیا گیا ہے۔ یوکرینی لغت کو اپ ڈیٹ کر دیا گیا ہے۔ ایموجی تلفظ کے لیے سپورٹ کو بڑھا دیا گیا ہے۔ پلیٹ فارم ایپ میں بگ فکسز لاگو کر دی گئی ہیں۔ Android، صارف لغات کی درآمد کو آسان بنا دیا گیا ہے، اور پلیٹ فارم سپورٹ کو شامل کیا گیا ہے۔ Android 11. انجن کور میں نئی ​​ترتیبات اور فعالیت شامل کی گئی ہیں، بشمول g2p.case، word_break، اور مساوات کے فلٹرز کے لیے سپورٹ۔

ہمیں یاد کرنے دیں کہ RHVoice HTS پروجیکٹ (HMM/DNN-based Speech Synthesis System) کی ترقی اور شماریاتی ماڈلز کے ساتھ پیرامیٹرک ترکیب کا طریقہ استعمال کرتا ہے (Statistical Parametric Synthesis based on HMM - Hidden Markov Model)۔ شماریاتی ماڈل کا فائدہ کم اوور ہیڈ لاگت اور غیر ضروری CPU پاور ہے۔ تمام آپریشنز مقامی طور پر صارف کے سسٹم پر کیے جاتے ہیں۔ تقریر کے معیار کی تین سطحوں کی حمایت کی جاتی ہے (جتنا کم معیار ہوگا، کارکردگی اتنی ہی زیادہ ہوگی اور ردعمل کا وقت اتنا ہی کم ہوگا)۔

شماریاتی ماڈل کا منفی پہلو تلفظ کا نسبتاً کم معیار ہے، جو قدرتی تقریر کے ٹکڑوں کے مجموعے پر مبنی تقریر پیدا کرنے والے ترکیب سازوں کی سطح تک نہیں پہنچتا، لیکن اس کے باوجود نتیجہ کافی واضح ہے اور لاؤڈ اسپیکر سے ریکارڈنگ نشر کرنے سے مشابہ ہے۔ . مقابلے کے لیے، سلیرو پروجیکٹ، جو مشین لرننگ ٹیکنالوجیز پر مبنی اوپن اسپیچ سنتھیسز انجن فراہم کرتا ہے اور روسی زبان کے لیے ماڈلز کا ایک سیٹ، معیار میں RHVoice سے بہتر ہے۔

روسی زبان کے لیے 13 آواز کے اختیارات دستیاب ہیں، اور انگریزی کے لیے 5 آوازیں قدرتی تقریر کی ریکارڈنگ پر مبنی ہیں۔ سیٹنگز میں آپ رفتار، پچ اور والیوم تبدیل کر سکتے ہیں۔ آواز کی لائبریری کا استعمال ٹیمپو کو تبدیل کرنے کے لیے کیا جا سکتا ہے۔ ان پٹ ٹیکسٹ کے تجزیہ کی بنیاد پر زبانوں کا خود بخود پتہ لگانا اور تبدیل کرنا ممکن ہے (مثال کے طور پر، کسی دوسری زبان میں الفاظ اور اقتباسات کے لیے، اس زبان کا ایک ترکیبی ماڈل استعمال کیا جا سکتا ہے)۔ مختلف زبانوں کے لیے آوازوں کے امتزاج کی وضاحت کرتے ہوئے صوتی پروفائلز معاون ہیں۔

ماخذ: opennet.ru

DDoS تحفظ، VPS VDS سرورز والی سائٹوں کے لیے قابل اعتماد ہوسٹنگ خریدیں۔ DDoS تحفظ، VPS VDS سرورز کے ساتھ قابل اعتماد ویب سائٹ ہوسٹنگ خریدیں۔ ProHoster