روسی زبان کے لیے تیار کردہ اسپیچ سنتھیسائزر RHVoice 1.2.4 کی ریلیز

اوپن سپیچ سنتھیسز سسٹم RHVoice 1.2.4 کا اجراء شائع ہو چکا ہے، ابتدائی طور پر روسی زبان کے لیے اعلیٰ معیار کی مدد فراہم کرنے کے لیے تیار کیا گیا تھا، لیکن پھر انگریزی، پرتگالی، یوکرینی، کرغیز، تاتار اور جارجیائی سمیت دیگر زبانوں کے لیے ڈھال لیا گیا۔ کوڈ C++ میں لکھا گیا ہے اور LGPL 2.1 لائسنس کے تحت تقسیم کیا گیا ہے۔ GNU/Linux، Windows اور Android پر کام کی حمایت کرتا ہے۔ یہ پروگرام متن کو تقریر میں تبدیل کرنے کے لیے معیاری TTS (ٹیکسٹ ٹو اسپیچ) انٹرفیس کے ساتھ مطابقت رکھتا ہے: SAPI5 (ونڈوز)، اسپیچ ڈسپیچر (GNU/Linux) اور Android Text-to-Speech API، لیکن NVDA میں بھی استعمال کیا جا سکتا ہے۔ سکرین ریڈر.

یہ پروگرام شماریاتی ماڈلز کے ساتھ پیرامیٹرک ترکیب کا طریقہ استعمال کرتا ہے (HMM - پوشیدہ مارکوف ماڈل پر مبنی شماریاتی پیرامیٹرک ترکیب)۔ شماریاتی ماڈل کا فائدہ کم اوور ہیڈ لاگت اور غیر ضروری CPU پاور ہے۔ تمام آپریشنز مقامی طور پر صارف کے سسٹم پر کیے جاتے ہیں۔ تقریر کے معیار کی تین سطحوں کی حمایت کی جاتی ہے (جتنا کم معیار ہوگا، کارکردگی اتنی ہی زیادہ ہوگی اور ردعمل کا وقت اتنا ہی کم ہوگا)۔

آوازوں کو ترتیب دینے اور تبدیل کرنے کی حمایت کرتا ہے۔ روسی زبان کے لیے 9 آواز کے اختیارات دستیاب ہیں اور انگریزی کے لیے 5۔ آوازیں قدرتی تقریر کی ریکارڈنگ کی بنیاد پر بنتی ہیں۔ شماریاتی ماڈل کے استعمال کی وجہ سے، تلفظ کا معیار ان سنتھیسائزرز کی سطح تک نہیں پہنچ پاتا جو فطری تقریر کے ٹکڑوں کے مجموعے کی بنیاد پر تقریر پیدا کرتے ہیں، لیکن اس کے باوجود نتیجہ کافی قابل فہم ہے اور لاؤڈ اسپیکر سے ریکارڈنگ کی نشریات سے مشابہ ہے۔ .

سیٹنگز میں آپ رفتار، پچ اور والیوم تبدیل کر سکتے ہیں۔ آواز کی لائبریری کو ٹیمپو کو تبدیل کرنے کے لیے استعمال کیا جا سکتا ہے۔ ان پٹ ٹیکسٹ کے تجزیہ کی بنیاد پر زبانوں کا خود بخود پتہ لگانا اور تبدیل کرنا ممکن ہے (مثال کے طور پر، کسی دوسری زبان میں الفاظ اور اقتباسات کے لیے، اس زبان کا ایک ترکیبی ماڈل استعمال کیا جا سکتا ہے)۔ صوتی پروفائلز معاون ہیں، مختلف زبانوں کے لیے آوازوں کے امتزاج کی وضاحت کرتے ہیں۔

ماخذ: opennet.ru

نیا تبصرہ شامل کریں