RHVoice 1.6.0 اسپیچ سنتھیسائزر کی ریلیز

اوپن سپیچ سنتھیسز سسٹم RHVoice 1.6.0 جاری کیا گیا تھا، ابتدائی طور پر روسی زبان کے لیے اعلیٰ معیار کی مدد فراہم کرنے کے لیے تیار کیا گیا تھا، لیکن پھر انگریزی، پرتگالی، یوکرینی، کرغیز، تاتار اور جارجیائی سمیت دیگر زبانوں کے لیے ڈھال لیا گیا۔ کوڈ C++ میں لکھا گیا ہے اور LGPL 2.1 لائسنس کے تحت تقسیم کیا گیا ہے۔ GNU/Linux، Windows اور Android پر کام کی حمایت کرتا ہے۔ یہ پروگرام متن کو تقریر میں تبدیل کرنے کے لیے معیاری TTS (ٹیکسٹ ٹو اسپیچ) انٹرفیس کے ساتھ مطابقت رکھتا ہے: SAPI5 (ونڈوز)، اسپیچ ڈسپیچر (GNU/Linux) اور Android Text-to-Speech API، لیکن NVDA میں بھی استعمال کیا جا سکتا ہے۔ سکرین ریڈر. RHVoice کی خالق اور مرکزی ڈویلپر اولگا Yakovleva ہیں، جو مکمل طور پر نابینا ہونے کے باوجود اس پروجیکٹ کو تیار کرتی ہیں۔

В новой версии добавлено 5 новых вариантов голосов для русской речи. Реализована поддержка албанского языка. Обновлён словарь для украинского языка. Расширена поддержка озвучивания символов emoji. Проведена работа по устранению ошибок в приложении для платформы Android, упрощён импорт пользовательских словарей, а также добавлена поддержка платформы Android 11. В ядро движка добавлены новые настройки и функциональные возможности, включая g2p.case, word_break и поддержку фильтров эквализации.

ہمیں یاد کرنے دیں کہ RHVoice HTS پروجیکٹ (HMM/DNN-based Speech Synthesis System) کی ترقی اور شماریاتی ماڈلز کے ساتھ پیرامیٹرک ترکیب کا طریقہ استعمال کرتا ہے (Statistical Parametric Synthesis based on HMM - Hidden Markov Model)۔ شماریاتی ماڈل کا فائدہ کم اوور ہیڈ لاگت اور غیر ضروری CPU پاور ہے۔ تمام آپریشنز مقامی طور پر صارف کے سسٹم پر کیے جاتے ہیں۔ تقریر کے معیار کی تین سطحوں کی حمایت کی جاتی ہے (جتنا کم معیار ہوگا، کارکردگی اتنی ہی زیادہ ہوگی اور ردعمل کا وقت اتنا ہی کم ہوگا)۔

شماریاتی ماڈل کا منفی پہلو تلفظ کا نسبتاً کم معیار ہے، جو قدرتی تقریر کے ٹکڑوں کے مجموعے پر مبنی تقریر پیدا کرنے والے ترکیب سازوں کی سطح تک نہیں پہنچتا، لیکن اس کے باوجود نتیجہ کافی واضح ہے اور لاؤڈ اسپیکر سے ریکارڈنگ نشر کرنے سے مشابہ ہے۔ . مقابلے کے لیے، سلیرو پروجیکٹ، جو مشین لرننگ ٹیکنالوجیز پر مبنی اوپن اسپیچ سنتھیسز انجن فراہم کرتا ہے اور روسی زبان کے لیے ماڈلز کا ایک سیٹ، معیار میں RHVoice سے بہتر ہے۔

روسی زبان کے لیے 13 آواز کے اختیارات دستیاب ہیں، اور انگریزی کے لیے 5 آوازیں قدرتی تقریر کی ریکارڈنگ پر مبنی ہیں۔ سیٹنگز میں آپ رفتار، پچ اور والیوم تبدیل کر سکتے ہیں۔ آواز کی لائبریری کا استعمال ٹیمپو کو تبدیل کرنے کے لیے کیا جا سکتا ہے۔ ان پٹ ٹیکسٹ کے تجزیہ کی بنیاد پر زبانوں کا خود بخود پتہ لگانا اور تبدیل کرنا ممکن ہے (مثال کے طور پر، کسی دوسری زبان میں الفاظ اور اقتباسات کے لیے، اس زبان کا ایک ترکیبی ماڈل استعمال کیا جا سکتا ہے)۔ مختلف زبانوں کے لیے آوازوں کے امتزاج کی وضاحت کرتے ہوئے صوتی پروفائلز معاون ہیں۔

ماخذ: opennet.ru

نیا تبصرہ شامل کریں