إصدار آلة النطق RHVoice 1.2.4 ، المطورة للغة الروسية

تم نشر إصدار نظام تركيب الكلام المفتوح RHVoice 1.2.4، والذي تم تطويره في البداية لتوفير دعم عالي الجودة للغة الروسية، ولكن بعد ذلك تم تكييفه مع لغات أخرى، بما في ذلك الإنجليزية والبرتغالية والأوكرانية والقيرغيزية والتتارية والجورجية. الكود مكتوب بلغة C++ ويتم توزيعه بموجب ترخيص LGPL 2.1. يدعم العمل على أنظمة جنو/لينكس، وويندوز، وأندرويد. البرنامج متوافق مع واجهات TTS (تحويل النص إلى كلام) القياسية لتحويل النص إلى كلام: SAPI5 (Windows)، Speech Dispatcher (GNU/Linux) وAndroid Text-To-Speech API، ولكن يمكن استخدامه أيضًا في NVDA قارئ الشاشة.

يستخدم البرنامج أسلوب التوليف البارامترى مع النماذج الإحصائية (التوليف البارامترى الإحصائي على أساس HMM - نموذج ماركوف المخفي). تتمثل ميزة النموذج الإحصائي في انخفاض التكاليف العامة وقوة وحدة المعالجة المركزية المتساهلة. يتم تنفيذ جميع العمليات محليًا على نظام المستخدم. يتم دعم ثلاثة مستويات لجودة الكلام (كلما انخفضت الجودة، زاد الأداء وقل وقت الاستجابة).

يدعم ضبط وتغيير الأصوات. هناك 9 خيارات صوتية متاحة للغة الروسية، و5 للغة الإنجليزية، ويتم تشكيل الأصوات بناءً على تسجيلات الكلام الطبيعي. نظرًا لاستخدام النموذج الإحصائي، فإن جودة النطق لا تصل إلى مستوى المُركِّبات التي تولد الكلام بناءً على مجموعة من أجزاء الكلام الطبيعي، ولكن مع ذلك تكون النتيجة واضحة تمامًا وتشبه بث تسجيل من مكبر الصوت .

في الإعدادات، يمكنك تغيير السرعة ودرجة الصوت ومستوى الصوت. يمكن استخدام مكتبة Sonic لتغيير الإيقاع. من الممكن اكتشاف اللغات وتبديلها تلقائيًا بناءً على تحليل نص الإدخال (على سبيل المثال، بالنسبة للكلمات والاقتباسات في لغة أخرى، يمكن استخدام نموذج تركيبي أصلي لتلك اللغة). يتم دعم ملفات تعريف الصوت، مما يتيح تحديد مجموعات من الأصوات للغات مختلفة.

المصدر: opennet.ru

إضافة تعليق