שחרור של סינתיסייזר דיבור RHVoice 1.2.4, שפותח עבור השפה הרוסית

פרסום מערכת סינתזת הדיבור הפתוחה RHVoice 1.2.4, שפותחה בתחילה כדי לספק תמיכה באיכות גבוהה לשפה הרוסית, אך לאחר מכן מותאמת לשפות אחרות, כולל אנגלית, פורטוגזית, אוקראינית, קירגיזית, טטארית וגיאורגית. הקוד כתוב ב-C++ ומופץ תחת רישיון LGPL 2.1. תומך בעבודה על GNU/Linux, Windows ואנדרואיד. התוכנית תואמת לממשקי TTS (טקסט לדיבור) סטנדרטיים להמרת טקסט לדיבור: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) ו-Android Text-To-Speech API, אך ניתן להשתמש בה גם ב-NVDA קורא מסך.

התוכנית משתמשת בשיטת סינתזה פרמטרית עם מודלים סטטיסטיים (Statistical Parametric Synthesis על בסיס HMM - Hidden Markov Model). היתרון של המודל הסטטיסטי הוא עלויות תקורה נמוכות וכוח מעבד לא תובעני. כל הפעולות מתבצעות באופן מקומי במערכת המשתמש. שלוש רמות של איכות דיבור נתמכות (ככל שהאיכות נמוכה יותר, הביצועים גבוהים יותר וזמן התגובה קצר יותר).

תומך בהגדרה ושינוי של קולות. קיימות 9 אפשרויות קוליות זמינות עבור השפה הרוסית, ו-5 עבור אנגלית. הקולות נוצרים על סמך הקלטות של דיבור טבעי. עקב שימוש במודל סטטיסטי, איכות ההגייה אינה מגיעה לרמה של סינתיסייזרים המייצרים דיבור על בסיס שילוב של שברי דיבור טבעי, אך למרות זאת התוצאה מובנת למדי ומזכירה שידור של הקלטה מרמקול. .

בהגדרות ניתן לשנות את המהירות, הגובה והווליום. ניתן להשתמש בספריית Sonic כדי לשנות את הקצב. ניתן לזהות ולהחליף שפות באופן אוטומטי על סמך ניתוח של טקסט הקלט (לדוגמה, עבור מילים וציטוטים בשפה אחרת, ניתן להשתמש במודל סינתזה שמקורו בשפה זו). פרופילי קול נתמכים, המגדירים שילובים של קולות עבור שפות שונות.

מקור: OpenNet.ru

הוספת תגובה