שחרור סינתיסייזר דיבור RHVoice 1.8.0

מערכת סינתזת הדיבור הפתוחה RHVoice 1.8.0 שוחררה, שפותחה בתחילה כדי לספק תמיכה באיכות גבוהה לשפה הרוסית, אך לאחר מכן הותאמה לשפות אחרות, כולל אנגלית, פורטוגזית, אוקראינית, קירגיזית, טטארית וגיאורגית. הקוד כתוב ב-C++ ומופץ תחת רישיון LGPL 2.1. תומך בעבודה על GNU/Linux, Windows ואנדרואיד. התוכנית תואמת לממשקי TTS (טקסט לדיבור) סטנדרטיים להמרת טקסט לדיבור: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) ו-Android Text-To-Speech API, אך ניתן להשתמש בה גם ב-NVDA קורא מסך. היוצרת והמפתחת הראשית של RHVoice היא אולגה יאקובלבה, המפתחת את הפרויקט למרות היותה עיוורת לחלוטין.

גרסה 1.8 לפלטפורמת אנדרואיד מציגה מערכת חדשה לניהול נתוני קול ושפה המאפשרת להוריד עדכוני נתונים קוליים מבלי לעדכן את האפליקציה לנייד. עדכוני נתונים עבור קולות ושפות שנוספו נבדקים באופן אוטומטי. בנוסף, המהדורה החדשה מציגה תמיכה בשפה הפולנית ומוסיפה קול חדש לשפה המקדונית. מובטחת תאימות עם גרסאות האלפא והביטא האחרונות של קורא המסך NVDA. תיקנו בעיות בבנייה על פלטפורמת לינוקס שהתרחשו כאשר Speech Dispatcher לא היה נוכח.

נזכיר כי RHVoice משתמשת בפיתוחי פרויקט HTS (מערכת סינתזה דיבור מבוססת HMM/DNN) ובשיטת הסינתזה הפרמטרית עם מודלים סטטיסטיים (Statistical Parametric Synthesis על בסיס HMM - Hidden Markov Model). היתרון של המודל הסטטיסטי הוא עלויות תקורה נמוכות וכוח מעבד לא תובעני. כל הפעולות מתבצעות באופן מקומי במערכת המשתמש. שלוש רמות של איכות דיבור נתמכות (ככל שהאיכות נמוכה יותר, הביצועים גבוהים יותר וזמן התגובה קצר יותר).

החיסרון של המודל הסטטיסטי הוא איכות ההגייה הנמוכה יחסית, שאינה מגיעה לרמה של סינתיסייזרים המייצרים דיבור על בסיס שילוב של קטעי דיבור טבעי, אך למרות זאת התוצאה קריאה למדי ודומה לשידור הקלטה מרמקול. . לשם השוואה, פרויקט Silero, המספק מנוע סינתזת דיבור פתוח המבוסס על טכנולוגיות למידת מכונה ומערך מודלים לשפה הרוסית, עדיף באיכותו על פני RHVoice.

קיימות 14 אפשרויות קול זמינות עבור השפה הרוסית, ו-6 עבור אנגלית. הקולות נוצרים על סמך הקלטות של דיבור טבעי. בהגדרות ניתן לשנות את המהירות, הגובה והווליום. ניתן להשתמש בספריית Sonic כדי לשנות את הקצב. ניתן לזהות ולהחליף שפות באופן אוטומטי על סמך ניתוח של טקסט הקלט (לדוגמה, עבור מילים וציטוטים בשפה אחרת, ניתן להשתמש במודל סינתזה שמקורו בשפה זו). פרופילי קול נתמכים, המגדירים שילובים של קולות עבור שפות שונות.

מקור: OpenNet.ru

הוספת תגובה