Τα νευρωνικά δίκτυα έχουν φέρει την ποιότητα της σύνθεσης της ρωσικής ομιλίας σε ένα νέο επίπεδο

Ο όμιλος εταιρειών MDG, μέρος του οικοσυστήματος της Sberbank, ανακοίνωσε την ανάπτυξη μιας προηγμένης πλατφόρμας σύνθεσης ομιλίας, η οποία λέγεται ότι διασφαλίζει την ομαλή και εκφραστική ανάγνωση οποιουδήποτε κειμένου.

Η λύση που παρουσιάζεται είναι η τρίτη γενιά του συστήματος σύνθεσης ομιλίας. Τα σήματα ήχου υψηλής ποιότητας παράγονται από πολύπλοκα μοντέλα νευρωνικών δικτύων. Οι προγραμματιστές ισχυρίζονται ότι το αποτέλεσμα αυτών των αλγορίθμων είναι η πιο ρεαλιστική σύνθεση της ρωσικής ομιλίας.

Τα νευρωνικά δίκτυα έχουν φέρει την ποιότητα της σύνθεσης της ρωσικής ομιλίας σε ένα νέο επίπεδο

Η πλατφόρμα περιλαμβάνει μια ενότητα για την πρόβλεψη του στρες σε λέξεις που δεν βρίσκονται ακόμη στο βασικό λεξικό. Επιπλέον, παρέχεται αυτόματη διόρθωση κοινών ορθογραφικών λαθών. Χάρη στη βαθιά γλωσσική ανάλυση του κειμένου, η προφορά θα αντιστοιχεί στους κανόνες της γλώσσας ακόμη και σε δύσκολες περιπτώσεις.

Ένα άλλο πλεονέκτημα της πλατφόρμας είναι ότι δεν απαιτεί ακριβούς διακομιστές εξοπλισμένους με επιταχυντές GPU. Μπορείτε να χρησιμοποιήσετε την τεχνολογία με δύο τρόπους: μέσω μιας υπηρεσίας cloud ή ενσωματώνοντάς την στη δική σας λύση.


Τα νευρωνικά δίκτυα έχουν φέρει την ποιότητα της σύνθεσης της ρωσικής ομιλίας σε ένα νέο επίπεδο

Μεταξύ των πιθανών τομέων εφαρμογής της ανάπτυξης είναι τα chatbot και οι βοηθοί φωνής, οι υπηρεσίες πληροφοριών και ειδοποιήσεων, οι υπηρεσίες φωνής με άμεση σύνθεση οποιουδήποτε κειμένου κατά τη διάρκεια μιας κλήσης κ.λπ.

«Σε αυτοματοποιημένα σενάρια επικοινωνίας με πελάτες, η τεχνολογία σάς επιτρέπει να αλληλεπιδράτε μεμονωμένα με κάθε συνδρομητή, καθώς δεν υπάρχουν σταθερά μηνύματα και μπορεί να συντεθεί οποιοδήποτε κείμενο κατά τη διάρκεια της κλήσης», λένε οι προγραμματιστές.

Μπορείτε να δοκιμάσετε την τεχνολογία εδώ



Πηγή: 3dnews.ru

Προσθέστε ένα σχόλιο