Google hat die fehlenden Quellen für den Lyra-Audiocodec geöffnet

Google hat ein Update für den Audio-Codec Lyra 0.0.2 veröffentlicht, der für maximale Sprachqualität bei Verwendung sehr langsamer Kommunikationskanäle optimiert ist. Der Codec wurde Anfang April eröffnet, jedoch in Verbindung mit einer proprietären mathematischen Bibliothek geliefert. In Version 0.0.2 wurde dieser Nachteil beseitigt und ein offener Ersatz für die angegebene Bibliothek erstellt – sparse_matmul, die wie der Codec selbst unter der Apache 2.0-Lizenz vertrieben wird. Zu den weiteren Verbesserungen gehören die Möglichkeit, das Bazel-Build-System mit dem GCC-Compiler zu verwenden und dieses Bundle standardmäßig in Linux anstelle von Bazel+Clang zu verwenden.

Erinnern wir uns daran, dass Lyra in Bezug auf die Qualität der übertragenen Sprachdaten bei niedrigen Geschwindigkeiten herkömmlichen Codecs, die digitale Signalverarbeitungsmethoden verwenden, deutlich überlegen ist. Um eine qualitativ hochwertige Sprachübertragung bei begrenzter Menge an übertragenen Informationen zu erreichen, verwendet Lyra zusätzlich zu herkömmlichen Methoden der Audiokomprimierung und Signalumwandlung ein Sprachmodell, das auf einem maschinellen Lernsystem basiert, mit dem Sie die fehlenden Informationen basierend auf neu erstellen können typische Sprachmerkmale. Das zur Tonerzeugung verwendete Modell wurde anhand mehrerer Tausend Stunden Sprachaufzeichnungen in mehr als 70 Sprachen trainiert. Die Leistung der vorgeschlagenen Implementierung reicht für die Sprachkodierung und -dekodierung in Echtzeit auf Smartphones der mittleren Preisklasse aus, mit einer Signalübertragungsverzögerung von 90 Millisekunden.

Source: opennet.ru

Kommentar hinzufügen