గూగుల్ లైరా ఆడియో కోడెక్ కోసం తప్పిపోయిన మూలాలను తెరిచింది

Google Lyra 0.0.2 ఆడియో కోడెక్‌కు నవీకరణను ప్రచురించింది, ఇది చాలా నెమ్మదిగా కమ్యూనికేషన్ ఛానెల్‌లను ఉపయోగిస్తున్నప్పుడు గరిష్ట వాయిస్ నాణ్యతను సాధించడానికి అనుకూలీకరించబడింది. కోడెక్ ఏప్రిల్ ప్రారంభంలో తెరవబడింది, కానీ యాజమాన్య గణిత లైబ్రరీతో కలిసి సరఫరా చేయబడింది. వెర్షన్ 0.0.2లో, ఈ లోపం తొలగించబడింది మరియు పేర్కొన్న లైబ్రరీకి ఓపెన్ రీప్లేస్‌మెంట్ సృష్టించబడింది - sparse_matmul, ఇది కోడెక్ వలె Apache 2.0 లైసెన్స్ క్రింద పంపిణీ చేయబడుతుంది. ఇతర మెరుగుదలలలో GCC కంపైలర్‌తో Bazel బిల్డ్ సిస్టమ్‌ని ఉపయోగించగల సామర్థ్యం మరియు Bazel+Clangకి బదులుగా Linuxలో డిఫాల్ట్‌గా ఈ బండిల్‌ని ఉపయోగించడం వంటివి ఉన్నాయి.

తక్కువ వేగంతో ప్రసారం చేయబడిన వాయిస్ డేటా నాణ్యత పరంగా, డిజిటల్ సిగ్నల్ ప్రాసెసింగ్ పద్ధతులను ఉపయోగించే సాంప్రదాయ కోడెక్‌ల కంటే లైరా చాలా గొప్పదని గుర్తుచేసుకుందాం. ఆడియో కంప్రెషన్ మరియు సిగ్నల్ మార్పిడి యొక్క సాంప్రదాయిక పద్ధతులతో పాటు, పరిమిత మొత్తంలో ప్రసారం చేయబడిన సమాచారం యొక్క పరిస్థితులలో అధిక నాణ్యత గల వాయిస్ ట్రాన్స్‌మిషన్‌ను సాధించడానికి, లైరా మెషీన్ లెర్నింగ్ సిస్టమ్ ఆధారంగా స్పీచ్ మోడల్‌ను ఉపయోగిస్తుంది, దీని ఆధారంగా తప్పిపోయిన సమాచారాన్ని తిరిగి సృష్టించడానికి మిమ్మల్ని అనుమతిస్తుంది. సాధారణ ప్రసంగ లక్షణాలు. ధ్వనిని రూపొందించడానికి ఉపయోగించిన మోడల్ 70 కంటే ఎక్కువ భాషలలో అనేక వేల గంటల వాయిస్ రికార్డింగ్‌లను ఉపయోగించి శిక్షణ పొందింది. ప్రతిపాదిత అమలు యొక్క పనితీరు 90 మిల్లీసెకన్ల సిగ్నల్ ట్రాన్స్మిషన్ ఆలస్యంతో, మధ్య-ధర స్మార్ట్‌ఫోన్‌లలో నిజ-సమయ స్పీచ్ ఎన్‌కోడింగ్ మరియు డీకోడింగ్ కోసం సరిపోతుంది.

మూలం: opennet.ru

ఒక వ్యాఖ్యను జోడించండి