Unha revolución nas comunicacións? O novo enfoque permítelle aforrar ancho de banda 100 veces ou máis para as chamadas de audio e vídeo

Unha revolución nas comunicacións? O novo enfoque permítelle aforrar ancho de banda 100 veces ou máis para as chamadas de audio e vídeo

Moita xente lembra que a serie de televisión "Silicon Valley" trata sobre o programador Richard
Hendrix, quen accidentalmente inventou un revolucionario algoritmo de compresión de datos e decidiu
crea a túa startup.

Os consultores da serie incluso suxeriron unha métrica coa que avaliar
algoritmos similares son o ficticio Weissman Score.

Máis adiante na historia, a startup fixo un chat de vídeo usando esta solución.

A respectada comunidade está convidada a discutir outra, completamente inusual
o principio de compresión de datos para chamadas de audio e vídeo, que resolve o problema cunha nova,
lado inesperado.

Se queres participar na discusión desta solución, e tamén descubrir o que ten en común
conceptos con Jonathan Swift e as obras de León Tolstoi, por favor baixo cat.

Un pouco de teoría

Imos describir en termos xerais como funciona a comunicación de audio moderna: o principio é o mesmo para ambos
chamadas a través da rede GSM, así como para mensaxería instantánea e redes VOIP.

As vibracións sonoras son enviadas ao micrófono do teléfono intelixente, despois en analóxico-dixital
conversor (ADC ou ADC):

Unha revolución nas comunicacións? O novo enfoque permítelle aforrar ancho de banda 100 veces ou máis para as chamadas de audio e vídeo

A continuación, a codificación prodúcese cunha variedade de códecs (G711, G729, OPUS, GSM, etc.),
o cifrado engádese ou non (SRTP, ZPTP, etc.) e envíase ao ambiente
transmisión de datos.

Por exemplo, case todos os mensaxeiros instantáneos (WhatsApp, Viber, etc.) usan os mesmos códecs (últimamente isto adoita ser Opus), e case o mesmo lixeiramente
protocolos modificados (baseados en SIP, WebRTC).

A rede de transmisión de datos pode ser a Internet pública ou a rede GSM ou
intranet:

Unha revolución nas comunicacións? O novo enfoque permítelle aforrar ancho de banda 100 veces ou máis para as chamadas de audio e vídeo

O cifrado é un elemento opcional neste esquema, por exemplo na maioría dos casos para
Non se utiliza o cifrado de telefonía SIP.

Pero nos messengers, pola contra, adoitan usar o seu propio propietario
protocolos para o cifrado de voz e vídeo.

A continuación, prodúcese o proceso inverso: o destinatario, despois de recibir os datos, descodifica a información recibida, despois o sinal vai ao DAC (conversor dixital a analóxico) e despois entra no amplificador de audio conectado ao altofalante:

Unha revolución nas comunicacións? O novo enfoque permítelle aforrar ancho de banda 100 veces ou máis para as chamadas de audio e vídeo

Características dos códecs modernos:

G.711 64 Kbps.
G.726 16, 24, 32 ou 40 Kbps.
G.729A 8 Kb/seg.
GSM 13 Kb/s.
iLBC 13.3 Kb/s. (cadro de 30 ms); 15.2 Kb/s. (cadro de 20 ms)
Intervalo Speex de 2.15 a 22.4 Kb/seg.
G.722 64 Kbps.

Así, por exemplo, durante unha conversa de 7 minutos en WhatsApp ou Skype haberá
Utilizouse preto de 1 MB.

Lembremos estes números: 1 MB para 7 minutos de conversa, necesitarémolos en breve.

"León Tolstoi é como un espello... da revolución..."

Lembremos a novela máis famosa deste gran escritor ruso:

"Guerra e paz" é unha novela épica de Lev Nikolaevich Tolstoi, que describe o ruso
sociedade durante as guerras contra Napoleón en 1805-1812. O epílogo da novela trae
Narrativa ata 1820.

A novela “Guerra e Paz” de L.N. Tolstoi dedicou sete anos de traballo intenso e persistente Os manuscritos testemuñan como se creou unha das máis grandes creacións do mundo.
"Guerra e paz": o arquivo do escritor contén máis de 5200 follas finamente escritas.

Se agora queres ler esta novela, podes descargala facilmente.

E este ficheiro só pesa... 1 MB:

Unha revolución nas comunicacións? O novo enfoque permítelle aforrar ancho de banda 100 veces ou máis para as chamadas de audio e vídeo

Os formatos fb2 e epub, ao igual que zip, rar, en principio, poden considerarse como unha especie de
codecs

Pensemos niso: 7 minutos da nosa conversa en WhatsApp son iguais en termos de volume de tráfico
un gran traballo que tardou 7 anos en escribir!

Codificouse unha conversa de 7 minutos co códec opus, a novela codificouse con ePub, o volume é o mesmo -
1 MB, pero que gran diferenza!

As viaxes de Gulliver

Todo o mundo coñece esta obra de Jonathan Swift dende a infancia, pero de feito este libro non é para
nenos.

As viaxes de Gulliver é unha sátira política para adultos, por suposto no contexto do 18
século.

O sorprendente é que Swift, sendo un fervoroso opositor do seu outro contemporáneo...
Newton, nas súas "Viaxes de Gulliver" non só predixo o descubrimento de satélites
Marte (cunha descrición bastante precisa das súas características), pero tamén describiu un bastante interesante
Forma de comunicación entre as persoas:

“... o proxecto esixía a completa abolición de todas as palabras;
o autor deste proxecto referiuse principalmente aos seus beneficios para a saúde e ao seu aforro
de tempo.

Despois de todo, é obvio que cada palabra que pronunciamos está asociada a algún desgaste.
pulmóns e, polo tanto, leva a unha redución da nosa vida.

E como as palabras son só nomes de cousas, o autor do proxecto asume que
que nos será moito máis conveniente levar connosco as cousas necesarias para expresar o noso
pensamentos e desexos.

... moitas persoas moi eruditas e sabias usan esta nova forma de expresar o seu
pensamentos coa axuda das cousas.

O seu único inconveniente é o feito de que, se é necesario,
manter unha longa conversación sobre unha variedade de temas, os interlocutores teñen que levar
ombreiros con grandes feixes de cousas, se os fondos non permiten contratar un ou
dous tipos fortes. Moitas veces veía a dous homes sabios, esgotados
pesada carga, como os nosos vendedores ambulantes. Cando se atopaban na rúa, facíanse fotos
bolsas de ombreiro, abriunas e, sacando de alí as cousas necesarias, mantivo así unha conversa
continuación da hora; despois amontoaron os seus utensilios e axudáronse mutuamente a subir a carga
ombreiros, despediuse e separáronse.

Non obstante, para conversas breves e sinxelas podes levar todo o que necesites no peto
ou debaixo do brazo, e unha conversación que teña lugar na casa non provoca ningunha
dificultades. Polo tanto, as salas onde se reúnen as persoas que utilizan este método están cheas
todo tipo de obxectos aptos para servir de material para tales artificiais
conversas.

Outra gran vantaxe deste invento é que se pode utilizar
como lingua universal, comprensible para todas as nacións civilizadas, para mobles e fogar
os utensilios son iguais ou moi parecidos en todas partes, para que se comprenda facilmente o seu uso.
Así, os enviados poden falar facilmente con reis estranxeiros ou
ministros cuxa lingua é completamente descoñecida para eles..."

Entón, probablemente xa adiviñedes a onde vou con isto :)

Por que transmitir vibracións do aire (sons) ao longo de moitos centos e miles de quilómetros?
molestarse coa codificación (para transmitir estas vibracións de aire ao receptor coa maior precisión e eficiencia posible), manter o ancho de banda necesario, se é semántico.
A carga desta transmisión é mínima, ou mesmo tende a cero?

Despois de todo, as persoas non se comunican con sons, senón con significado, contido, semántica, pensamentos...

O concepto do novo sistema de comunicación é bastante sinxelo: no lado da fonte A hai audio
as vibracións tamén se dixitalizan, pero non se transmiten inmediatamente á outra parte, pero
convértense en texto (Speech To Text) e despois o texto significativo de
abonado A, quen:

  • pódese transmitir co ancho de banda de datos mínimo necesario (mesmo son posibles as comunicacións por radio HF, etc.)
  • pódese cifrar con calquera algoritmo de cifrado forte

No lado B, as mensaxes recibidas son descifradas e reprodúcense como unha voz desde
subscritor A (Text To Speech).

Tamén podes descargar a chamada cara B. avatar de voz do subscritor A, que o faría
repetiu con precisión a forma de falar do abonado A.

Unha canle separada pode transmitir ruído de fondo e emocións.

Unha revolución nas comunicacións? O novo enfoque permítelle aforrar ancho de banda 100 veces ou máis para as chamadas de audio e vídeo

Todo o mesmo é certo para a comunicación de vídeo, especialmente porque os elementos individuais son durante moito tempo
existen en aplicacións (varias máscaras, fondo en Zoom, etc.).

Si, hai aspectos técnicos que actualmente non están totalmente implementados na forma adecuada.
por exemplo, a velocidade da conversión de voz a texto será fundamental, pero usando
Os algoritmos de conversión da intelixencia artificial preditiva poden aumentar significativamente esta velocidade.

A vantaxe máis importante é que se require un ancho de banda mínimo no medio de transmisión
datos.

Eses. Este principio pódese usar non só para o día a día
comunicacións, pero tamén para comunicacións militares e de longa distancia con grandes atrasos
(comunicación espacial, interplanetaria - Lúa, Marte, etc. :)

Aínda que esta é unha descrición do concepto, de feito, nun dos nosos proxectos xa hai varios
Un prototipo con este principio leva meses en uso.

Pero máis sobre iso a próxima vez...

Fonte: www.habr.com

Engadir un comentario