¿Una revolución en las comunicaciones? El nuevo enfoque le permite ahorrar ancho de banda 100 veces o más para llamadas de audio y video.

¿Una revolución en las comunicaciones? El nuevo enfoque le permite ahorrar ancho de banda 100 veces o más para llamadas de audio y video.

Mucha gente recuerda que la serie de televisión "Silicon Valley" trata sobre el programador Richard.
Hendrix, a quien accidentalmente se le ocurrió un revolucionario algoritmo de compresión de datos y decidió
construye tu startup.

Los consultores de la serie incluso sugirieron una métrica con la que evaluar
algoritmos similares son la puntuación ficticia de Weissman.

Más adelante en la historia, la startup realizó un chat de video utilizando esta solución.

Se invita a la respetada comunidad a discutir otro completamente inusual.
el principio de compresión de datos para llamadas de audio y video, que resuelve el problema con uno nuevo,
lado inesperado.

Si desea participar en la discusión sobre esta solución y también descubrir qué tiene en común
conceptos con Jonathan Swift y las obras de León Tolstoi, bajo cat.

Un poco de teoría

Describamos en términos generales cómo funciona la comunicación por audio moderna: el principio es el mismo para ambos.
llamadas a través de la red GSM, así como para mensajería instantánea y redes VOIP.

Las vibraciones sonoras se envían al micrófono del teléfono inteligente y luego en formato analógico-digital.
convertidor (ADC o ADC):

¿Una revolución en las comunicaciones? El nuevo enfoque le permite ahorrar ancho de banda 100 veces o más para llamadas de audio y video.

A continuación, la codificación se produce con una variedad de códecs (G711, G729, OPUS, GSM, etc.),
se agrega o no cifrado (SRTP, ZPTP, etc.) y se envía al entorno
transmisión de datos.

Por ejemplo, casi todos los mensajeros instantáneos (WhatsApp, Viber, etc.) utilizan los mismos códecs (últimamente suele ser Opus), y casi los mismos ligeramente
Protocolos modificados (basados ​​en SIP, WebRTC).

La red de transmisión de datos puede ser la Internet pública o la red GSM o
intranet:

¿Una revolución en las comunicaciones? El nuevo enfoque le permite ahorrar ancho de banda 100 veces o más para llamadas de audio y video.

El cifrado es un elemento opcional en este esquema, por ejemplo en la mayoría de los casos para
No se utiliza cifrado de telefonía SIP.

Pero en los mensajeros, por el contrario, suelen utilizar su propia propiedad.
Protocolos para cifrado de voz y vídeo.

A continuación, ocurre el proceso inverso: el destinatario, después de recibir los datos, decodifica la información recibida, luego la señal va al DAC (convertidor de digital a analógico) y luego ingresa al amplificador de audio conectado al altavoz:

¿Una revolución en las comunicaciones? El nuevo enfoque le permite ahorrar ancho de banda 100 veces o más para llamadas de audio y video.

Características de los códecs modernos:

G.711 64 Kbps.
G.726 16, 24, 32 o 40 Kbps.
G.729A 8 Kb/seg.
GSM 13 Kb/seg.
iLBC 13.3 Kb/seg. (cuadro de 30 ms); 15.2 Kb/seg. (cuadro de 20 ms)
Rango de velocidad de 2.15 a 22.4 Kb/seg.
G.722 64 Kbps.

Así, por ejemplo, durante una conversación de 7 minutos por WhatsApp o Skype habrá
Se utilizó aproximadamente 1 MB.

Recordemos estos números: 1 MB por 7 minutos de conversación, los necesitaremos pronto.

“León Tolstoi es como un espejo... de la revolución...”

Recordemos la novela más famosa de este gran escritor ruso:

"Guerra y paz" es una novela épica de León Nikolaevich Tolstoi que describe el idioma ruso.
sociedad durante las guerras contra Napoleón en 1805-1812. El epílogo de la novela trae
narrativa hasta 1820.

La novela "Guerra y paz" de L.N. Tolstoi dedicó siete años de intenso y persistente trabajo: los manuscritos dan testimonio de cómo se creó una de las creaciones más grandes del mundo.
“Guerra y paz”: el archivo del escritor contiene más de 5200 hojas finamente escritas.

Si ahora quieres leer esta novela, puedes descargarla fácilmente.

Y este archivo pesa sólo... 1 MB:

¿Una revolución en las comunicaciones? El nuevo enfoque le permite ahorrar ancho de banda 100 veces o más para llamadas de audio y video.

Los formatos fb2 y epub, al igual que zip, rar, en principio, pueden considerarse como una especie de
códecs

Pensémoslo: 7 minutos de nuestra conversación en WhatsApp equivalen en volumen de tráfico
¡Un gran trabajo que tardó 7 años en escribirse!

Se codificó una conversación de 7 minutos con el códec opus, la novela se codificó con ePub, el volumen es el mismo -
1 MB, ¡pero qué gran diferencia!

los viajes de Gulliver

Todo el mundo conoce esta obra de Jonathan Swift desde la infancia, pero en realidad este libro no es para
niños

Los viajes de Gulliver es una sátira política para adultos, por supuesto en el contexto de 18
siglo.

Lo sorprendente es que Swift, siendo un ferviente oponente de su otro contemporáneo...
Newton, en sus “Los viajes de Gulliver” no sólo predijo el descubrimiento de satélites
Marte (con una descripción bastante precisa de sus características), pero también describió una zona bastante interesante.
forma de comunicación entre personas:

“... el proyecto exigía la abolición total de todas las palabras;
el autor de este proyecto se refirió principalmente a sus beneficios para la salud y al ahorro
tiempo.

Al fin y al cabo, es obvio que cada palabra que pronunciamos va asociada a un cierto desgaste.
pulmones y, por tanto, conlleva una reducción de nuestra vida.

Y como las palabras son sólo nombres de cosas, el autor del proyecto supone que
que nos será mucho más conveniente llevar con nosotros las cosas necesarias para expresar nuestra
pensamientos y deseos.

... muchas personas muy eruditas y sabias utilizan esta nueva forma de expresar sus
pensamientos con la ayuda de las cosas.

Su único inconveniente es que, si es necesario,
llevar a cabo una larga conversación sobre una variedad de temas, los interlocutores deben llevar
hombros con grandes paquetes de cosas, si los fondos no permiten contratar uno o
dos tipos corpulentos. A menudo me pasaba ver a dos de esos sabios, exhaustos bajo
carga pesada, como nuestros vendedores ambulantes. Cuando se encontraron en la calle, se tomaron fotografías.
Se puso bolsos, los abrió y, sacando de allí las cosas necesarias, mantuvo una conversación en
continuación de la hora; Luego apilaron sus utensilios y se ayudaron mutuamente a levantar la carga.
hombros, se despidió y se separó.

Sin embargo, para conversaciones cortas y sencillas podrás llevar todo lo necesario en el bolsillo
o debajo del brazo, y una conversación en casa no causa ningún
dificultades. Por lo tanto, las salas donde se reúnen las personas que utilizan este método están llenas de
toda clase de objetos aptos para servir de material a tales artificiales.
conversaciones.

Otra gran ventaja de esta invención es que se puede utilizar
como lenguaje universal, comprensible para todas las naciones civilizadas, para muebles y artículos para el hogar.
los utensilios son iguales o muy similares en todas partes, de modo que se puede entender fácilmente su uso.
Así, los enviados pueden hablar fácilmente con reyes extranjeros o
ministros cuyo idioma les es completamente desconocido..."

Probablemente ya adivines adónde voy con esto :)

¿Por qué transmitir vibraciones del aire (sonidos) a lo largo de cientos y miles de kilómetros?
molestarse con la codificación (para transmitir estas vibraciones de aire al destinatario de la manera más precisa y eficiente posible), mantener el ancho de banda necesario, si es semántico
¿La carga de esta transmisión es mínima o incluso tiende a cero?

Después de todo, las personas se comunican entre sí no con sonidos, sino con significado, contenido, semántica, pensamientos...

El concepto del nuevo sistema de comunicación es bastante simple: en el lado de la fuente A hay audio
Las vibraciones también se digitalizan, pero no se transmiten inmediatamente a la otra parte, sino
se convierten en texto (Voz a texto) y luego el texto significativo de
suscriptor A, quien:

  • se puede transmitir con el ancho de banda de datos mínimo requerido (incluso son posibles las comunicaciones por radio HF, etc.)
  • se puede cifrar con cualquier algoritmo de cifrado potente

En el lado B, los mensajes recibidos se descifran y se reproducen como una voz de
suscriptor A (Texto a voz).

También puedes descargar la llamada cara B. avatar de voz del suscriptor A, ¿quién
repitió con precisión la forma de hablar del suscriptor A.

Un canal separado puede transmitir ruido de fondo y emociones.

¿Una revolución en las comunicaciones? El nuevo enfoque le permite ahorrar ancho de banda 100 veces o más para llamadas de audio y video.

Lo mismo se aplica a la comunicación por vídeo, sobre todo porque hace tiempo que los elementos individuales se
existen en las aplicaciones (varias máscaras, fondo en Zoom, etc.).

Sí, hay aspectos técnicos que actualmente no están completamente implementados de la forma adecuada.
por ejemplo, la velocidad de conversión de voz a texto será crítica, pero usar
Los algoritmos predictivos de conversión de IA pueden aumentar significativamente esta velocidad.

La ventaja más importante es que se requiere un ancho de banda mínimo en el medio de transmisión.
datos.

Aquellos. Este principio se puede utilizar no sólo para el día a día.
comunicaciones, pero también para comunicaciones militares y de larga distancia con grandes retrasos
(comunicación espacial, interplanetaria - Luna, Marte, etc. :)

Aunque esta es una descripción del concepto, de hecho, en uno de nuestros proyectos ya existen varios
Un prototipo con este principio se utiliza desde hace meses.

Pero más sobre eso la próxima vez...

Fuente: habr.com

Añadir un comentario