Una revolució en les comunicacions? El nou enfocament us permet estalviar ample de banda 100 vegades o més per a trucades d'àudio i vídeo

Una revolució en les comunicacions? El nou enfocament us permet estalviar ample de banda 100 vegades o més per a trucades d'àudio i vídeo

Molta gent recorda que la sèrie de televisió "Silicon Valley" tracta sobre el programador Richard
Hendrix, que accidentalment va inventar un algorisme de compressió de dades revolucionari i va decidir
crea la teva startup.

Els consultors de la sèrie fins i tot van suggerir una mètrica amb la qual avaluar
algorismes similars són el Weissman Score fictici.

Més enllà de la història, la startup va fer un xat de vídeo amb aquesta solució.

La respectada comunitat està convidada a parlar d'una altra, completament inusual
el principi de compressió de dades per a trucades d'àudio i vídeo, que resol el problema amb una de nova,
costat inesperat.

Si voleu participar en la discussió d'aquesta solució, i també esbrinar què té en comú
conceptes amb Jonathan Swift i les obres de Lev Tolstoi, si us plau, sota el cat.

Una mica de teoria

Anem a descriure en termes generals com funciona la comunicació d'àudio moderna: el principi és el mateix per a tots dos
trucades a través de la xarxa GSM, així com per a missatgeria instantània i xarxes VOIP.

Les vibracions sonores s'envien al micròfon del telèfon intel·ligent, després en analògic-digital
convertidor (ADC o ADC):

Una revolució en les comunicacions? El nou enfocament us permet estalviar ample de banda 100 vegades o més per a trucades d'àudio i vídeo

A continuació, la codificació es produeix amb una varietat de còdecs (G711, G729, OPUS, GSM, etc.),
s'afegeix o no el xifratge (SRTP, ZPTP, etc.) i s'envia a l'entorn
transmissió de dades.

Per exemple, gairebé tots els missatgers instantanis (WhatsApp, Viber, etc.) utilitzen els mateixos còdecs (últimament això sol ser Opus), i gairebé els mateixos una mica.
protocols modificats (basats en SIP, WebRTC).

La xarxa de transmissió de dades pot ser l'Internet pública o la xarxa GSM o bé
intranet:

Una revolució en les comunicacions? El nou enfocament us permet estalviar ample de banda 100 vegades o més per a trucades d'àudio i vídeo

El xifratge és un element opcional en aquest esquema, per exemple, en la majoria dels casos
No s'utilitza el xifratge de telefonia SIP.

Però als missatgers, per contra, solen utilitzar el seu propi propietari
protocols d'encriptació de veu i vídeo.

A continuació, es produeix el procés invers: el destinatari, després d'haver rebut les dades, descodifica la informació rebuda, després el senyal va al DAC (convertidor digital a analògic) i després entra a l'amplificador d'àudio connectat a l'altaveu:

Una revolució en les comunicacions? El nou enfocament us permet estalviar ample de banda 100 vegades o més per a trucades d'àudio i vídeo

Característiques dels còdecs moderns:

G.711 64 Kbps.
G.726 16, 24, 32 o 40 Kbps.
G.729A 8 Kb/seg.
GSM 13 Kb/s.
iLBC 13.3 Kb/s. (marc de 30 ms); 15.2 Kb/s. (marc de 20 ms)
Interval Speex de 2.15 a 22.4 Kb/s.
G.722 64 Kbps.

Així, per exemple, durant una conversa de 7 minuts per WhatsApp o Skype hi haurà
S'ha utilitzat aproximadament 1 MB.

Recordem aquests números: 1 MB per a 7 minuts de conversa, els necessitarem aviat.

"Leo Tolstoi és com un mirall... de la revolució..."

Recordem la novel·la més famosa d'aquest gran escriptor rus:

"Guerra i pau" és una novel·la èpica de Lev Nikolaevich Tolstoi, que descriu el rus
societat durant les guerres contra Napoleó el 1805-1812. L'epíleg de la novel·la porta
narrativa fins al 1820.

La novel·la "Guerra i pau" de L.N. Tolstoi va dedicar set anys de treball intens i persistent Els manuscrits testimonien com es va crear una de les creacions més grans del món.
"Guerra i pau": l'arxiu de l'escriptor conté més de 5200 fulls ben escrits.

Si ara voleu llegir aquesta novel·la, podeu descarregar-la fàcilment.

I aquest fitxer només pesa... 1 MB:

Una revolució en les comunicacions? El nou enfocament us permet estalviar ample de banda 100 vegades o més per a trucades d'àudio i vídeo

Els formats fb2 i epub, igual que zip, rar, en principi, es poden considerar com una mena de
còdecs

Pensem-hi: 7 minuts de la nostra conversa a WhatsApp són iguals en termes de volum de trànsit
una gran obra que va trigar 7 anys a escriure!

Es va codificar una conversa de 7 minuts amb el còdec opus, la novel·la es va codificar amb ePub, el volum és el mateix -
1 MB, però quina diferència tan gran!

Els viatges de Gulliver

Tothom coneix aquesta obra de Jonathan Swift des de la infància, però de fet aquest llibre no és per a
nens.

Els viatges de Gulliver és una sàtira política per a adults, per descomptat en el context del 18
segle.

El més sorprenent és que Swift, sent un fervent oponent del seu altre contemporani...
Newton, en els seus "Viatges de Gulliver" no només va predir el descobriment de satèl·lits
Mart (amb una descripció bastant precisa de les seves característiques), però també va descriure una força interessant
forma de comunicació entre persones:

“... el projecte exigia l'abolició total de totes les paraules;
l'autor d'aquest projecte es va referir principalment als seus beneficis i estalvi per a la salut
del temps.

Després de tot, és obvi que cada paraula que pronunciem està associada a un cert desgast.
pulmons i, per tant, comporta una reducció de la nostra vida.

I com que les paraules són només noms de coses, l'autor del projecte assumeix que
que ens serà molt més convenient portar amb nosaltres les coses necessàries per expressar la nostra
pensaments i desitjos.

... moltes persones molt dotes i sàvies utilitzen aquesta nova manera d'expressar la seva
pensaments amb l'ajuda de les coses.

El seu únic inconvenient és el fet que, si cal,
mantenir una llarga conversa sobre diversos temes, els interlocutors han de portar
espatlles amb grans farcells de coses, si els fons no permeten contractar-ne una o
dos nois forts. Sovint veia dos savis així, esgotats
càrrega pesada, com els nostres venedors ambulants. Quan es van trobar al carrer, van fer fotos
bosses d'espatlles, les va obrir i, traient d'allà les coses necessàries, va mantenir una conversa
continuació de l'hora; després van amuntegar els seus utensilis i es van ajudar mútuament a aixecar la càrrega
espatlles, es va acomiadar i es va separar.

No obstant això, per a converses curtes i senzilles pots portar tot el que necessites a la butxaca
o sota el braç, i una conversa que es fa a casa no provoca cap
dificultats. Per tant, les sales on es reuneixen les persones que utilitzen aquest mètode estan plenes
tot tipus d'objectes aptes per servir de material per a tals artificials
converses.

Un altre gran avantatge d'aquesta invenció és que es pot utilitzar
com a llenguatge universal, comprensible per a totes les nacions civilitzades, per a mobles i llar
els utensilis són iguals o molt semblants a tot arreu, de manera que es pot entendre fàcilment el seu ús.
Així, els enviats poden parlar fàcilment amb reis estrangers o
ministres la llengua dels quals els és completament desconeguda..."

Per tant, probablement ja endevineu on vaig amb això :)

Per què transmetre vibracions de l'aire (sons) al llarg de molts centenars i milers de quilòmetres?
molestar-se amb la codificació (per tal de transmetre aquestes vibracions de l'aire al receptor amb la màxima precisió i eficàcia possible), mantenir l'ample de banda necessari, si és semàntic.
La càrrega d'aquesta transmissió és mínima, o fins i tot tendeix a zero?

Al cap i a la fi, les persones es comuniquen entre elles no amb sons, sinó amb significat, contingut, semàntica, pensaments...

El concepte del nou sistema de comunicació és bastant simple: al costat de la font A hi ha àudio
les vibracions també es digitalitzen, però no es transmeten immediatament a l'altra part, però
es converteixen en text (Speech To Text) i després el text significatiu de
subscriptor A, que:

  • es pot transmetre amb l'ample de banda de dades mínim requerit (fins i tot són possibles comunicacions per ràdio HF, etc.)
  • es pot xifrar amb qualsevol algorisme de xifratge fort

A la cara B, els missatges rebuts es desencripten i es reprodueixen com a veu des
subscriptor A (Text To Speech).

També podeu descarregar l'anomenada cara B. avatar de veu del subscriptor A, que ho faria
va repetir amb precisió la manera de parlar del subscriptor A.

Un canal independent pot transmetre sorolls de fons i emocions.

Una revolució en les comunicacions? El nou enfocament us permet estalviar ample de banda 100 vegades o més per a trucades d'àudio i vídeo

El mateix passa amb la comunicació de vídeo, sobretot perquè els elements individuals ho són durant molt de temps
existeixen en aplicacions (diverses màscares, fons a Zoom, etc.).

Sí, hi ha aspectes tècnics que actualment no estan completament implementats en la forma adequada:
per exemple, la velocitat de conversió de veu a text serà fonamental, però utilitzant
Els algorismes predictius de conversió d'IA poden augmentar significativament aquesta velocitat.

L'avantatge més important és que es requereix un ample de banda mínim en el mitjà de transmissió
dades.

Aquells. Aquest principi es pot utilitzar no només per a la vida quotidiana
comunicacions, però també per a comunicacions militars i de llarga distància amb llargs retards
(comunicació espacial, interplanetària - Lluna, Mart, etc. :)

Tot i que es tracta d'una descripció del concepte, de fet, en un dels nostres projectes ja n'hi ha diversos
Fa mesos que s'utilitza un prototip amb aquest principi.

Però més sobre això la propera vegada...

Font: www.habr.com

Afegeix comentari