
Mulți oameni își amintesc că serialul TV „Silicon Valley” este despre programatorul Richard
Hendrix, care a venit din greșeală cu un algoritm revoluționar de comprimare a datelor și a decis
construiește-ți startup-ul.
Consultanții seriei au sugerat chiar și o metrică cu care să se evalueze
algoritmi similari sunt scorul fictiv Weissman.
Mai departe în poveste, startup-ul a făcut un chat video folosind această soluție.
Respectata comunitate este invitată să discute despre alta, complet neobișnuită
principiul comprimării datelor pentru apelurile audio și video, care rezolvă problema cu unul nou,
latura neasteptata.
Dacă doriți să participați la discuția despre această soluție și, de asemenea, aflați ce are aceasta în comun
concepte cu Jonathan Swift și lucrările lui Lev Tolstoi, vă rugăm sub cat.
Un pic de teorie
Să descriem în termeni generali cum funcționează comunicarea audio modernă - principiul este același pentru ambele
apeluri prin rețeaua GSM, precum și pentru mesagerie instant și rețele VOIP.
Vibrațiile sonore sunt trimise la microfonul smartphone-ului, apoi în analog-digital
convertor (ADC sau ADC):

Apoi, codificarea are loc cu o varietate de codecuri (G711, G729, OPUS, GSM etc.),
criptarea este adăugată sau nu (SRTP, ZPTP, etc.) și trimisă în mediu
transmiterea datelor.
De exemplu, aproape toate mesageria instantanee (WhatsApp, Viber etc.) folosesc aceleași codecuri (în ultimul timp acesta este de obicei Opus) și aproape la fel.
protocoale modificate (bazate pe SIP, WebRTC).
Rețeaua de transmisie a datelor poate fi fie Internetul public, fie rețeaua GSM sau
intranet:

Criptarea este un element opțional în această schemă, de exemplu în majoritatea cazurilor pentru
Criptarea telefoniei SIP nu este utilizată.
Dar în mesageri, dimpotrivă, folosesc de obicei propriul lor proprietar
protocoale pentru criptarea vocii și video.
În continuare, are loc procesul invers - destinatarul, după ce a primit datele, decodifică informațiile primite, apoi semnalul ajunge la DAC (convertor digital-analogic) și apoi intră în amplificatorul audio conectat la difuzor:

Caracteristicile codecurilor moderne:
G.711 64 Kbps.
G.726 16, 24, 32 sau 40 Kbps.
G.729A 8 Kb/sec.
GSM 13 Kb/sec.
iLBC 13.3 Kb/sec. (cadru de 30 ms); 15.2 Kb/sec. (cadru de 20 ms)
Interval Speex de la 2.15 la 22.4 Kb/sec.
G.722 64 Kbps.
Astfel, de exemplu, în timpul unei conversații de 7 minute pe WhatsApp sau Skype va exista
A fost folosit aproximativ 1 MB.
Să ne amintim aceste numere - 1MB pentru 7 minute de conversație, vom avea nevoie de ele în curând.
„Lev Tolstoi este ca o oglindă... a revoluției...”
Să ne amintim cel mai faimos roman al acestui mare scriitor rus:
„Război și pace” este un roman epic al lui Lev Nikolaevici Tolstoi, care descrie limba rusă
societate în timpul războaielor împotriva lui Napoleon din 1805-1812. Epilogul romanului aduce
narațiune până în 1820.
Romanul „Război și pace” de L.N. Tolstoi a dedicat șapte ani de muncă intensă și persistentă. Manuscrisele mărturisesc cum a fost creată una dintre cele mai mari creații din lume.
„Război și pace”: arhiva scriitorului conține peste 5200 de foi fin scrise.
Dacă acum doriți să citiți acest roman, îl puteți descărca cu ușurință.
Și acest fișier cântărește doar... 1 MB:

Formatele fb2 și epub, la fel ca zip, rar, în principiu, pot fi considerate ca un fel de
codecuri
Să ne gândim la asta - 7 minute din conversația noastră pe WhatsApp sunt egale în ceea ce privește volumul de trafic
o lucrare grozavă care a durat 7 ani pentru a scrie!
O conversație de 7 minute a fost codificată cu codecul opus, romanul a fost codificat cu ePub, volumul este același -
1MB, dar ce mare diferență!
calatoriile lui Gulliver
Toată lumea știe această lucrare a lui Jonathan Swift din copilărie, dar de fapt această carte nu este pentru
copii.
Călătoriile lui Gulliver este o satira politică pentru adulți, bineînțeles în contextul anului 18
secol.
Lucrul surprinzător este că Swift, fiind un adversar înflăcărat al celuilalt contemporan al său -
Newton, în „Călătoriile lui Gulliver” nu numai că a prezis descoperirea sateliților
Marte (cu o descriere destul de precisă a caracteristicilor lor), dar a descris, de asemenea, un destul de interesant
mod de comunicare între oameni:
„... proiectul cerea desființarea completă a tuturor cuvintelor;
autorul acestui proiect s-a referit în principal la beneficiile pentru sănătate și la economisirea acestuia
timp.
La urma urmei, este evident că fiecare cuvânt pe care îl rostim este asociat cu o oarecare uzură.
plămânilor și, prin urmare, duce la o reducere a vieții noastre.
Și întrucât cuvintele sunt doar nume de lucruri, autorul proiectului presupune că
că ne va fi mult mai convenabil să purtăm cu noi lucrurile necesare pentru a ne exprima
gânduri și dorințe.
... mulți oameni foarte învățați și înțelepți folosesc acest nou mod de a-și exprima
gânduri cu ajutorul lucrurilor.
Singurul său inconvenient este faptul că, dacă este necesar,
purta o conversație lungă pe o varietate de subiecte, interlocutorii trebuie să poarte
umeri cu mănunchiuri mari de lucruri, dacă fondurile nu permit angajarea unuia sau
doi tipi puternici. Mi s-a întâmplat să văd adesea doi astfel de înțelepți, epuizați
povară grea, ca vânzătorii noștri. Când s-au întâlnit pe stradă, au făcut poze
genți de umăr, le-a deschis și, scoțând de acolo cele necesare, a purtat astfel o conversație în
continuarea orei; apoi și-au adunat ustensilele și s-au ajutat reciproc să ridice încărcătura pe
umerii, și-au luat rămas bun și s-au despărțit.
Cu toate acestea, pentru conversații scurte și simple poți purta tot ce ai nevoie în buzunar
sau sub braț, iar o conversație care are loc acasă nu provoacă niciuna
dificultăți. Prin urmare, camerele în care se adună oamenii care folosesc această metodă sunt pline
tot felul de obiecte potrivite pentru a servi drept material pentru astfel de artificiale
conversatii.
Un alt mare avantaj al acestei invenţii este că poate fi utilizată
ca limbaj universal, de înțeles de toate națiunile civilizate, pentru mobilă și gospodărie
ustensilele sunt la fel sau foarte asemănătoare peste tot, astfel încât utilizarea lor să fie ușor de înțeles.
Astfel, trimișii pot vorbi cu ușurință cu regii străini sau
miniștri a căror limbă le este complet necunoscută...”
Deci, probabil că deja ghiciți unde mă duc cu asta :)
De ce să transmită vibrațiile (sunetele) aerului pe multe sute și mii de kilometri?
deranjați-vă cu codificarea (pentru a transmite aceste vibrații ale aerului către destinatar cât mai precis și eficient), mențineți lățimea de bandă necesară, dacă este semantică
Sarcina acestei transmisii este minimă sau chiar tinde spre zero?
La urma urmei, oamenii comunică între ei nu prin sunete, ci cu sens, conținut, semantică, gânduri...
Conceptul noului sistem de comunicare este destul de simplu - pe partea sursă A există audio
vibrațiile sunt și ele digitalizate, dar nu sunt transmise imediat celeilalte părți, dar
sunt convertite în text (Speech To Text) și apoi textul semnificativ din
abonatul A, care:
- poate fi transmis cu lățimea de bandă de date minimă necesară (chiar și comunicațiile radio HF sunt posibile etc.)
- poate fi criptat cu orice algoritm de criptare puternic
Pe partea B, mesajele primite sunt decriptate și reproduse ca o voce de la
abonatul A (Text To Speech).
De asemenea, puteți descărca așa-numita latură B. avatarul vocal al abonatului A, care ar fi
a repetat cu acuratețe modul de vorbire al abonatului A.
Un canal separat poate transmite zgomot de fundal și emoții.

Același lucru este valabil și pentru comunicarea video - mai ales că elementele individuale au fost de mult timp
există în aplicații (diverse măști, fundal în Zoom etc.).
Da, există aspecte tehnice care în prezent nu sunt pe deplin implementate în forma adecvată -
de exemplu, viteza de conversie Speech To Text va fi critică, dar folosind
Algoritmii predictivi de conversie AI pot crește semnificativ această viteză.
Cel mai important avantaj este că este necesară o lățime de bandă minimă în mediul de transmisie
date.
Acestea. Acest principiu poate fi folosit nu numai pentru toate zilele obișnuite
comunicatii, dar si pentru comunicatii militare si la distanta cu intarzieri mari
(comunicare spațială, interplanetară - Lună, Marte etc. :)
Deși aceasta este o descriere a conceptului, de fapt, într-unul dintre proiectele noastre există deja câteva
Un prototip cu acest principiu a fost folosit de luni de zile.
Dar mai multe despre asta data viitoare...
Sursa: www.habr.com
