Een revolutie in communicatie? Met de nieuwe aanpak kunt u 100 keer of meer bandbreedte besparen voor audio- en videogesprekken

Een revolutie in communicatie? Met de nieuwe aanpak kunt u 100 keer of meer bandbreedte besparen voor audio- en videogesprekken

Veel mensen herinneren zich dat de tv-serie ‘Silicon Valley’ over programmeur Richard gaat
Hendrix, die per ongeluk een revolutionair algoritme voor datacompressie bedacht en besloot
bouw je start-up.

De adviseurs van de serie stelden zelfs een maatstaf voor om te evalueren
soortgelijke algoritmen zijn de fictieve Weissman-score.

Verderop in het verhaal maakte de startup een videochat met deze oplossing.

De gerespecteerde gemeenschap wordt uitgenodigd om een ​​ander, volkomen ongebruikelijk onderwerp te bespreken
het principe van datacompressie voor audio- en videogesprekken, dat het probleem oplost met een nieuwe,
onverwachte kant.

Als u wilt deelnemen aan de discussie over deze oplossing, en ook wilt ontdekken wat dit met elkaar gemeen heeft
concepten met Jonathan Swift en het werk van Leo Tolstoj, graag onder cat.

Een beetje theorie

Laten we in algemene termen beschrijven hoe moderne audiocommunicatie werkt - het principe is voor beide hetzelfde
bellen via het GSM-netwerk, maar ook voor instant messengers en VOIP-netwerken.

Geluidstrillingen worden naar de microfoon van de smartphone gestuurd en vervolgens in analoog-digitaal
omzetter (ADC of ADC):

Een revolutie in communicatie? Met de nieuwe aanpak kunt u 100 keer of meer bandbreedte besparen voor audio- en videogesprekken

Vervolgens vindt de codering plaats met een verscheidenheid aan codecs (G711, G729, OPUS, GSM, enz.),
encryptie wordt wel of niet toegevoegd (SRTP, ZPTP, etc.) en naar de omgeving gestuurd
dataoverdracht.

Bijna alle instant messengers (WhatsApp, Viber, etc.) gebruiken bijvoorbeeld dezelfde codecs (de laatste tijd is dit meestal Opus), en bijna hetzelfde
aangepaste protocollen (gebaseerd op SIP, WebRTC).

Het datatransmissienetwerk kan het openbare internet of het GSM-netwerk zijn
intranet:

Een revolutie in communicatie? Met de nieuwe aanpak kunt u 100 keer of meer bandbreedte besparen voor audio- en videogesprekken

Encryptie is een optioneel element in dit schema, bijvoorbeeld in de meeste gevallen voor
Er wordt geen gebruik gemaakt van SIP-telefonie-encryptie.

Maar bij boodschappers gebruiken ze integendeel meestal hun eigen eigendommen
protocollen voor spraak- en video-encryptie.

Vervolgens vindt het omgekeerde proces plaats: de ontvanger, die de gegevens heeft ontvangen, decodeert de ontvangen informatie, waarna het signaal naar de DAC (digitaal-naar-analoog-omzetter) gaat en vervolgens de audioversterker binnengaat die op de luidspreker is aangesloten:

Een revolutie in communicatie? Met de nieuwe aanpak kunt u 100 keer of meer bandbreedte besparen voor audio- en videogesprekken

Kenmerken van moderne codecs:

G.711 64 Kbps.
G.726 16, 24, 32 of 40 Kbps.
G.729A 8 Kb/sec.
GSM 13 Kb/sec.
iLBC 13.3 Kb/sec. (frame van 30 ms); 15.2 Kb/sec. (20 ms-frame)
Speex Bereik van 2.15 tot 22.4 Kb/sec.
G.722 64 Kbps.

Zo zal er bijvoorbeeld tijdens een gesprek van 7 minuten op WhatsApp of Skype sprake zijn
Er werd ongeveer 1 MB gebruikt.

Laten we deze cijfers onthouden: 1 MB voor 7 minuten gesprek, we hebben ze binnenkort nodig.

“Leo Tolstoj is als een spiegel... van de revolutie...”

Laten we de beroemdste roman van deze grote Russische schrijver niet vergeten:

‘Oorlog en Vrede’ is een epische roman van Leo Nikolajevitsj Tolstoj, waarin het Russisch wordt beschreven
samenleving tijdens de oorlogen tegen Napoleon in 1805-1812. De epiloog van de roman brengt
verhaal tot 1820.

De roman ‘Oorlog en vrede’ van L.N. Tolstoj wijdde zeven jaar aan intens en volhardend werk. Manuscripten getuigen van hoe een van 's werelds grootste creaties tot stand kwam.
“Oorlog en Vrede”: het archief van de schrijver bevat meer dan 5200 fijngeschreven vellen.

Als u deze roman nu wilt lezen, kunt u deze eenvoudig downloaden.

En dit bestand weegt slechts... 1 MB:

Een revolutie in communicatie? Met de nieuwe aanpak kunt u 100 keer of meer bandbreedte besparen voor audio- en videogesprekken

De formaten fb2 en epub kunnen, net als zip, rar, in principe als een soort
codecs

Laten we er eens over nadenken: 7 minuten van ons gesprek op WhatsApp zijn gelijk in termen van verkeersvolume
een geweldig werk dat 7 jaar duurde om te schrijven!

Een gesprek van 7 minuten is gecodeerd met de opus-codec, de roman is gecodeerd met ePub, het volume is hetzelfde -
1MB, maar wat een enorm verschil!

Gulliver's reizen

Iedereen kent dit werk van Jonathan Swift al van kinds af aan, maar eigenlijk is dit boek er niet voor bedoeld
kinderen.

Gulliver's Travels is een politieke satire voor volwassenen, uiteraard in de context van 18
eeuw.

Het verrassende is dat Swift, een fervent tegenstander van zijn andere tijdgenoten...
Newton voorspelde in zijn ‘Gulliver’s Travels’ niet alleen de ontdekking van satellieten
Mars (met een redelijk nauwkeurige beschrijving van hun kenmerken), maar beschreef ook een nogal interessante
manier van communiceren tussen mensen:

“... het project eiste de volledige afschaffing van alle woorden;
de auteur van dit project verwees vooral naar de gezondheidsvoordelen en besparingen ervan
tijd.

Het is immers duidelijk dat elk woord dat we uiten gepaard gaat met enige slijtage.
longen en leidt daarom tot een verkorting van ons leven.

En aangezien woorden slechts namen van dingen zijn, gaat de auteur van het project daarvan uit
dat het veel handiger voor ons zal zijn om de dingen bij ons te hebben die nodig zijn om onze gevoelens te uiten
gedachten en verlangens.

... veel zeer geleerde en wijze mensen gebruiken deze nieuwe manier om hun mening te uiten
gedachten met behulp van dingen.

Het enige ongemak is het feit dat, indien nodig,
voer een langdurig gesprek over verschillende onderwerpen die de gesprekspartners moeten dragen
schouders met grote bundels dingen, als de fondsen het niet toelaten er een te huren of
twee flinke jongens. Ik zag vaak twee van zulke wijze mannen, uitgeput onder
zware last, zoals onze venters. Toen ze elkaar op straat tegenkwamen, gingen ze op de foto
schoudertassen, opende ze en haalde daar de nodige spullen uit en voerde zo een gesprek in
voortzetting van het uur; daarna stapelden ze hun keukengerei op en hielpen elkaar de last erop te tillen
schouders, afscheid genomen en uit elkaar gegaan.

Voor korte en eenvoudige gesprekken kun je echter alles wat je nodig hebt in je zak dragen
of onder de arm, en een gesprek dat thuis plaatsvindt veroorzaakt geen gesprek
moeilijkheden. Daarom zijn de kamers waar mensen die deze methode gebruiken, samenkomen, gevuld met
allerlei voorwerpen die geschikt zijn om als materiaal voor dergelijke kunstobjecten te dienen
gesprekken.

Een ander groot voordeel van deze uitvinding is dat deze kan worden gebruikt
als een universele taal, begrijpelijk voor alle beschaafde landen, voor meubels en huishoudens
de gebruiksvoorwerpen zijn overal hetzelfde of zeer vergelijkbaar, zodat het gebruik ervan gemakkelijk te begrijpen is.
Zo kunnen gezanten gemakkelijk met buitenlandse koningen spreken
ministers wier taal hen volkomen onbekend is..."

Dus je raadt waarschijnlijk al waar ik hiermee heen ga:)

Waarom worden luchttrillingen (geluiden) over vele honderden en duizenden kilometers overgedragen?
moeite doen met codering (om deze luchttrillingen zo nauwkeurig en efficiënt mogelijk over te brengen naar de ontvanger), de noodzakelijke bandbreedte behouden, indien semantisch
Is de belasting van deze transmissie minimaal of neigt deze zelfs naar nul?

Mensen communiceren immers niet met elkaar via geluiden, maar via betekenis, inhoud, semantiek, gedachten...

Het concept van het nieuwe communicatiesysteem is vrij eenvoudig: aan de bronzijde A is er audio
trillingen worden ook gedigitaliseerd, maar worden niet direct doorgegeven aan de andere partij, maar
worden omgezet in tekst (Speech To Text) en vervolgens wordt de betekenisvolle tekst eruit gehaald
abonnee A, die:

  • kan worden verzonden met de minimaal vereiste databandbreedte (zelfs HF-radiocommunicatie is mogelijk, enz.)
  • kan worden gecodeerd met elk sterk coderingsalgoritme

Aan kant B worden ontvangen berichten gedecodeerd en als stem weergegeven
abonnee A (Tekst naar spraak).

Je kunt ook de zogenaamde B-kant downloaden. stemavatar van abonnee A, wie zou dat doen
herhaalde nauwkeurig de manier van spreken van abonnee A.

Een apart kanaal kan achtergrondgeluiden en emoties doorgeven.

Een revolutie in communicatie? Met de nieuwe aanpak kunt u 100 keer of meer bandbreedte besparen voor audio- en videogesprekken

Hetzelfde geldt voor videocommunicatie, vooral omdat individuele elementen dat al lang zijn
bestaan ​​in applicaties (verschillende maskers, achtergrond in Zoom, etc.).

Ja, er zijn technische aspecten die momenteel niet volledig in de juiste vorm zijn geïmplementeerd -
De snelheid van spraak-naar-tekst-conversie zal bijvoorbeeld van cruciaal belang zijn, maar wel nuttig
Voorspellende AI-conversie-algoritmen kunnen deze snelheid aanzienlijk verhogen.

Het belangrijkste voordeel is dat er minimale bandbreedte nodig is in het transmissiemedium
gegevens.

Die. Dit principe kan niet alleen voor het gewone dagelijkse leven worden gebruikt
communicatie, maar ook voor militaire en langeafstandscommunicatie met grote vertragingen
(ruimtecommunicatie, interplanetair - maan, Mars, enz. :)

Hoewel dit een beschrijving van het concept is, zijn er in een van onze projecten in feite al meerdere
Een prototype met dit principe is al maanden in gebruik.

Maar daarover de volgende keer meer...

Bron: www.habr.com

Voeg een reactie