Revolutie in communicatie? Nieuwe aanpak maakt 100 keer of meer besparing van bandbreedte mogelijk tijdens audio- en videogesprekken

Revolutie in communicatie? Nieuwe aanpak maakt 100 keer of meer besparing van bandbreedte mogelijk tijdens audio- en videogesprekken

Veel mensen herinneren zich dat de tv-serie "Silicon Valley" over de programmeur Richard gaat
Hendrix, die per ongeluk een revolutionair algoritme voor datacompressie bedacht en besloot
bouw je eigen startup.

De adviseurs van de show stelden zelfs een maatstaf voor die gebruikt zou kunnen worden om
vergelijkbare algoritmen - de fictieve Weissman Score.

Later creëerde de startup een videochat met behulp van deze oplossing.

De geachte gemeenschap krijgt een andere, volkomen ongebruikelijke, mogelijkheid tot discussie aangeboden
een principe voor gegevenscompressie voor audio- en videogesprekken dat het probleem oplost met een nieuwe,
onverwachte kant.

Als u wilt deelnemen aan de discussie over dit besluit en ook wilt weten wat dit betekent,
concepten met Jonathan Swift en de werken van Leo Tolstoj, zie hieronder.

Een beetje theorie

Laten we in algemene termen beschrijven hoe moderne audiocommunicatie werkt - het principe is voor beide hetzelfde
gesprekken via het GSM-netwerk, maar ook via messenger- en VOIP-netwerken.

Geluidstrillingen worden naar de microfoon van de smartphone gestuurd en vervolgens naar de analoog-digitale
omvormer (ADC):

Revolutie in communicatie? Nieuwe aanpak maakt 100 keer of meer besparing van bandbreedte mogelijk tijdens audio- en videogesprekken

Vervolgens vindt codering plaats met behulp van verschillende codecs (G711, G729, OPUS, GSM, enz.),
of encryptie wordt toegevoegd of niet (SRTP, ZPTP, etc.) en naar de omgeving wordt verzonden
gegevensoverdracht.

Zo gebruiken bijna alle messengers (WhatsApp, Viber, etc.) dezelfde codecs (de laatste tijd is dat meestal Opus), en bijna dezelfde enigszins
aangepaste protocollen (gebaseerd op SIP, WebRTC).

Het datatransmissienetwerk kan het openbare internet of een GSM-netwerk zijn, of
Intranet:

Revolutie in communicatie? Nieuwe aanpak maakt 100 keer of meer besparing van bandbreedte mogelijk tijdens audio- en videogesprekken

Encryptie is een optioneel element in dit schema, bijvoorbeeld in de meeste gevallen voor
Bij SIP-telefonie wordt geen gebruik gemaakt van encryptie.

Maar bij messengers is het precies andersom: in de regel gebruiken ze hun eigen gepatenteerde
protocollen voor spraak- en videoversleuteling.

Vervolgens vindt het omgekeerde proces plaats: de ontvanger, die de gegevens heeft ontvangen, decodeert de ontvangen informatie, waarna het signaal naar de DAC (digitaal-naar-analoog-converter) gaat en vervolgens naar de audioversterker die op de luidspreker is aangesloten.

Revolutie in communicatie? Nieuwe aanpak maakt 100 keer of meer besparing van bandbreedte mogelijk tijdens audio- en videogesprekken

Kenmerken van moderne codecs:

G.711 64 kbps
G.726 16, 24, 32 of 40 Kbps.
G.729A 8 Kbps
GSM 13 Kbps.
iLBC 13.3 Kb/sec. (30 ms frame); 15.2 Kb/sec. (20 ms frame)
Speex-bereik van 2.15 tot 22.4 Kbps.
G.722 64 kbps

Zo zal het bijvoorbeeld tijdens een gesprek van 7 minuten op WhatsApp of Skype zijn
ongeveer 1 MB gebruikt.

Onthoud deze getallen: 1 MB voor een gesprek van 7 minuten. We hebben ze binnenkort nodig.

“Leo Tolstoj als spiegel… van de revolutie…”

Laten we de beroemdste roman van deze grote Russische schrijver eens herdenken:

"Oorlog en Vrede" is een epische roman van Leo Tolstoj, die de Russische
samenleving tijdens de oorlogen tegen Napoleon in 1805-1812. De epiloog van de roman is veelzeggend
verhaal tot 1820.

De roman "Oorlog en Vrede" van L.N. Tolstoj heeft er zeven jaar lang intensief en volhardend aan gewerkt. Manuscripten getuigen van hoe een van de grootste werken ter wereld tot stand kwam
"Oorlog en Vrede": in het archief van de schrijver zijn meer dan 5200 prachtig geschreven vellen bewaard gebleven.

Als u deze roman nu wilt lezen, kunt u deze eenvoudig downloaden.

En dit bestand weegt slechts… 1 MB:

Revolutie in communicatie? Nieuwe aanpak maakt 100 keer of meer besparing van bandbreedte mogelijk tijdens audio- en videogesprekken

De fb2- en epub-formaten kunnen, net als zip en rar, in principe worden beschouwd als een soort
codecs.

Laten we er eens over nadenken: 7 minuten van ons gesprek op WhatsApp staat gelijk aan het verkeersvolume
een geweldig werk waar ik 7 jaar aan heb gewerkt!

Het 7 minuten durende gesprek werd gecodeerd met de opus-codec, de roman werd gecodeerd met ePub, het volume is hetzelfde –
1MB, maar wat een enorm verschil!

Gulliver's reizen

Iedereen kent dit werk van Jonathan Swift al van jongs af aan, maar eigenlijk is dit boek niet voor
kinderen.

Gulliver's Travels is een politieke satire voor volwassenen, uiteraard in de context van 18
eeuw.

Wat verrassend is, is dat Swift, een felle tegenstander van een andere tijdgenoot –
Newton voorspelde in zijn “Gulliver’s Travels” niet alleen de ontdekking van satellieten
Mars (met een vrij nauwkeurige beschrijving van hun kenmerken), maar beschreef ook een nogal interessante
een manier van communicatie tussen mensen:

“… het project vereiste de volledige afschaffing van alle woorden;
De auteur van dit project verwees vooral naar de gezondheidsvoordelen en besparingen
tijd.

Het is immers duidelijk dat elk woord dat we spreken gepaard gaat met enige slijtage.
longen en leidt daarom tot een verkorting van onze levensduur.

En aangezien woorden slechts namen van dingen zijn, suggereert de auteur van het project dat
dat het voor ons veel gemakkelijker zal zijn om de dingen bij ons te hebben die nodig zijn om onze gevoelens te uiten.
gedachten en verlangens.

... veel zeer geleerde en wijze mensen gebruiken deze nieuwe manier om hun gevoelens te uiten
gedachten met behulp van dingen.

Het enige nadeel is dat, indien nodig,
om een ​​lang gesprek over uiteenlopende onderwerpen te kunnen voeren, moeten de gesprekspartners hun stem kunnen laten horen
schouders grote bundels met spullen, als de financiën het niet toelaten om er een te huren of
twee stevige kerels. Ik heb vaak twee zulke wijzen zien wegkwijnen onder
met de last van de last, net als onze marskramers. Toen ze elkaar op straat ontmoetten, deden ze hun
schoudertassen, opende ze en, nadat ik de benodigde spullen eruit had gehaald, voerde ik op deze manier een gesprek
voortzetting van het uur; Daarna legden ze hun keukengerei weg en hielpen elkaar de lading op de grond te laden.
schouders eronder, namen afscheid en gingen ieder hun eigen weg.

Voor korte en eenvoudige gesprekken kunt u echter alles wat u nodig hebt in uw zak meenemen.
of onder de arm, en het gesprek dat plaatsvindt in een thuissituatie veroorzaakt geen
moeilijkheden. Daarom zijn de kamers waar mensen die deze methode gebruiken samenkomen gevuld met
allerlei voorwerpen die geschikt zijn om als materiaal te dienen voor dergelijke kunstmatige
gesprekken.

Een ander groot voordeel van deze uitvinding is dat deze gebruikt kan worden
als een universele taal, begrijpelijk voor alle beschaafde naties, voor meubels en huishoudelijke artikelen
de gebruiksvoorwerpen zijn overal hetzelfde of zeer gelijkend, zodat het gebruik ervan gemakkelijk te begrijpen is.
Zo kunnen gezanten gemakkelijk met buitenlandse koningen spreken of
ministers, wier taal voor hen volkomen onbekend is…”

Dus je raadt waarschijnlijk al waar ik heen wil met dit bericht 🙂

Waarom trillingen in de lucht (geluiden) over honderden en duizenden kilometers overbrengen,
zich bezighouden met codering (om deze schokken van de lucht zo nauwkeurig en kwalitatief mogelijk over te brengen aan de geadresseerde), de nodige bandbreedte te behouden, als de semantische
de belasting van deze transmissie minimaal is, of zelfs naar nul neigt?

Mensen communiceren immers niet met elkaar via klanken, maar via betekenis, inhoud, semantiek, gedachten...

Het concept van het nieuwe communicatiesysteem is vrij eenvoudig: aan de bronzijde A bevindt zich het geluid
de trillingen worden ook gedigitaliseerd, maar worden niet direct doorgegeven aan de andere partij, maar
worden omgezet in tekst (Speech To Text) en vervolgens wordt de reeds betekenisvolle tekst van
abonnee A, die:

  • kan worden verzonden met een minimale vereiste datatransmissiebandbreedte (zelfs radiocommunicatie zoals HF, enz. is mogelijk)
  • kan worden gecodeerd met elk sterk coderingsalgoritme

Op kant B worden de ontvangen berichten gedecodeerd en als stem van de ontvanger weergegeven.
abonnee A (tekst-naar-spraak).

Het is ook mogelijk om op de B-zijde de zogenaamde stemavatar van abonnee A te laden, die zou zijn
herhaalde exact de manier van spreken van abonnee A.

Achtergrondgeluiden en emoties kunnen via een apart kanaal worden overgebracht.

Revolutie in communicatie? Nieuwe aanpak maakt 100 keer of meer besparing van bandbreedte mogelijk tijdens audio- en videogesprekken

Hetzelfde geldt voor videocommunicatie, vooral omdat individuele elementen al lang niet meer in beeld zijn.
bestaan ​​in applicaties (verschillende maskers, achtergrond in Zoom, etc.).

Ja, er zijn technische aspecten die nog niet volledig in de juiste vorm zijn geïmplementeerd –
de snelheid van de spraak-naar-tekst-conversie zal bijvoorbeeld cruciaal zijn, maar het gebruik van
Voorspellende AI-conversie-algoritmen kunnen deze snelheid aanzienlijk verhogen.

Het belangrijkste voordeel is dat er een minimale bandbreedte in het transmissiemedium nodig is.
gegevens.

Die. Dit principe kan niet alleen voor alledaagse dingen worden gebruikt
communicatie, maar ook voor militaire en langeafstandscommunicatie met grote vertragingen
(ruimtecommunicatie, interplanetair – Maan, Mars, enz. :))

Hoewel dit een beschrijving van het concept is, zijn er in feite in één van onze projecten al verschillende
Een prototype met dit principe is al maanden in gebruik.

Maar daarover de volgende keer meer...

Bron: www.habr.com

Voeg een reactie