Rewolucja w komunikacji? Nowe podejście pozwala zaoszczędzić 100-krotnie lub więcej przepustowości w przypadku połączeń audio i wideo

Rewolucja w komunikacji? Nowe podejście pozwala zaoszczędzić 100-krotnie lub więcej przepustowości w przypadku połączeń audio i wideo

Wiele osób pamięta, że ​​serial „Dolina Krzemowa” opowiada o programiście Richardzie
Hendrix, który przypadkowo wymyślił rewolucyjny algorytm kompresji danych i zdecydował
zbuduj swój startup.

Konsultanci serii zaproponowali nawet miernik, według którego można dokonać oceny
podobne algorytmy to fikcyjny wynik Weissmana.

W dalszej części historii startup przeprowadził rozmowę wideo, korzystając z tego rozwiązania.

Szanowną społeczność zapraszamy do dyskusji na inny, zupełnie nietypowy temat
zasada kompresji danych dla połączeń audio i wideo, która rozwiązuje problem z nową,
nieoczekiwana strona.

Jeśli chcesz wziąć udział w dyskusji na temat tego rozwiązania, a także dowiedzieć się, co to ma wspólnego
koncepcje z Jonathanem Swiftem i twórczością Lwa Tołstoja, prosimy o kat.

Trochę teorii

Opiszmy ogólnie jak działa współczesna komunikacja audio – zasada jest taka sama w obu przypadkach
połączeń poprzez sieć GSM, a także przez komunikatory internetowe i sieci VOIP.

Wibracje dźwiękowe przesyłane są do mikrofonu smartfona, następnie w trybie analogowo-cyfrowym
konwerter (ADC lub ADC):

Rewolucja w komunikacji? Nowe podejście pozwala zaoszczędzić 100-krotnie lub więcej przepustowości w przypadku połączeń audio i wideo

Następnie kodowanie odbywa się przy użyciu różnych kodeków (G711, G729, OPUS, GSM itp.),
szyfrowanie jest dodawane lub nie dodawane (SRTP, ZPTP itp.) i wysyłane do środowiska
transmisja danych.

Przykładowo prawie wszystkie komunikatory internetowe (WhatsApp, Viber itp.) korzystają z tych samych kodeków (ostatnio jest to zazwyczaj Opus) i prawie tak samo nieco
zmodyfikowane protokoły (w oparciu o SIP, WebRTC).

Siecią transmisji danych może być publiczny Internet lub sieć GSM
intranet:

Rewolucja w komunikacji? Nowe podejście pozwala zaoszczędzić 100-krotnie lub więcej przepustowości w przypadku połączeń audio i wideo

Szyfrowanie jest elementem opcjonalnym w tym schemacie, na przykład w większości przypadków
Szyfrowanie telefonii SIP nie jest używane.

Przeciwnie, w komunikatorach zwykle używają własnego zastrzeżonego
protokoły szyfrowania głosu i obrazu.

Następnie następuje proces odwrotny – odbiorca po otrzymaniu danych dekoduje otrzymaną informację, następnie sygnał trafia do przetwornika DAC (przetwornika cyfrowo-analogowego), a następnie trafia do wzmacniacza audio podłączonego do głośnika:

Rewolucja w komunikacji? Nowe podejście pozwala zaoszczędzić 100-krotnie lub więcej przepustowości w przypadku połączeń audio i wideo

Charakterystyka współczesnych kodeków:

G.711 64 Kb/s.
G.726 16, 24, 32 lub 40 Kb/s.
G.729A 8 Kb/sek.
GSM 13 Kb/sek.
iLBC 13.3 Kb/s (ramka 30 ms); 15.2 Kb/s (klatka 20 ms)
Speex Zakres od 2.15 do 22.4 Kb/s.
G.722 64 Kb/s.

I tak np. podczas 7-minutowej rozmowy na WhatsAppie czy Skype nie będzie
Wykorzystano około 1 MB.

Zapamiętajmy te liczby - 1MB na 7 minut rozmowy, niedługo będą nam potrzebne.

„Lew Tołstoj jest jak lustro… rewolucji…”

Przypomnijmy najsłynniejszą powieść tego wielkiego rosyjskiego pisarza:

„Wojna i pokój” to epicka powieść Lwa Nikołajewicza Tołstoja opisująca język rosyjski
społeczeństwa w czasie wojen z Napoleonem w latach 1805-1812. Epilog powieści przynosi
narracja do 1820 r.

Powieść „Wojna i pokój” L.N. Tołstoj poświęcił siedem lat intensywnej i wytrwałej pracy. Rękopisy świadczą o tym, jak powstało jedno z największych dzieł świata.
„Wojna i pokój”: archiwum pisarza zawiera ponad 5200 pięknie napisanych kartek.

Jeśli teraz chcesz przeczytać tę powieść, możesz ją łatwo pobrać.

A ten plik waży tylko... 1 MB:

Rewolucja w komunikacji? Nowe podejście pozwala zaoszczędzić 100-krotnie lub więcej przepustowości w przypadku połączeń audio i wideo

Formaty fb2 i epub, podobnie jak zip, rar, w zasadzie można uznać za swego rodzaju
kodeki

Zastanówmy się – 7 minut naszej rozmowy na WhatsAppie jest równe pod względem natężenia ruchu
wspaniała praca, której napisanie zajęło 7 lat!

Rozmowa trwająca 7 minut została zakodowana w kodeku opus, powieść została zakodowana w ePub, głośność jest taka sama -
1MB, ale jaka ogromna różnica!

podróże Guliwera

Tę twórczość Jonathana Swifta znają wszyscy z dzieciństwa, ale tak naprawdę ta książka nie jest dla niej
dzieci.

Podróże Guliwera to satyra polityczna dla dorosłych, oczywiście w kontekście lat 18
stulecie.

Zaskakujące jest to, że Swift, będący zagorzałym przeciwnikiem innych swoich współczesnych...
Newton w swoich „Podróżach Guliwera” nie tylko przepowiedział odkrycie satelitów
Mars (z dość dokładnym opisem ich cech), ale też opisał dość ciekawie
sposób komunikacji między ludźmi:

„... projekt wymagał całkowitego zniesienia wszystkich słów;
autor tego projektu odniósł się głównie do korzyści zdrowotnych i oszczędności
czas.

Przecież oczywiste jest, że każde słowo, które wypowiadamy, wiąże się z pewnym zużyciem.
płuc, a co za tym idzie, prowadzi do skrócenia naszego życia.

A ponieważ słowa to tylko nazwy rzeczy, autor projektu wychodzi z takiego założenia
że o wiele wygodniej będzie nam nosić ze sobą rzeczy niezbędne do wyrażenia naszych
myśli i pragnienia.

... wielu bardzo uczonych i mądrych ludzi używa tego nowego sposobu wyrażania swoich
myśli za pomocą rzeczy.

Jedyną niedogodnością jest to, że w razie potrzeby
prowadzić długą rozmowę na różne tematy, rozmówcy muszą nieść
ramiona z dużymi pakietami rzeczy, jeśli fundusze nie pozwalają na wynajęcie jednego lub
dwóch potężnych facetów. Często zdarzało mi się widzieć dwóch takich mędrców, wyczerpanych
ciężkie brzemię, jak nasi handlarze. Kiedy spotkali się na ulicy, zrobili sobie zdjęcia
torby na ramię, otworzyłem je i wyjmując stamtąd niezbędne rzeczy, kontynuowałem w ten sposób rozmowę
kontynuacja godziny; następnie ułożyli stosy swoich przyborów i pomogli sobie nawzajem podnieść ładunek
ramiona, pożegnaliśmy się i rozeszliśmy.

Jednak do krótkich i prostych rozmów wszystko, czego potrzebujesz, możesz nosić w kieszeni
lub pod pachą, a rozmowa tocząca się w domu nie powoduje żadnego
trudności. Dlatego też pomieszczenia, w których gromadzą się osoby stosujące tę metodę, są zapełnione
wszelkiego rodzaju przedmioty nadające się jako materiał na np. sztuczne
rozmowy.

Kolejną wielką zaletą tego wynalazku jest to, że można go stosować
jako język uniwersalny, zrozumiały dla wszystkich cywilizowanych narodów, dotyczący mebli i gospodarstwa domowego
przybory są wszędzie takie same lub bardzo podobne, dzięki czemu można łatwo zrozumieć ich użycie.
W ten sposób wysłannicy mogą łatwo rozmawiać z obcymi królami lub
ministrowie, których język jest im zupełnie nieznany…”

Pewnie już się domyślacie, do czego zmierzam :)

Po co przenosić wibracje powietrza (dźwięki) na wiele setek i tysięcy kilometrów?
zawracaj sobie głowę kodowaniem (aby jak najdokładniej i najskuteczniej przekazać te wibracje powietrza do odbiorcy), utrzymuj niezbędną szerokość pasma, jeśli jest to semantyczne
Czy obciążenie tej przekładni jest minimalne, czy wręcz dąży do zera?

W końcu ludzie komunikują się ze sobą nie za pomocą dźwięków, ale znaczenia, treści, semantyki, myśli…

Koncepcja nowego systemu komunikacji jest dość prosta – po stronie źródłowej A znajduje się audio
wibracje są również digitalizowane, ale nie są natychmiast przekazywane drugiej stronie, ale
są konwertowane na tekst (Mowa na tekst), a następnie na znaczący tekst
abonent A, który:

  • mogą być przesyłane przy minimalnej wymaganej przepustowości danych (możliwa jest nawet komunikacja radiowa HF itp.)
  • można zaszyfrować dowolnym silnym algorytmem szyfrowania

Na stronie B odebrane wiadomości są odszyfrowywane i odtwarzane jako głos
abonent A (tekst na mowę).

Można także pobrać tzw. stronę B. awatar głosowy subskrybenta A, który by to zrobił
dokładnie powtórzył sposób mówienia abonenta A.

Oddzielny kanał może przesyłać szum tła i emocje.

Rewolucja w komunikacji? Nowe podejście pozwala zaoszczędzić 100-krotnie lub więcej przepustowości w przypadku połączeń audio i wideo

To samo dotyczy komunikacji wideo - zwłaszcza, że ​​poszczególne elementy są już dawno
istnieją w aplikacjach (różne maski, tło w Zoomie itp.).

Tak, istnieją aspekty techniczne, które obecnie nie są w pełni wdrożone w odpowiedniej formie -
na przykład szybkość konwersji mowy na tekst będzie krytyczna, ale będzie używana
Algorytmy predykcyjnej konwersji AI mogą znacznie zwiększyć tę prędkość.

Najważniejszą zaletą jest to, że w medium transmisyjnym wymagana jest minimalna szerokość pasma
dane.

Te. Tę zasadę można zastosować nie tylko w codziennym życiu
łączności, ale także łączności wojskowej i na duże odległości, charakteryzującej się dużymi opóźnieniami
(komunikacja kosmiczna, międzyplanetarna - Księżyc, Mars itp. :)

Chociaż to opis koncepcji, tak naprawdę w jednym z naszych projektów jest ich już kilka
Prototyp oparty na tej zasadzie był używany od miesięcy.

Ale o tym następnym razem…

Źródło: www.habr.com

Dodaj komentarz