Революция в комуникациите? Новият подход ви позволява да спестите честотна лента 100 пъти или повече за аудио и видео разговори

Революция в комуникациите? Новият подход ви позволява да спестите честотна лента 100 пъти или повече за аудио и видео разговори

Много хора помнят, че телевизионният сериал "Силиконовата долина" е за програмиста Ричард
Хендрикс, който случайно измисли революционен алгоритъм за компресиране на данни и реши
изградете своя стартъп.

Консултантите на сериала дори предложиха метрика, с която да се оценява
подобни алгоритми са фиктивният резултат на Weissman.

По-нататък в историята стартирането направи видео чат, използвайки това решение.

Уважаваната общност е поканена да обсъди друг, напълно необичаен
принципът на компресиране на данни за аудио и видео разговори, който решава проблема с нов,
неочаквана страна.

Ако искате да участвате в обсъждането на това решение и да разберете какво е общото между него
концепции с Джонатан Суифт и творбите на Лев Толстой, моля под кат.

Малко теория

Нека опишем най-общо как работи съвременната аудио комуникация - принципът е един и същ и за двете
разговори през GSM мрежата, както и за месинджъри и VOIP мрежи.

Звуковите вибрации се изпращат към микрофона на смартфона, след което в аналогово-цифров режим
конвертор (ADC или ADC):

Революция в комуникациите? Новият подход ви позволява да спестите честотна лента 100 пъти или повече за аудио и видео разговори

След това кодирането се извършва с различни кодеци (G711, G729, OPUS, GSM и др.),
криптиране се добавя или не се добавя (SRTP, ZPTP и т.н.) и се изпраща в средата
предаване на данни.

Например, почти всички месинджъри (WhatsApp, Viber и т.н.) използват едни и същи кодеци (напоследък това обикновено е Opus) и почти същите леко
модифицирани протоколи (базирани на SIP, WebRTC).

Мрежата за предаване на данни може да бъде или общественият интернет, или GSM мрежата
интранет:

Революция в комуникациите? Новият подход ви позволява да спестите честотна лента 100 пъти или повече за аудио и видео разговори

Шифроването е незадължителен елемент в тази схема, например в повечето случаи за
Не се използва криптиране на SIP телефония.

Но в месинджърите, напротив, те обикновено използват своя собствена собственост
протоколи за криптиране на глас и видео.

След това се случва обратният процес - получателят, след като получи данните, декодира получената информация, след това сигналът отива към DAC (цифрово-аналогов преобразувател) и след това влиза в аудио усилвателя, свързан към високоговорителя:

Революция в комуникациите? Новият подход ви позволява да спестите честотна лента 100 пъти или повече за аудио и видео разговори

Характеристики на съвременните кодеци:

G.711 64 Kbps.
G.726 16, 24, 32 или 40 Kbps.
G.729A 8 Kb/сек.
GSM 13 Kb/сек.
iLBC 13.3 Kb/сек. (30ms рамка); 15.2 Kb/сек. (20ms кадър)
Диапазон на Speex от 2.15 до 22.4 Kb/сек.
G.722 64 Kbps.

Така например по време на 7-минутен разговор по WhatsApp или Skype ще има
Използвани са около 1 MB.

Да запомним тези цифри - 1MB за 7 минути разговор, скоро ще ни трябват.

„Лев Толстой е като огледало... на революцията...“

Нека си спомним най-известния роман на този велик руски писател:

„Война и мир“ е епичен роман на Лев Николаевич Толстой, описващ руския
общество по време на войните срещу Наполеон през 1805-1812 г. Епилогът на романа носи
разказ до 1820 г.

Романът „Война и мир” на Л.Н. Толстой посвети седем години интензивна и упорита работа. Ръкописите свидетелстват за това как е създадено едно от най-големите творения в света.
„Война и мир”: архивът на писателя съдържа над 5200 фино изписани листа.

Ако сега искате да прочетете този роман, можете лесно да го изтеглите.

И този файл тежи само... 1 MB:

Революция в комуникациите? Новият подход ви позволява да спестите честотна лента 100 пъти или повече за аудио и видео разговори

Форматите fb2 и epub, също като zip, rar по принцип могат да се разглеждат като вид
кодеци

Нека помислим за това - 7 минути от нашия разговор в WhatsApp са равни по отношение на обема на трафика
страхотна работа, която отне 7 години да бъде написана!

Разговор от 7 минути е кодиран с кодека opus, романът е кодиран с ePub, обемът е същият -
1 MB, но каква огромна разлика!

Пътешествията на Гъливер

Всеки знае това произведение на Джонатан Суифт от детството, но всъщност тази книга не е за
деца.

Пътешествията на Гъливер е политическа сатира за възрастни, разбира се в контекста на 18
век.

Изненадващото е, че Суифт, като яростен противник на другия си съвременник -
Нютон в своите „Пътешествията на Гъливер“ не само предсказва откриването на спътници
Марс (с доста точно описание на техните характеристики), но също така е описано доста интересно
начин на общуване между хората:

„... проектът изискваше пълното премахване на всички думи;
авторът на този проект се позовава главно на неговите ползи за здравето и икономии
времени.

В крайна сметка е очевидно, че всяка наша дума е свързана с известно износване.
белите дробове и следователно води до намаляване на живота ни.

И тъй като думите са само имена на неща, авторът на проекта прави предположението, че
че ще ни бъде много по-удобно да носим със себе си нещата, необходими за изразяване на нашите
мисли и желания.

... много много учени и мъдри хора използват този нов начин за изразяване на своите
мисли с помощта на нещата.

Единственото му неудобство е фактът, че при необходимост
провеждайте дълъг разговор на различни теми, които събеседниците трябва да носят
рамене с големи пакети неща, ако средствата не позволяват наемането на такъв или
двама яки момчета. Често ми се случваше да виждам двама такива мъдреци, изтощени под
тежко бреме, като нашите търговци. Когато се срещнаха на улицата, те се снимаха
чанти през рамо, отвори ги и като извади оттам необходимите вещи, по този начин проведе разговор
продължение на часа; след това натрупаха приборите си и си помогнаха да вдигнат товара
рамене, сбогуваха се и се разделиха.

Въпреки това, за кратки и прости разговори можете да носите всичко необходимо в джоба си
или под мишницата, а разговорът, който се провежда у дома, не предизвиква никакви
трудности. Следователно стаите, където се събират хората, използващи този метод, са пълни с
всички видове предмети, подходящи да служат като материал за такива изкуствени
разговори.

Друго голямо предимство на това изобретение е, че може да се използва
като универсален език, разбираем за всички цивилизовани нации, за мебели и бита
приборите са еднакви или много сходни навсякъде, така че тяхното използване лесно може да се разбере.
Така пратениците могат лесно да говорят с чужди крале или
министри, чийто език им е напълно непознат..."

Така че вероятно вече се досещате накъде отивам с това :)

Защо да предавате въздушни вибрации (звуци) на много стотици и хиляди километри?
занимавайте се с кодирането (за да предадете тези вибрации на въздуха на получателя възможно най-точно и ефективно), поддържайте необходимата честотна лента, ако е семантична
Натоварването на тази трансмисия минимално ли е или дори клони към нула?

В крайна сметка хората общуват помежду си не със звуци, а със смисъл, съдържание, семантика, мисли...

Концепцията на новата комуникационна система е доста проста - от страна на източника A има аудио
вибрациите също се дигитализират, но не се предават веднага на другата страна, а
се преобразуват в текст (Speech To Text) и след това смисленият текст от
абонат А, който:

  • може да се предава с минимално необходимата честотна лента на данни (възможни са дори HF радио комуникации и т.н.)
  • могат да бъдат криптирани с всеки силен алгоритъм за криптиране

От страна B получените съобщения се дешифрират и възпроизвеждат като глас от
абонат A (текст в говор).

Можете също така да изтеглите така наречената страна B. гласов аватар на абонат А, който би
точно повтори маниера на речта на абоната А.

Отделен канал може да предава фонов шум и емоции.

Революция в комуникациите? Новият подход ви позволява да спестите честотна лента 100 пъти или повече за аудио и видео разговори

Същото важи и за видео комуникацията - особено след като отделните елементи отдавна съществуват
съществуват в приложения (различни маски, фон в Zoom и др.).

Да, има технически аспекти, които в момента не са напълно изпълнени в правилната форма -
например, скоростта на преобразуване на говор в текст ще бъде критична, но използвайки
Алгоритмите за предсказуемо AI преобразуване могат значително да увеличат тази скорост.

Най-важното предимство е, че се изисква минимална честотна лента в предавателната среда
данни.

Тези. Този принцип може да се използва не само за обикновеното ежедневие
комуникации, но също и за военни и комуникации на дълги разстояния с големи закъснения
(космическа комуникация, междупланетна - Луна, Марс и др. :)

Въпреки че това е описание на концепцията, всъщност в един от нашите проекти вече има няколко
Прототип с този принцип се използва от месеци.

Но повече за това следващия път...

Източник: www.habr.com

Добавяне на нов коментар