Sebuah revolusi dalam komunikasi? Pendekatan baru ini memungkinkan Anda menghemat bandwidth hingga 100 kali atau lebih untuk panggilan audio dan video

Sebuah revolusi dalam komunikasi? Pendekatan baru ini memungkinkan Anda menghemat bandwidth hingga 100 kali atau lebih untuk panggilan audio dan video

Banyak orang ingat bahwa serial TV “Silicon Valley” adalah tentang programmer Richard
Hendrix, yang secara tidak sengaja menemukan algoritma kompresi data yang revolusioner dan memutuskan
membangun startup Anda.

Konsultan serial ini bahkan menyarankan metrik yang dapat digunakan untuk mengevaluasi
algoritma serupa adalah Skor Weissman fiktif.

Lebih lanjut dalam ceritanya, startup tersebut membuat obrolan video menggunakan solusi ini.

Komunitas yang dihormati diundang untuk mendiskusikan hal lain yang sama sekali tidak biasa
prinsip kompresi data untuk panggilan audio dan video, yang menyelesaikan masalah dengan yang baru,
sisi yang tidak terduga.

Jika Anda ingin berpartisipasi dalam diskusi tentang solusi ini, dan juga mencari tahu kesamaannya
konsep dengan Jonathan Swift dan karya Leo Tolstoy, silakan di bawah cat.

Sedikit teori

Mari kita jelaskan secara umum cara kerja komunikasi audio modern - prinsipnya sama untuk keduanya
panggilan melalui jaringan GSM, serta untuk pesan instan dan jaringan VOIP.

Getaran suara dikirim ke mikrofon smartphone, kemudian secara analog-digital
konverter (ADC atau ADC):

Sebuah revolusi dalam komunikasi? Pendekatan baru ini memungkinkan Anda menghemat bandwidth hingga 100 kali atau lebih untuk panggilan audio dan video

Selanjutnya, pengkodean terjadi dengan berbagai codec (G711, G729, OPUS, GSM, dll.),
enkripsi ditambahkan atau tidak ditambahkan (SRTP, ZPTP, dll.) dan dikirim ke lingkungan
transmisi data.

Misalnya, hampir semua pengirim pesan instan (WhatsApp, Viber, dll.) menggunakan codec yang sama (akhir-akhir ini biasanya Opus), dan hampir sama sedikit
protokol yang dimodifikasi (berdasarkan SIP, WebRTC).

Jaringan transmisi data dapat berupa Internet publik atau jaringan GSM atau
intranet:

Sebuah revolusi dalam komunikasi? Pendekatan baru ini memungkinkan Anda menghemat bandwidth hingga 100 kali atau lebih untuk panggilan audio dan video

Enkripsi adalah elemen opsional dalam skema ini, misalnya dalam banyak kasus untuk
Enkripsi telepon SIP tidak digunakan.

Namun sebaliknya, di messenger, mereka biasanya menggunakan milik mereka sendiri
protokol untuk enkripsi suara dan video.

Selanjutnya, proses sebaliknya terjadi - penerima, setelah menerima data, menerjemahkan informasi yang diterima, kemudian sinyal masuk ke DAC (konverter digital-ke-analog) dan kemudian masuk ke penguat audio yang terhubung ke speaker:

Sebuah revolusi dalam komunikasi? Pendekatan baru ini memungkinkan Anda menghemat bandwidth hingga 100 kali atau lebih untuk panggilan audio dan video

Karakteristik codec modern:

G.711 64 Kbps.
G.726 16, 24, 32 atau 40 Kbps.
G.729A 8 Kb/detik.
GSM 13 Kb/detik.
iLBC 13.3 Kb/detik. (bingkai 30ms); 15.2 Kb/detik. (bingkai 20ms)
Speex Berkisar dari 2.15 hingga 22.4 Kb/detik.
G.722 64 Kbps.

Jadi, misalnya, selama 7 menit percakapan di WhatsApp atau Skype akan terjadi
Sekitar 1 MB digunakan.

Mari kita ingat angka-angka ini - 1 MB untuk 7 menit percakapan, kita akan membutuhkannya segera.

“Leo Tolstoy seperti cermin… revolusi…”

Mari kita ingat novel paling terkenal dari penulis hebat Rusia ini:

“War and Peace” adalah novel epik karya Leo Nikolaevich Tolstoy, yang menggambarkan bahasa Rusia
masyarakat selama perang melawan Napoleon pada tahun 1805-1812. Epilog novel ini membawa
narasi hingga tahun 1820.

Novel “Perang dan Damai” oleh L.N. Tolstoy mengabdikan tujuh tahun kerja yang intens dan gigih.Naskah-naskah menjadi saksi bagaimana salah satu ciptaan terbesar di dunia diciptakan.
“Perang dan Damai”: arsip penulis berisi lebih dari 5200 lembar yang ditulis dengan indah.

Jika sekarang Anda ingin membaca novel ini, Anda dapat mendownloadnya dengan mudah.

Dan file ini beratnya hanya... 1 MB:

Sebuah revolusi dalam komunikasi? Pendekatan baru ini memungkinkan Anda menghemat bandwidth hingga 100 kali atau lebih untuk panggilan audio dan video

Format fb2 dan epub, seperti zip, rar, pada prinsipnya dapat dianggap sejenis
codec

Mari kita pikirkan - 7 menit percakapan kita di WhatsApp sama dalam hal volume lalu lintas
sebuah karya hebat yang membutuhkan waktu 7 tahun untuk ditulis!

Percakapan 7 menit dikodekan dengan codec karya, novel dikodekan dengan ePub, volumenya sama -
1MB, tapi perbedaannya sangat besar!

perjalanan si Gulliver

Semua orang tahu karya Jonathan Swift ini sejak kecil, tapi nyatanya buku ini bukan untuk itu
anak-anak.

Gulliver's Travels merupakan sindiran politik untuk orang dewasa, tentunya dalam konteks 18
abad.

Hal yang mengejutkan adalah bahwa Swift, menjadi penentang keras orang-orang sezamannya yang lain -
Newton, dalam bukunya “Gulliver’s Travels” tidak hanya meramalkan penemuan satelit
Mars (dengan deskripsi karakteristiknya yang cukup akurat), tetapi juga dijelaskan dengan cukup menarik
cara komunikasi antar manusia:

“...proyek ini menuntut penghapusan total semua kata;
penulis proyek ini terutama mengacu pada manfaat kesehatan dan penghematannya
waktu.

Bagaimanapun, jelas bahwa setiap kata yang kita ucapkan dikaitkan dengan suatu keausan.
paru-paru dan, oleh karena itu, menyebabkan berkurangnya hidup kita.

Dan karena kata-kata hanyalah nama suatu benda, penulis proyek membuat asumsi demikian
bahwa akan lebih mudah bagi kita untuk membawa barang-barang yang diperlukan untuk mengekspresikan keinginan kita
pikiran dan keinginan.

... banyak orang terpelajar dan bijaksana menggunakan cara baru ini untuk mengekspresikan pendapat mereka
pikiran dengan bantuan benda.

Satu-satunya ketidaknyamanannya adalah kenyataan bahwa, jika perlu,
melakukan percakapan panjang lebar tentang berbagai topik yang harus dibawa oleh lawan bicara
bahu dengan banyak barang, jika dana tidak memungkinkan untuk menyewa satu atau
dua pria kekar. Saya sering melihat dua orang bijak seperti itu, kelelahan
beban yang berat, seperti pedagang asongan kami. Saat mereka bertemu di jalan, mereka berfoto
tas bahu, membukanya dan, mengeluarkan barang-barang yang diperlukan dari sana, kemudian melanjutkan percakapan
kelanjutan jam tersebut; kemudian mereka menumpuk peralatan mereka dan saling membantu mengangkat beban
bahu, mengucapkan selamat tinggal dan berpisah.

Namun, untuk percakapan singkat dan sederhana Anda dapat membawa semua yang Anda perlukan di saku
atau di bawah lengan, dan percakapan yang terjadi di rumah tidak menimbulkan apapun
kesulitan. Oleh karena itu, ruangan tempat orang-orang yang menggunakan metode ini berkumpul akan terisi
segala macam benda yang cocok untuk dijadikan bahan buatan tersebut
percakapan.

Keuntungan besar lainnya dari penemuan ini adalah dapat digunakan
sebagai bahasa universal, dapat dimengerti oleh semua bangsa yang beradab, untuk perabotan dan rumah tangga
peralatannya sama atau sangat mirip dimana-mana, sehingga penggunaannya mudah dipahami.
Dengan demikian, utusan dapat dengan mudah berbicara dengan raja-raja asing atau
menteri yang bahasanya sama sekali tidak mereka kenal..."

Jadi, Anda mungkin sudah menebak ke mana tujuan saya dengan ini :)

Mengapa mengirimkan getaran udara (suara) sejauh ratusan dan ribuan kilometer?
repot dengan pengkodean (untuk menyampaikan getaran udara ini ke penerima seakurat dan seefisien mungkin), pertahankan bandwidth yang diperlukan, jika semantik
Apakah beban transmisi ini minim, atau malah cenderung nol?

Bagaimanapun, orang berkomunikasi satu sama lain bukan dengan suara, tetapi dengan makna, isi, semantik, pikiran...

Konsep sistem komunikasi baru ini cukup sederhana - di sisi sumber A terdapat audio
getarannya juga didigitalkan, tetapi tidak langsung diteruskan ke pihak lain, melainkan
diubah menjadi teks (Speech To Text) dan kemudian teks bermakna darinya
pelanggan A, yang:

  • dapat ditransmisikan dengan bandwidth data minimum yang diperlukan (bahkan komunikasi radio HF pun dimungkinkan, dll.)
  • dapat dienkripsi dengan algoritma enkripsi yang kuat

Di sisi B, pesan yang diterima didekripsi dan direproduksi sebagai suara
pelanggan A (Text To Speech).

Anda juga dapat mengunduh apa yang disebut sisi B. avatar suara pelanggan A, siapa yang mau
secara akurat mengulangi cara bicara pelanggan A.

Saluran terpisah dapat mengirimkan kebisingan dan emosi latar belakang.

Sebuah revolusi dalam komunikasi? Pendekatan baru ini memungkinkan Anda menghemat bandwidth hingga 100 kali atau lebih untuk panggilan audio dan video

Hal yang sama juga berlaku untuk komunikasi video - terutama karena elemen individual sudah lama ada
ada di aplikasi (berbagai topeng, latar belakang di Zoom, dll).

Ya, ada aspek teknis yang saat ini belum sepenuhnya diterapkan dalam bentuk yang semestinya -
misalnya, kecepatan konversi Ucapan Ke Teks akan sangat penting, tetapi menggunakan
Algoritme konversi AI prediktif dapat meningkatkan kecepatan ini secara signifikan.

Keuntungan yang paling penting adalah dibutuhkan bandwidth minimal dalam media transmisi
data.

Itu. Prinsip ini tidak hanya bisa digunakan untuk kehidupan sehari-hari biasa
komunikasi, tetapi juga untuk komunikasi militer dan jarak jauh dengan penundaan yang lama
(komunikasi luar angkasa, antarplanet - Bulan, Mars, dll. :)

Walaupun ini gambaran konsepnya, nyatanya di salah satu proyek kami sudah ada beberapa
Sebuah prototipe dengan prinsip ini telah digunakan selama berbulan-bulan.

Tapi lebih banyak tentang itu lain kali...

Sumber: www.habr.com

Tambah komentar