Một cuộc cách mạng trong truyền thông? Cách tiếp cận mới cho phép bạn tiết kiệm băng thông từ 100 lần trở lên cho các cuộc gọi âm thanh và video

Một cuộc cách mạng trong truyền thông? Cách tiếp cận mới cho phép bạn tiết kiệm băng thông từ 100 lần trở lên cho các cuộc gọi âm thanh và video

Nhiều người còn nhớ bộ phim truyền hình “Thung lũng Silicon” kể về lập trình viên Richard
Hendrix, người đã vô tình nghĩ ra một thuật toán nén dữ liệu mang tính cách mạng và quyết định
xây dựng công ty khởi nghiệp của bạn.

Các nhà tư vấn của loạt bài thậm chí còn đề xuất một thước đo để đánh giá
các thuật toán tương tự là Điểm Weissman hư cấu.

Hơn nữa, trong câu chuyện, công ty khởi nghiệp đã thực hiện một cuộc trò chuyện video bằng giải pháp này.

Cộng đồng được kính trọng được mời thảo luận về một vấn đề khác, hoàn toàn bất thường
nguyên tắc nén dữ liệu cho các cuộc gọi âm thanh và video, giúp giải quyết vấn đề bằng một cuộc gọi mới,
phía bất ngờ.

Nếu bạn muốn tham gia thảo luận về giải pháp này và cũng tìm hiểu xem điểm chung của giải pháp này là gì
các khái niệm với Jonathan Swift và các tác phẩm của Leo Tolstoy, xin vui lòng theo dõi mèo.

Một chút lý thuyết

Chúng ta hãy mô tả một cách chung chung cách hoạt động của giao tiếp âm thanh hiện đại - nguyên tắc giống nhau cho cả hai
cuộc gọi qua mạng GSM, cũng như cho các trình nhắn tin tức thời và mạng VOIP.

Rung động âm thanh được gửi đến micrô của điện thoại thông minh, sau đó ở dạng kỹ thuật số tương tự
bộ chuyển đổi (ADC hoặc ADC):

Một cuộc cách mạng trong truyền thông? Cách tiếp cận mới cho phép bạn tiết kiệm băng thông từ 100 lần trở lên cho các cuộc gọi âm thanh và video

Tiếp theo, quá trình mã hóa diễn ra với nhiều loại codec (G711, G729, OPUS, GSM, v.v.),
mã hóa được thêm hoặc không được thêm (SRTP, ZPTP, v.v.) và gửi ra môi trường
truyền dữ liệu.

Ví dụ: hầu hết tất cả các trình nhắn tin tức thời (WhatsApp, Viber, v.v.) đều sử dụng cùng một codec (gần đây thường là Opus) và gần như giống nhau một chút
các giao thức được sửa đổi (dựa trên SIP, WebRTC).

Mạng truyền dữ liệu có thể là mạng Internet công cộng hoặc mạng GSM hoặc
mạng nội bộ:

Một cuộc cách mạng trong truyền thông? Cách tiếp cận mới cho phép bạn tiết kiệm băng thông từ 100 lần trở lên cho các cuộc gọi âm thanh và video

Mã hóa là một phần tử tùy chọn trong sơ đồ này, ví dụ trong hầu hết các trường hợp đối với
Mã hóa điện thoại SIP không được sử dụng.

Nhưng ngược lại, ở các ứng dụng nhắn tin, họ thường sử dụng quyền sở hữu của riêng mình
các giao thức mã hóa thoại và video.

Tiếp theo, quá trình ngược lại xảy ra - người nhận sau khi nhận được dữ liệu sẽ giải mã thông tin nhận được, sau đó tín hiệu đi đến DAC (bộ chuyển đổi kỹ thuật số sang tương tự) rồi đi vào bộ khuếch đại âm thanh được kết nối với loa:

Một cuộc cách mạng trong truyền thông? Cách tiếp cận mới cho phép bạn tiết kiệm băng thông từ 100 lần trở lên cho các cuộc gọi âm thanh và video

Đặc điểm của codec hiện đại:

G.711 64 Kb/giây.
G.726 16, 24, 32 hoặc 40 Kbps.
G.729A 8 Kb/giây.
GSM 13 Kb/giây.
iLBC 13.3 Kb/giây. (khung 30ms); 15.2 Kb/giây. (khung 20ms)
Phạm vi Speex từ 2.15 đến 22.4 Kb/giây.
G.722 64 Kb/giây.

Vì vậy, ví dụ: trong cuộc trò chuyện dài 7 phút trên WhatsApp hoặc Skype sẽ có
Khoảng 1 MB đã được sử dụng.

Hãy ghi nhớ những con số này - 1MB cho 7 phút trò chuyện, chúng ta sẽ sớm cần đến chúng.

“Leo Tolstoy giống như một tấm gương... của cuộc cách mạng…”

Chúng ta hãy nhớ lại cuốn tiểu thuyết nổi tiếng nhất của nhà văn Nga vĩ đại này:

“Chiến tranh và hòa bình” là một cuốn tiểu thuyết sử thi của Leo Nikolaevich Tolstoy, mô tả nước Nga
xã hội trong các cuộc chiến tranh chống lại Napoléon năm 1805-1812. Phần kết của cuốn tiểu thuyết mang lại
câu chuyện cho đến năm 1820.

Tiểu thuyết “Chiến tranh và hòa bình” của L.N. Tolstoy đã cống hiến bảy năm làm việc căng thẳng và bền bỉ. Các bản thảo chứng minh cách tạo ra một trong những tác phẩm lớn nhất thế giới.
“Chiến tranh và hòa bình”: kho lưu trữ của nhà văn chứa hơn 5200 tờ viết tinh xảo.

Nếu bây giờ bạn muốn đọc cuốn tiểu thuyết này, bạn có thể dễ dàng tải xuống.

Và tập tin này chỉ nặng... 1 MB:

Một cuộc cách mạng trong truyền thông? Cách tiếp cận mới cho phép bạn tiết kiệm băng thông từ 100 lần trở lên cho các cuộc gọi âm thanh và video

Các định dạng fb2 và epub, giống như zip, rar, về nguyên tắc, có thể được coi là một loại
codec

Hãy thử nghĩ xem - 7 phút trò chuyện của chúng ta trên WhatsApp có lượng truy cập ngang nhau
một tác phẩm tuyệt vời phải mất 7 năm để viết!

Một cuộc trò chuyện dài 7 phút được mã hóa bằng codec opus, tiểu thuyết được mã hóa bằng ePub, âm lượng giống nhau -
1 MB, nhưng thật là một sự khác biệt lớn!

Gulliver's Travels

Mọi người đều biết đến tác phẩm này của Jonathan Swift từ khi còn nhỏ, nhưng thực tế cuốn sách này không dành cho
bọn trẻ.

Những chuyến du hành của Gulliver là một tác phẩm châm biếm chính trị dành cho người lớn, tất nhiên là trong bối cảnh thế giới 18.
thế kỷ.

Điều đáng ngạc nhiên là Swift, một đối thủ nặng ký của người cùng thời với anh -
Newton, trong cuốn “Những chuyến du hành của Gulliver” không chỉ dự đoán việc phát hiện ra các vệ tinh
Sao Hỏa (với mô tả khá chính xác về đặc điểm của chúng), nhưng cũng mô tả một điều khá thú vị
cách giao tiếp giữa mọi người:

“... dự án yêu cầu bãi bỏ hoàn toàn mọi từ ngữ;
tác giả của dự án này chủ yếu đề cập đến lợi ích sức khoẻ và tiết kiệm
thời gian.

Rốt cuộc, rõ ràng là mỗi lời chúng ta thốt ra đều gắn liền với sự hao mòn nào đó.
phổi và do đó dẫn đến giảm tuổi thọ của chúng ta.

Và vì các từ chỉ là tên của sự vật nên tác giả của dự án đưa ra giả định rằng
rằng sẽ thuận tiện hơn nhiều cho chúng ta khi mang theo bên mình những thứ cần thiết để bày tỏ
những suy nghĩ và mong muốn.

... nhiều người rất uyên bác và khôn ngoan sử dụng cách diễn đạt mới này
suy nghĩ với sự giúp đỡ của sự vật.

Sự bất tiện duy nhất của nó là thực tế là, nếu cần thiết,
tiến hành một cuộc trò chuyện dài về nhiều chủ đề khác nhau, người đối thoại phải thực hiện
trên vai với những đống đồ lớn, nếu kinh phí không cho phép thuê một hoặc
hai gã to con. Tôi thường tình cờ gặp hai nhà thông thái như vậy, kiệt sức vì
gánh nặng, giống như những người bán hàng rong của chúng tôi. Khi họ gặp nhau trên đường, họ đã chụp ảnh
túi đeo vai, mở chúng ra và lấy ra những thứ cần thiết từ đó, rồi tiếp tục cuộc trò chuyện trong
sự tiếp tục của giờ; sau đó họ chất đồ dùng của mình lên và giúp nhau nâng đồ lên
vai, nói lời tạm biệt và chia tay.

Tuy nhiên, đối với những cuộc trò chuyện ngắn và đơn giản, bạn có thể mang theo mọi thứ bạn cần trong túi
hoặc dưới cánh tay, và cuộc trò chuyện diễn ra ở nhà không gây ra bất kỳ vấn đề gì.
nỗi khó khăn. Vì vậy, những căn phòng mà những người sử dụng phương pháp này tập trung đều chứa đầy
tất cả các loại đồ vật thích hợp để dùng làm nguyên liệu cho những sản phẩm nhân tạo đó.
cuộc trò chuyện.

Một ưu điểm lớn khác của phát minh này là nó có thể được sử dụng
như một ngôn ngữ phổ quát, dễ hiểu đối với tất cả các quốc gia văn minh, dành cho đồ nội thất và đồ gia dụng
các đồ dùng đều giống nhau hoặc rất giống nhau ở mọi nơi để có thể dễ dàng hiểu được cách sử dụng của chúng.
Nhờ đó, sứ thần có thể dễ dàng nói chuyện với các vị vua nước ngoài hoặc
những bộ trưởng mà ngôn ngữ của họ hoàn toàn xa lạ với họ..."

Vì vậy, có lẽ bạn đã đoán được tôi sẽ đi đâu với điều này :)

Tại sao truyền rung động không khí (âm thanh) qua hàng trăm, hàng nghìn km?
bận tâm đến việc mã hóa (để truyền những rung động không khí này đến người nhận một cách chính xác và hiệu quả nhất có thể), duy trì băng thông cần thiết, nếu ngữ nghĩa
Tải của đường truyền này có ở mức tối thiểu hay thậm chí có xu hướng bằng không?

Suy cho cùng, con người giao tiếp với nhau không phải bằng âm thanh mà bằng ý nghĩa, nội dung, ngữ nghĩa, suy nghĩ...

Khái niệm về hệ thống liên lạc mới khá đơn giản - về phía nguồn A có âm thanh
các rung động cũng được số hóa, nhưng không được truyền ngay cho bên kia mà
được chuyển đổi thành văn bản (Speech To Text) và sau đó là văn bản có ý nghĩa từ
thuê bao A, người:

  • có thể được truyền với băng thông dữ liệu yêu cầu tối thiểu (thậm chí có thể liên lạc bằng sóng vô tuyến HF, v.v.)
  • có thể được mã hóa bằng bất kỳ thuật toán mã hóa mạnh nào

Ở bên B, các tin nhắn nhận được sẽ được giải mã và tái tạo dưới dạng giọng nói từ
thuê bao A (Chuyển văn bản thành giọng nói).

Bạn cũng có thể tải xuống cái gọi là mặt B. hình đại diện bằng giọng nói của thuê bao A, ai sẽ
lặp lại chính xác cách nói của thuê bao A.

Một kênh riêng biệt có thể truyền tiếng ồn và cảm xúc xung quanh.

Một cuộc cách mạng trong truyền thông? Cách tiếp cận mới cho phép bạn tiết kiệm băng thông từ 100 lần trở lên cho các cuộc gọi âm thanh và video

Điều này cũng đúng đối với giao tiếp video - đặc biệt khi các yếu tố riêng lẻ từ lâu đã được
tồn tại trong các ứng dụng (các mặt nạ khác nhau, nền trong Zoom, v.v.).

Có, có những khía cạnh kỹ thuật hiện chưa được triển khai đầy đủ ở dạng phù hợp -
ví dụ: tốc độ chuyển đổi giọng nói thành văn bản sẽ rất quan trọng, nhưng việc sử dụng
Các thuật toán chuyển đổi AI dự đoán có thể tăng đáng kể tốc độ này.

Ưu điểm quan trọng nhất là yêu cầu băng thông tối thiểu trong môi trường truyền dẫn
dữ liệu.

Những thứ kia. Nguyên tắc này có thể được sử dụng không chỉ cho công việc thông thường hàng ngày.
thông tin liên lạc mà còn cho cả thông tin liên lạc quân sự và đường dài với độ trễ dài
(giao tiếp không gian, liên hành tinh - Mặt trăng, Sao Hỏa, v.v. :)

Mặc dù đây là mô tả về khái niệm này nhưng trên thực tế, trong một trong các dự án của chúng tôi đã có một số
Một nguyên mẫu với nguyên tắc này đã được sử dụng trong nhiều tháng.

Nhưng sẽ nói nhiều hơn về điều đó vào lần tới...

Nguồn: www.habr.com

Thêm một lời nhận xét