通讯革命? 新方法可让您节省 100 倍或更多的音频和视频通话带宽

通讯革命? 新方法可让您节省 100 倍或更多的音频和视频通话带宽

很多人都记得电视剧《硅谷》是关于程序员理查德的
Hendrix,他意外地想出了一种革命性的数据压缩算法,并决定
建立你的创业公司。

该系列的顾问甚至提出了一个评估指标
类似的算法还有虚构的 Weissman Score。

在故事的进一步发展中,这家初创公司使用该解决方案进行了视频聊天。

受人尊敬的社区被邀请讨论另一个完全不同寻常的问题
音视频通话的数据压缩原理,用一种新的方式解决了这个问题,
意想不到的一面。

如果您想参与该解决方案的讨论,并找出它的共同点
乔纳森·斯威夫特的概念和列夫·托尔斯泰的作品,请在猫下。

有些理论

让我们一般性地描述一下现代音频通信的工作原理 - 两者的原理是相同的
通过 GSM 网络以及即时消息和 VOIP 网络进行呼叫。

声音振动被发送到智能手机的麦克风,然后以模拟数字形式发送
转换器(ADC 或 ADC):

通讯革命? 新方法可让您节省 100 倍或更多的音频和视频通话带宽

接下来,使用各种编解码器(G711、G729、OPUS、GSM 等)进行编码,
添加或不添加加密(SRTP、ZPTP等)并发送到环境
数据传输。

例如,几乎所有即时通讯工具(WhatsApp、Viber 等)都使用相同的编解码器(最近通常是 Opus),并且几乎相同
修改协议(基于SIP、WebRTC)。

数据传输网络可以是公共互联网或GSM网络或
内联网:

通讯革命? 新方法可让您节省 100 倍或更多的音频和视频通话带宽

加密是该方案中的可选元素,例如在大多数情况下
不使用 SIP 电话加密。

但在信使中,相反,他们通常使用自己的专有技术
语音和视频加密协议。

接下来,发生相反的过程 - 接收者收到数据后,对接收到的信息进行解码,然后信号进入 DAC(数模转换器),然后进入连接到扬声器的音频放大器:

通讯革命? 新方法可让您节省 100 倍或更多的音频和视频通话带宽

现代编解码器的特点:

G.711 64 Kbps。
G.726 16、24、32 或 40 Kbps。
G.729A 8 KB/秒
GSM 13 Kb/秒。
iLBC 13.3 Kb/秒。 (30ms帧); 15.2 KB/秒。 (20毫秒帧)
Speex 范围为 2.15 至 22.4 Kb/秒。
G.722 64 Kbps。

因此,例如,在 WhatsApp 或 Skype 上进行 7 分钟的对话期间,将会出现
大约使用了 1 MB。

让我们记住这些数字 - 1 分钟的对话需要 7MB,我们很快就会需要它们。

“列夫·托尔斯泰就像一面镜子……革命……”

让我们记住这位伟大的俄罗斯作家最著名的小说:

《战争与和平》是列夫·尼古拉耶维奇·托尔斯泰的一部史诗小说,描述了俄罗斯
1805-1812 年对抗拿破仑的战争期间的社会。 小说的结尾带来了
叙述到1820年。

L.N. 的小说《战争与和平》 托尔斯泰投入了七年的紧张和坚持不懈的工作。手稿证明了世界上最大的作品之一是如何创作出来的。
《战争与和平》:作者的档案包含超过 5200 张精美的作品。

如果您现在想阅读这本小说,可以轻松下载。

而且这个文件只有... 1 MB:

通讯革命? 新方法可让您节省 100 倍或更多的音频和视频通话带宽

fb2和epub格式,就像zip,rar一样,原则上可以被认为是一种
编解码器

让我们想一想——我们在 WhatsApp 上的 7 分钟对话就流量而言是相等的
花了7年时间写成的伟大作品!

7分钟的对话是用opus编解码器编码的,小说是用ePub编码的,体积是一样的——
1MB,但差别太大了!

格列佛游记

大家从小就知道乔纳森·斯威夫特的这部作品,但其实这本书并不是为了
儿童。

《格列佛游记》是一部针对成年人的政治讽刺作品,当然是在18岁的背景下。
世纪。

令人惊讶的是,斯威夫特作为另一位同时代人的强烈反对者——
牛顿在他的《格列佛游记》中不仅预言了卫星的发现
火星(对其特征进行了相当准确的描述),但也描述了一个相当有趣的
人与人之间的沟通方式:

“……该项目要求完全废除所有词语;
该项目的作者主要提到其健康效益和节省
时间。

毕竟,很明显,我们所说的每一个字都与一些磨损有关。
肺部,因此会导致我们的寿命缩短。

由于单词只是事物的名称,该项目的作者做出了这样的假设:
对我们来说,携带表达我们所必需的东西会更加方便
想法和愿望。

...许多非常有学识和智慧的人都使用这种新的方式来表达他们的想法
借助事物的思想。

唯一的不便之处在于,如果有必要的话,
就各种主题进行长时间的对话,对话者必须携带
如果资金不允许雇用一个或多个人,则肩负大捆的东西
两个身材魁梧的家伙。 我经常碰巧看到两个这样的智者,在压力之下精疲力尽。
沉重的负担,就像我们的小贩。 当他们在街上相遇时,他们拍了张照片
背上包,打开包,从里面拿出必要的东西,就这样进行了对话。
一小时的延续; 然后他们把用具堆起来,互相帮助把东西搬到上面。
肩并肩,道别,分道扬镳。

但是,对于简短的对话,您可以将所需的所有物品放在口袋里
或夹在腋下,并且在家中进行的谈话不会引起任何
困难。 因此,使用这种方法的人聚集的房间里充满了
适合作为此类人造材料的各种物体
对话。

本发明的另一大优点是它可以用于
作为一种通用语言,所有文明国家都可以理解,适用于家具和家居
各地的器皿都相同或非常相似,因此它们的用途很容易理解。
因此,使节可以轻松地与外国国王或
他们完全不懂语言的部长们……”

所以,你可能已经猜到我要说什么了:)

为什么空气振动(声音)会传播数百公里和数千公里?
费心编码(为了尽可能准确有效地将这些空气振动传达给接收者),保持必要的带宽,如果语义
该传动装置的负载是否最小,甚至趋于零?

毕竟,人们之间的交流不是用声音,而是用意义、内容、语义、思想……

新通信系统的概念非常简单 - 在源端 A 有音频
振动也被数字化,但并不会立即传送给对方,而是
转换为文本(语音转文本),然后从中提取有意义的文本
订户 A,他:

  • 可以用所需的最小数据带宽进行传输(甚至可以进行高频无线电通信等)
  • 可以使用任何强加密算法进行加密

在 B 侧,接​​收到的消息被解密并再现为来自
订阅者 A(文本转语音)。

你也可以下载所谓的B面。 用户 A 的语音头像,他会
准确地重复了用户A的讲话方式。

单独的通道可以传输背景噪音和情绪。

通讯革命? 新方法可让您节省 100 倍或更多的音频和视频通话带宽

对于视频通信来说也是如此——特别是因为各个元素长期以来都被
存在于应用程序中(各种蒙版、Zoom 中的背景等)。

是的,有些技术方面目前尚未以适当的形式完全实施 -
例如,语音到文本转换的速度至关重要,但是使用
预测性 AI 转换算法可以显着提高此速度。

最重要的优点是传输介质所需的带宽最小
数据。

那些。 这个原理不仅适用于平常的日常生活
通信,也适用于军事和长途通信,延迟时间长
(太空通讯、行星际-月球、火星等:)

虽然这是概念的描述,但事实上,在我们的一个项目中已经有几个
采用这一原理的原型机已经使用了几个月。

但下次会详细讨论...

来源: habr.com

添加评论