谷歌的新神经网络比流行的类似物更准确、更快

受人类视觉皮层生物过程的启发,卷积神经网络 (CNN) 非常适合物体和面部识别等任务,但提高其准确性需要繁琐的微调。 这就是为什么谷歌人工智能研究中心的科学家们正在探索以“更结构化”的方式扩展 CNN 的新模型。 他们将工作成果发表在 文章 “EfficientNet:重新思考卷积神经网络的模型扩展”,发布在科学门户网站 Arxiv.org 以及 发表 在你的博客上。 合著者声称,名为 EfficientNets 的人工智能系统系列超越了标准 CNN 的准确性,并将神经网络的效率提高了 10 倍。

谷歌的新神经网络比流行的类似物更准确、更快

“缩放模型的常见做法是任意增加 CNN 的深度或宽度,并使用更高分辨率的输入图像进行训练和评估,”软件工程师 Mingxing Tan 和 Google AI 首席科学家 Quoc V (Le) 写道。 “与任意缩放网络参数(例如宽度、深度和输入分辨率)的传统方法不同,我们的方法使用一组固定的缩放因子来统一缩放每个维度。”

为了进一步提高性能,研究人员提倡使用新的骨干网络——移动反向瓶颈卷积(MBConv),它是 EfficientNets 系列模型的基础。

在测试中,EfficientNets 表现出比现有 CNN 更高的准确性和更好的效率,将参数大小和计算资源需求减少了一个数量级。 其中一个模型 EfficientNet-B7 比著名的 CNN Gpipe 表现出小 8,4 倍的尺寸和 6,1 倍的性能,并且在测试中还取得了 84,4% 和 97,1% 的准确率(Top-1 和 Top-5 结果) ImageNet 集。 与流行的 CNN ResNet-50 相比,另一种 EfficientNet 模型 EfficientNet-B4 使用类似的资源,实现了 82,6% 的准确率,而 ResNet-76,3 为 50%。

EfficientNets 模型在其他数据集上表现良好,在八个基准测试中的五个上实现了高精度,包括 CIFAR-100 数据集(准确度为 91,7%)和 (98,8%)。

谷歌的新神经网络比流行的类似物更准确、更快

Tan 和 Li 写道:“通过显着提高神经模型的效率,我们预计 EfficientNets 有潜力成为未来计算机视觉任务的新框架。”

Google 云张量处理单元 (TPU) 的源代码和训练脚本可在以下位置免费获取: Github上.



来源: 3dnews.ru

添加评论