新型光学文本识别系统EasyOCR

项目 简易OCR 一种新的光学文本识别系统正在开发中,支持 40 多种语言,包括英语、德语、法语、日语、中文、韩语、乌兹别克语、阿塞拜疆语和立陶宛语。 尚不支持基于西里尔字母的语言,但它们正在被添加到计划列表中。 代码是使用Python框架编写的 PyTorch и 分发者 在 Apache 2.0 下获得许可。 用于装载 假如 基于拉丁字母和象形文字的语言的现成模型。

机器学习方法用于识别和识别图像中的文本。 使用机器学习算法来识别文本 手艺 (文本的字符区域感知) 履行 适用于 PyTorch,能够突出显示任意对象上的文本,包括标签、信息标志和路标。 使用卷积循环神经网络来识别字符序列 神经网络 (卷积循环神经网络,DCNN和RNN的结合)和算法 CTC 光束搜索 CTC BeamSearch(连接主义时间分类)将神经网络输出解码为文本表示。

来源: opennet.ru

添加评论