新型光學文字辨識系統EasyOCR

專案 簡易OCR 正在開發一種新的光學文字辨識系統,支援 40 多種語言,包括英語、德語、法語、日語、中文、韓語、烏茲別克語、亞塞拜然語和立陶宛語。 尚不支援基於西里爾字母的語言,但它們正在添加到計劃清單中。 程式碼是使用Python框架編寫的 火炬 и 分發者 在 Apache 2.0 下獲得許可。 用於裝載 提供 基於拉丁字母和象形文字的語言的現成模型。

機器學習方法用於識別和識別圖像中的文字。 使用機器學習演算法來識別文本 手藝 (文字的字元區域感知) 執行 適用於 PyTorch,能夠突出顯示任意物件上的文本,包括標籤、資訊標誌和路標。 使用卷積循環神經網路來識別字元序列 神經網絡 (卷積循環神經網絡,DCNN和RNN的結合)和演算法 CTC 光束搜索 CTC BeamSearch(連結主義時間分類)將神經網路輸出解碼為文字表示。

來源: opennet.ru

添加評論