新しい光学式文字認識システム EasyOCR

事業 簡単OCR 英語、ドイツ語、フランス語、日本語、中国語、韓国語、ウズベク語、アゼルバイジャン語、リトアニア語を含む 40 以上の言語をサポートする新しい光学式テキスト認識システムが開発されています。 キリル文字ベースの言語はまだサポートされていませんが、計画のリストに追加されています。 コードはフレームワークを使用して Python で書かれています パイトーチ и によって配布 Apache 2.0 に基づいてライセンスされています。 積載用 提供された ラテン文字と象形文字に基づいた言語の既製モデル。

機械学習手法は、画像内のテキストを識別して認識するために使用されます。 機械学習アルゴリズムを使用してテキストを識別します クラフト (テキストの文字領域認識) 実装 PyTorch では、ラベル、情報標識、道路標識などの任意のオブジェクト上のテキストを強調表示できます。 畳み込みリカレント ニューラル ネットワークを使用して文字列を認識します CRNN (畳み込み再帰型ニューラル ネットワーク、DCNN と RNN の組み合わせ) とアルゴリズム CTCビームサーチ CTC BeamSearch (Connectionist Temporal Classification) により、ニューラル ネットワーク出力をテキスト表現にデコードします。

出所: オープンネット.ru

コメントを追加します