Новая систСма оптичСского распознавания тСкста EasyOCR

ΠŸΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠΌ EasyOCR развиваСтся новая систСма оптичСского распознавания тСкста, ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽΡ‰Π°Ρ Π±ΠΎΠ»Π΅Π΅ 40 языков, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ английский, Π½Π΅ΠΌΠ΅Ρ†ΠΊΠΈΠΉ, французский, японский, китайский, корСйский, узбСкский, азСрбайдТанский ΠΈ литовский. Π―Π·Ρ‹ΠΊΠΈ Π½Π° основС ΠΊΠΈΡ€ΠΈΠ»Π»ΠΈΡ†Ρ‹ ΠΏΠΎΠΊΠ° Π½Π΅ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽΡ‚ΡΡ, Π½ΠΎ ΠΈΡ… Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ Π² спискС ΠΏΠ»Π°Π½ΠΎΠ². Код написан Π½Π° языкС Python c использованиСм Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊΠ° PyTorch ΠΈ распространяСтся ΠΏΠΎΠ΄ Π»ΠΈΡ†Π΅Π½Π·ΠΈΠ΅ΠΉ Apache 2.0. Для Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‚ΡΡ Π³ΠΎΡ‚ΠΎΠ²Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ для языков Π½Π° основС латинского Π°Π»Ρ„Π°Π²ΠΈΡ‚Π° ΠΈ ΠΈΠ΅Ρ€ΠΎΠ³Π»ΠΈΡ„ΠΎΠ².

Для опрСдСлСния ΠΈ распознавания тСкста Π½Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ машинного обучСния. Для опрСдСлСния тСкста ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ машинного обучСния CRAFT (Character-Region Awareness For Text) Π² Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ для PyTorch, способный Π²Ρ‹Π΄Π΅Π»ΡΡ‚ΡŒ тСкст Π½Π° ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ»ΡŒΠ½Ρ‹Ρ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°Ρ…, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ этикСтки, ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½Ρ‹Π΅ Ρ‚Π°Π±Π»ΠΈΡ‡ΠΊΠΈ ΠΈ Π΄ΠΎΡ€ΠΎΠΆΠ½Ρ‹Π΅ Π·Π½Π°ΠΊΠΈ. Для распознавания ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ символов примСняСтся свёрточно-рСкуррСнтная нСйронная ΡΠ΅Ρ‚ΡŒ CRNN (Convolutional Recurrent Neural Network, комбинация DCNN ΠΈ RNN) ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) для дСкодирования Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти Π² тСкстовоС прСдставлСниС.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: opennet.ru

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ