پروژه EasyOCR یک سیستم جدید تشخیص متن نوری در حال توسعه است که از بیش از 40 زبان از جمله انگلیسی، آلمانی، فرانسوی، ژاپنی، چینی، کره ای، ازبکی، آذربایجانی و لیتوانیایی پشتیبانی می کند. زبانهای مبتنی بر سیریلیک هنوز پشتیبانی نمیشوند، اما به لیست برنامهها اضافه میشوند. کد با استفاده از فریم ورک در پایتون نوشته شده است PyTorch и توزیع شده توسط دارای مجوز Apache 2.0. برای بارگیری ارائه شده است مدل های آماده برای زبان ها بر اساس الفبای لاتین و هیروگلیف.
روش های یادگیری ماشینی برای شناسایی و تشخیص متن در یک تصویر استفاده می شود. یک الگوریتم یادگیری ماشین برای شناسایی متن استفاده می شود مهارت (شخصیت-منطقه آگاهی برای متن) در پیاده سازی برای PyTorch، قادر به برجسته کردن متن بر روی اشیاء دلخواه، از جمله برچسب ها، علائم اطلاعاتی و علائم جاده است. یک شبکه عصبی بازگشتی کانولوشن برای تشخیص توالی کاراکترها استفاده می شود CRNN (شبکه عصبی بازگشتی کانولوشن، ترکیبی از DCNN و RNN) و الگوریتم CTC BeamSearch CTC BeamSearch (طبقه بندی زمانی ارتباطی) برای رمزگشایی خروجی شبکه عصبی به نمایش متن.