سیستم تشخیص متن نوری جدید EasyOCR

پروژه EasyOCR یک سیستم جدید تشخیص متن نوری در حال توسعه است که از بیش از 40 زبان از جمله انگلیسی، آلمانی، فرانسوی، ژاپنی، چینی، کره ای، ازبکی، آذربایجانی و لیتوانیایی پشتیبانی می کند. زبان‌های مبتنی بر سیریلیک هنوز پشتیبانی نمی‌شوند، اما به لیست برنامه‌ها اضافه می‌شوند. کد با استفاده از فریم ورک در پایتون نوشته شده است PyTorch и توزیع شده توسط دارای مجوز Apache 2.0. برای بارگیری ارائه شده است مدل های آماده برای زبان ها بر اساس الفبای لاتین و هیروگلیف.

روش های یادگیری ماشینی برای شناسایی و تشخیص متن در یک تصویر استفاده می شود. یک الگوریتم یادگیری ماشین برای شناسایی متن استفاده می شود مهارت (شخصیت-منطقه آگاهی برای متن) در پیاده سازی برای PyTorch، قادر به برجسته کردن متن بر روی اشیاء دلخواه، از جمله برچسب ها، علائم اطلاعاتی و علائم جاده است. یک شبکه عصبی بازگشتی کانولوشن برای تشخیص توالی کاراکترها استفاده می شود CRNN (شبکه عصبی بازگشتی کانولوشن، ترکیبی از DCNN و RNN) و الگوریتم CTC BeamSearch CTC BeamSearch (طبقه بندی زمانی ارتباطی) برای رمزگشایی خروجی شبکه عصبی به نمایش متن.

منبع: opennet.ru

اضافه کردن نظر