انتشار سیستم تشخیص متن Tesseract 4.1
انتشار سیستم تشخیص متن نوری Tesseract 4.1 آماده شده است که از تشخیص کاراکترها و متون UTF-8 به بیش از 100 زبان از جمله روسی، قزاقستانی، بلاروسی و اوکراینی پشتیبانی می کند. نتیجه را می توان در متن ساده یا در فرمت های HTML (hOCR)، ALTO (XML)، PDF و TSV ذخیره کرد. این سیستم در ابتدا در سال 1985-1995 در آزمایشگاه هیولت پاکارد ایجاد شد، […]