Phát hành hệ thống GNU Ocrad 0.28 OCR

Sau ba năm kể từ lần phát hành cuối cùng, hệ thống nhận dạng văn bản Ocrad 0.28 (Nhận dạng ký tự quang học), được phát triển dưới sự bảo trợ của dự án GNU, đã được phát hành. Ocrad có thể được sử dụng cả dưới dạng thư viện để tích hợp các chức năng OCR vào các ứng dụng khác và dưới dạng một tiện ích riêng biệt, dựa trên hình ảnh được truyền đến đầu vào, tạo ra văn bản ở dạng mã hóa UTF-8 hoặc 8-bit.

Để nhận dạng quang học, Ocrad sử dụng phương pháp trích chọn đặc trưng. Bao gồm bộ phân tích bố cục trang cho phép bạn phân tách chính xác các cột và khối văn bản trong tài liệu in. Tính năng nhận dạng chỉ được hỗ trợ cho các ký tự từ bảng mã "ascii", "iso-8859-9" và "iso-8859-15" (không hỗ trợ bảng chữ cái Cyrillic).

Cần lưu ý rằng bản phát hành mới bao gồm một phần lớn các bản sửa lỗi và cải tiến nhỏ. Thay đổi đáng kể nhất là hỗ trợ định dạng hình ảnh PNG, được triển khai bằng thư viện libpng, giúp đơn giản hóa rất nhiều khi làm việc với chương trình, vì trước đây chỉ có thể nhập hình ảnh ở định dạng PNM.

Nguồn: opennet.ru

Thêm một lời nhận xét