Hệ thống nhận dạng văn bản quang học mới EasyOCR

dự án EasyOCR Một hệ thống nhận dạng văn bản quang học mới đang được phát triển hỗ trợ hơn 40 ngôn ngữ, bao gồm tiếng Anh, tiếng Đức, tiếng Pháp, tiếng Nhật, tiếng Trung, tiếng Hàn, tiếng Uzbek, tiếng Azerbaijan và tiếng Litva. Các ngôn ngữ dựa trên Cyrillic chưa được hỗ trợ nhưng chúng đang được thêm vào danh sách các gói. Mã được viết bằng Python sử dụng framework Kim tự tháp и phân phối bởi được cấp phép theo Apache 2.0. Để nạp cung cấp mô hình làm sẵn cho các ngôn ngữ dựa trên bảng chữ cái Latinh và chữ tượng hình.

Phương pháp học máy được sử dụng để xác định và nhận dạng văn bản trong hình ảnh. Thuật toán học máy được sử dụng để xác định văn bản Thủ công (Nhận thức về ký tự-vùng cho văn bản) trong thực hiện dành cho PyTorch, có khả năng đánh dấu văn bản trên các đối tượng tùy ý, bao gồm nhãn, biển báo thông tin và biển báo đường bộ. Mạng nơ ron hồi quy tích chập được sử dụng để nhận dạng chuỗi ký tự CRNN (Mạng thần kinh tái phát tích chập, sự kết hợp giữa DCNN và RNN) và thuật toán CTC BeamSearch CTC BeamSearch (Phân loại thời gian kết nối) để giải mã đầu ra mạng thần kinh thành dạng văn bản.

Nguồn: opennet.ru

Thêm một lời nhận xét