Keluaran sistem pengecaman teks Tesseract 4.1

Bersedia pelepasan sistem pengecaman teks optik Tesseract 4.1, menyokong pengecaman aksara dan teks UTF-8 dalam lebih 100 bahasa, termasuk Rusia, Kazakh, Belarus dan Ukraine. Hasilnya boleh disimpan dalam teks biasa atau dalam format HTML (hOCR), ALTO (XML), PDF dan TSV. Sistem ini pada asalnya dicipta pada tahun 1985-1995 di makmal Hewlett Packard; pada tahun 2005, kod itu dibuka di bawah lesen Apache dan telah dibangunkan lagi dengan penyertaan pekerja Google. Sumber projek sebar berlesen di bawah Apache 2.0.

Tesseract termasuk utiliti konsol dan perpustakaan libtesseract untuk membenamkan fungsi OCR ke dalam aplikasi lain. Daripada pihak ketiga yang menyokong Tesseract antara muka GUI anda boleh ambil perhatian gImageReader, VietOCR ΠΈ YAGF. Dua enjin pengecaman ditawarkan: enjin klasik yang mengecam teks pada tahap corak aksara individu dan yang baharu berdasarkan penggunaan sistem pembelajaran mesin berdasarkan rangkaian saraf berulang LSTM, dioptimumkan untuk mengenali keseluruhan rentetan dan membolehkan peningkatan yang ketara dalam ketepatan. Model terlatih sedia dibuat diterbitkan untuk 123 bahasa. Untuk mengoptimumkan prestasi, modul menggunakan OpenMP dan AVX2, AVX atau arahan SIMD SSE4.1 ditawarkan.

Utama penambahbaikan dalam Tesseract 4.1:

  • Menambah keupayaan untuk mengeluarkan dalam format XML TINGGI (Susun Letak Analisis dan Objek Teks). Untuk menggunakan format ini, anda harus menjalankan aplikasi sebagai "tessarac image_name alto output_dir";
  • Menambah modul rendering baharu LSTMBox dan WordStrBox, memudahkan latihan enjin;
  • Menambah sokongan untuk pseudografik dalam output hOCR (HTML);
  • Menambahkan skrip alternatif yang ditulis dalam Python untuk melatih enjin berdasarkan pembelajaran mesin;
  • Pengoptimuman diperluas menggunakan arahan AVX, AVX2 dan SSE;
  • Sokongan OpenMP dilumpuhkan secara lalai disebabkan oleh masalah dengan produktiviti;
  • Menambah sokongan untuk senarai putih dan hitam dalam enjin LSTM;
  • Skrip binaan yang dipertingkatkan berdasarkan Cmake.

Sumber: opennet.ru

Tambah komen