GNU Ocrad 0.28 OCR sisteminin piyasaya sürülmesi

Son sürümünden bu yana üç yıl geçtikten sonra, GNU projesi himayesinde geliştirilen Ocrad 0.28 (Optik Karakter Tanıma) metin tanıma sistemi piyasaya sürüldü. Ocrad, hem OCR işlevlerini diğer uygulamalara entegre etmek için bir kitaplık biçiminde hem de girişe iletilen görüntüye göre UTF-8 veya 8 bit kodlamada metin üreten ayrı bir yardımcı program biçiminde kullanılabilir.

Optik tanıma için Ocrad, özellik çıkarma yöntemini kullanır. Basılı belgelerdeki sütunları ve metin bloklarını doğru şekilde ayırmanıza olanak tanıyan bir sayfa düzeni analizörü içerir. Tanıma yalnızca "ascii", "iso-8859-9" ve "iso-8859-15" kodlamalarındaki karakterler için desteklenir (Kiril alfabesi desteği yoktur).

Yeni sürümün büyük oranda küçük düzeltmeler ve iyileştirmeler içerdiği belirtiliyor. En önemli değişiklik, libpng kütüphanesi kullanılarak uygulanan PNG görüntü formatı desteğiydi; bu, daha önce yalnızca PNM formatlarındaki görsellerin girilebilmesi nedeniyle programla çalışmayı büyük ölçüde basitleştirdi.

Kaynak: opennet.ru

Yorum ekle