ಹೊಸ ಆಪ್ಟಿಕಲ್ ಟೆಕ್ಸ್ಟ್ ರೆಕಗ್ನಿಷನ್ ಸಿಸ್ಟಮ್ EasyOCR

ಯೋಜನೆ EasyOCR ಇಂಗ್ಲಿಷ್, ಜರ್ಮನ್, ಫ್ರೆಂಚ್, ಜಪಾನೀಸ್, ಚೈನೀಸ್, ಕೊರಿಯನ್, ಉಜ್ಬೆಕ್, ಅಜೆರ್ಬೈಜಾನಿ ಮತ್ತು ಲಿಥುವೇನಿಯನ್ ಸೇರಿದಂತೆ 40 ಕ್ಕೂ ಹೆಚ್ಚು ಭಾಷೆಗಳನ್ನು ಬೆಂಬಲಿಸುವ ಹೊಸ ಆಪ್ಟಿಕಲ್ ಪಠ್ಯ ಗುರುತಿಸುವಿಕೆ ವ್ಯವಸ್ಥೆಯನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾಗುತ್ತಿದೆ. ಸಿರಿಲಿಕ್ ಆಧಾರಿತ ಭಾಷೆಗಳು ಇನ್ನೂ ಬೆಂಬಲಿತವಾಗಿಲ್ಲ, ಆದರೆ ಅವುಗಳನ್ನು ಯೋಜನೆಗಳ ಪಟ್ಟಿಗೆ ಸೇರಿಸಲಾಗುತ್ತಿದೆ. ಚೌಕಟ್ಟನ್ನು ಬಳಸಿಕೊಂಡು ಪೈಥಾನ್‌ನಲ್ಲಿ ಕೋಡ್ ಅನ್ನು ಬರೆಯಲಾಗಿದೆ ಪೈಟೋರ್ಚ್ и ವಿತರಿಸುವವರು ಅಪಾಚೆ 2.0 ಅಡಿಯಲ್ಲಿ ಪರವಾನಗಿ ಪಡೆದಿದೆ. ಲೋಡ್ ಮಾಡಲು ಒದಗಿಸಲಾಗಿದೆ ಲ್ಯಾಟಿನ್ ವರ್ಣಮಾಲೆ ಮತ್ತು ಚಿತ್ರಲಿಪಿಗಳ ಆಧಾರದ ಮೇಲೆ ಭಾಷೆಗಳಿಗೆ ಸಿದ್ಧ ಮಾದರಿಗಳು.

ಚಿತ್ರದಲ್ಲಿನ ಪಠ್ಯವನ್ನು ಗುರುತಿಸಲು ಮತ್ತು ಗುರುತಿಸಲು ಯಂತ್ರ ಕಲಿಕೆಯ ವಿಧಾನಗಳನ್ನು ಬಳಸಲಾಗುತ್ತದೆ. ಪಠ್ಯವನ್ನು ಗುರುತಿಸಲು ಯಂತ್ರ ಕಲಿಕೆ ಅಲ್ಗಾರಿದಮ್ ಅನ್ನು ಬಳಸಲಾಗುತ್ತದೆ ಕ್ರಾಫ್ಟ್ (ಪಠ್ಯಕ್ಕಾಗಿ ಅಕ್ಷರ-ಪ್ರದೇಶದ ಅರಿವು) ರಲ್ಲಿ ಅನುಷ್ಠಾನ PyTorch ಗಾಗಿ, ಲೇಬಲ್‌ಗಳು, ಮಾಹಿತಿ ಚಿಹ್ನೆಗಳು ಮತ್ತು ರಸ್ತೆ ಚಿಹ್ನೆಗಳು ಸೇರಿದಂತೆ ಅನಿಯಂತ್ರಿತ ವಸ್ತುಗಳ ಮೇಲೆ ಪಠ್ಯವನ್ನು ಹೈಲೈಟ್ ಮಾಡುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿದೆ. ಕ್ಯಾರೆಕ್ಟರ್ ಸೀಕ್ವೆನ್ಸ್‌ಗಳನ್ನು ಗುರುತಿಸಲು ಕನ್ವಲ್ಯೂಷನಲ್ ಮರುಕಳಿಸುವ ನರಮಂಡಲವನ್ನು ಬಳಸಲಾಗುತ್ತದೆ ಸಿಆರ್ಎನ್ಎನ್ (ಕನ್ವಲ್ಯೂಷನಲ್ ರಿಕರೆಂಟ್ ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್, DCNN ಮತ್ತು RNN ಸಂಯೋಜನೆ) ಮತ್ತು ಅಲ್ಗಾರಿದಮ್ CTC ಬೀಮ್‌ಸರ್ಚ್ CTC ಬೀಮ್‌ಸರ್ಚ್ (ಕನೆಕ್ಷನಿಸ್ಟ್ ಟೆಂಪೊರಲ್ ಕ್ಲಾಸಿಫಿಕೇಶನ್) ನ್ಯೂರಲ್ ನೆಟ್‌ವರ್ಕ್ ಔಟ್‌ಪುಟ್ ಅನ್ನು ಪಠ್ಯ ಪ್ರಾತಿನಿಧ್ಯಕ್ಕೆ ಡಿಕೋಡ್ ಮಾಡಲು.

ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ