ಜನಾಂಗೀಯ ಮತ್ತು ಸ್ತ್ರೀದ್ವೇಷದ ಪದಗಳನ್ನು ಗುರುತಿಸಿದ ನಂತರ MIT ಟೈನಿ ಇಮೇಜಸ್ ಸಂಗ್ರಹವನ್ನು ತೆಗೆದುಹಾಕಿತು

ಮ್ಯಾಸಚೂಸೆಟ್ಸ್ ಇನ್ಸ್ಟಿಟ್ಯೂಟ್ ಆಫ್ ಟೆಕ್ನಾಲಜಿ ಅಳಿಸಲಾಗಿದೆ ಡೇಟಾ ಸೆಟ್ ಚಿಕ್ಕ ಚಿತ್ರಗಳು, 80 ಮಿಲಿಯನ್ ಸಣ್ಣ 32x32 ಚಿತ್ರಗಳ ಟಿಪ್ಪಣಿ ಸಂಗ್ರಹವನ್ನು ಒಳಗೊಂಡಿದೆ. ಈ ಸೆಟ್ ಅನ್ನು ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ತಂತ್ರಜ್ಞಾನಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವ ಗುಂಪಿನಿಂದ ನಿರ್ವಹಿಸಲಾಗಿದೆ ಮತ್ತು ಯಂತ್ರ ಕಲಿಕೆ ವ್ಯವಸ್ಥೆಗಳಲ್ಲಿ ವಸ್ತು ಗುರುತಿಸುವಿಕೆಯನ್ನು ತರಬೇತಿ ಮಾಡಲು ಮತ್ತು ಪರೀಕ್ಷಿಸಲು ವಿವಿಧ ಸಂಶೋಧಕರು 2008 ರಿಂದ ಬಳಸುತ್ತಿದ್ದಾರೆ.

ತೆಗೆದುಹಾಕಲು ಕಾರಣವಾಗಿತ್ತು ಗುರುತಿಸುವಿಕೆ ಚಿತ್ರಗಳಲ್ಲಿ ಚಿತ್ರಿಸಲಾದ ವಸ್ತುಗಳನ್ನು ವಿವರಿಸುವ ಲೇಬಲ್‌ಗಳಲ್ಲಿ ಜನಾಂಗೀಯ ಮತ್ತು ಸ್ತ್ರೀದ್ವೇಷದ ಪದಗಳ ಬಳಕೆ, ಹಾಗೆಯೇ ಆಕ್ರಮಣಕಾರಿ ಎಂದು ಗ್ರಹಿಸಲಾದ ಚಿತ್ರಗಳ ಉಪಸ್ಥಿತಿ. ಉದಾಹರಣೆಗೆ, ಆಡುಭಾಷೆಯ ಪದಗಳೊಂದಿಗೆ ಜನನಾಂಗಗಳ ಚಿತ್ರಗಳು ಇದ್ದವು, ಕೆಲವು ಮಹಿಳೆಯರ ಚಿತ್ರಗಳನ್ನು "ವೇಶ್ಯೆಗಳು" ಎಂದು ನಿರೂಪಿಸಲಾಗಿದೆ ಮತ್ತು ಕರಿಯರು ಮತ್ತು ಏಷ್ಯನ್ನರಿಗೆ ಆಧುನಿಕ ಸಮಾಜದಲ್ಲಿ ಸ್ವೀಕಾರಾರ್ಹವಲ್ಲದ ಪದಗಳನ್ನು ಬಳಸಲಾಯಿತು.

ಆದಾಗ್ಯೂ, MIT ಉಲ್ಲೇಖಿಸಿದ ದಾಖಲೆಯು ಅಂತಹ ಸಂಗ್ರಹಣೆಗಳೊಂದಿಗೆ ಹೆಚ್ಚು ಗಂಭೀರ ಸಮಸ್ಯೆಗಳನ್ನು ಗುರುತಿಸುತ್ತದೆ: ಕೆಲವು ಕಾರಣಗಳಿಗಾಗಿ ನಿಷೇಧಿಸಲಾದ ಜನಸಂಖ್ಯೆಯ ಗುಂಪುಗಳ ಪ್ರತಿನಿಧಿಗಳನ್ನು ಹುಡುಕಲು ಮುಖ ಗುರುತಿಸುವಿಕೆ ವ್ಯವಸ್ಥೆಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಕಂಪ್ಯೂಟರ್ ದೃಷ್ಟಿ ತಂತ್ರಜ್ಞಾನಗಳನ್ನು ಬಳಸಬಹುದು; ಚಿತ್ರ ನಿರ್ಮಾಣಕ್ಕಾಗಿ ಒಂದು ನರಮಂಡಲವು ಅನಾಮಧೇಯ ಡೇಟಾದಿಂದ ಮೂಲವನ್ನು ಪುನರ್ನಿರ್ಮಿಸಬಹುದು.

ಅಮಾನ್ಯ ಪದಗಳ ಗೋಚರಿಸುವಿಕೆಗೆ ಕಾರಣವೆಂದರೆ ವರ್ಗೀಕರಿಸಲು ಇಂಗ್ಲಿಷ್ ಲೆಕ್ಸಿಕಲ್ ಡೇಟಾಬೇಸ್‌ನಿಂದ ಶಬ್ದಾರ್ಥದ ಸಂಬಂಧಗಳನ್ನು ಬಳಸುವ ಸ್ವಯಂಚಾಲಿತ ಪ್ರಕ್ರಿಯೆಯ ಬಳಕೆಯಾಗಿದೆ. ವರ್ಡ್ ನೆಟ್1980 ರ ದಶಕದಲ್ಲಿ ಪ್ರಿನ್ಸ್‌ಟನ್ ವಿಶ್ವವಿದ್ಯಾಲಯದಲ್ಲಿ ರಚಿಸಲಾಗಿದೆ. 80 ಮಿಲಿಯನ್ ಸಣ್ಣ ಚಿತ್ರಗಳಲ್ಲಿ ಆಕ್ರಮಣಕಾರಿ ಭಾಷೆಯ ಉಪಸ್ಥಿತಿಯನ್ನು ಹಸ್ತಚಾಲಿತವಾಗಿ ಪರಿಶೀಲಿಸಲು ಸಾಧ್ಯವಾಗದ ಕಾರಣ, ಡೇಟಾಬೇಸ್ಗೆ ಪ್ರವೇಶವನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ನಿರ್ಬಂಧಿಸಲು ನಿರ್ಧರಿಸಲಾಯಿತು. ಸಂಗ್ರಹಣೆಯನ್ನು ಬಳಸುವುದನ್ನು ನಿಲ್ಲಿಸಲು ಮತ್ತು ಅದರ ಪ್ರತಿಗಳನ್ನು ತೆಗೆದುಹಾಕಲು MIT ಇತರ ಸಂಶೋಧಕರನ್ನು ಒತ್ತಾಯಿಸಿತು. ದೊಡ್ಡ ಟಿಪ್ಪಣಿ ಮಾಡಲಾದ ಚಿತ್ರ ಡೇಟಾಬೇಸ್‌ನಲ್ಲಿ ಇದೇ ರೀತಿಯ ಸಮಸ್ಯೆಗಳನ್ನು ಗಮನಿಸಲಾಗಿದೆ ಇಮೇಜ್ ನೆಟ್, ಇದು WordNet ನಿಂದ ಆಂಕರ್‌ಗಳನ್ನು ಸಹ ಬಳಸುತ್ತದೆ.

ಜನಾಂಗೀಯ ಮತ್ತು ಸ್ತ್ರೀದ್ವೇಷದ ಪದಗಳನ್ನು ಗುರುತಿಸಿದ ನಂತರ MIT ಟೈನಿ ಇಮೇಜಸ್ ಸಂಗ್ರಹವನ್ನು ತೆಗೆದುಹಾಕಿತು

ಜನಾಂಗೀಯ ಮತ್ತು ಸ್ತ್ರೀದ್ವೇಷದ ಪದಗಳನ್ನು ಗುರುತಿಸಿದ ನಂತರ MIT ಟೈನಿ ಇಮೇಜಸ್ ಸಂಗ್ರಹವನ್ನು ತೆಗೆದುಹಾಕಿತು

ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ