DeepMind Agent57 AI ಅಟಾರಿ ಆಟಗಳನ್ನು ಮನುಷ್ಯರಿಗಿಂತ ಉತ್ತಮವಾಗಿ ಸೋಲಿಸುತ್ತದೆ

ಸರಳವಾದ ವೀಡಿಯೋ ಗೇಮ್‌ಗಳ ಮೂಲಕ ನರಮಂಡಲವನ್ನು ನಡೆಸುವುದು ಅದರ ತರಬೇತಿಯ ಪರಿಣಾಮಕಾರಿತ್ವವನ್ನು ಪರೀಕ್ಷಿಸಲು ಸೂಕ್ತವಾದ ಮಾರ್ಗವಾಗಿದೆ, ಪೂರ್ಣಗೊಳಿಸುವಿಕೆಯ ಫಲಿತಾಂಶಗಳನ್ನು ಮೌಲ್ಯಮಾಪನ ಮಾಡುವ ಸರಳ ಸಾಮರ್ಥ್ಯಕ್ಕೆ ಧನ್ಯವಾದಗಳು. 2012 ರಲ್ಲಿ ಡೀಪ್‌ಮೈಂಡ್ (ಆಲ್ಫಾಬೆಟ್‌ನ ಭಾಗ) ಅಭಿವೃದ್ಧಿಪಡಿಸಿದೆ, 57 ಸಾಂಪ್ರದಾಯಿಕ ಅಟಾರಿ 2600 ಆಟಗಳ ಮಾನದಂಡವು ಸ್ವಯಂ-ಕಲಿಕೆ ವ್ಯವಸ್ಥೆಗಳ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ಪರೀಕ್ಷಿಸಲು ಲಿಟ್ಮಸ್ ಪರೀಕ್ಷೆಯಾಗಿದೆ. ಮತ್ತು ಇಲ್ಲಿ Agent57, ಸುಧಾರಿತ RL ಏಜೆಂಟ್ (ಬಲವರ್ಧನೆ ಕಲಿಕೆ) DeepMind, ಇತ್ತೀಚೆಗೆ ತೋರಿಸಿದೆ ಹಿಂದಿನ ವ್ಯವಸ್ಥೆಗಳಿಂದ ಒಂದು ದೊಡ್ಡ ಅಧಿಕ ಮತ್ತು ಮಾನವ ಆಟಗಾರನ ಬೇಸ್‌ಲೈನ್ ಅನ್ನು ಮೀರಿದ AI ಯ ಮೊದಲ ಪುನರಾವರ್ತನೆಯಾಗಿದೆ.

DeepMind Agent57 AI ಅಟಾರಿ ಆಟಗಳನ್ನು ಮನುಷ್ಯರಿಗಿಂತ ಉತ್ತಮವಾಗಿ ಸೋಲಿಸುತ್ತದೆ

Agent57 AI ಕಂಪನಿಯ ಹಿಂದಿನ ಸಿಸ್ಟಮ್‌ಗಳ ಅನುಭವವನ್ನು ಗಣನೆಗೆ ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ ಮತ್ತು ಮೆಟಾ-ನಿಯಂತ್ರಣದೊಂದಿಗೆ ಪರಿಸರದ ಸಮರ್ಥ ಪರಿಶೋಧನೆಗಾಗಿ ಅಲ್ಗಾರಿದಮ್‌ಗಳನ್ನು ಸಂಯೋಜಿಸುತ್ತದೆ. ನಿರ್ದಿಷ್ಟವಾಗಿ ಹೇಳುವುದಾದರೆ, Agent57 ಪಿಟ್‌ಫಾಲ್, ಮಾಂಟೆಜುಮಾ ರಿವೆಂಜ್, ಸೋಲಾರಿಸ್ ಮತ್ತು ಸ್ಕೀಯಿಂಗ್‌ನಲ್ಲಿ ತನ್ನ ಅತಿಮಾನುಷ ಕೌಶಲ್ಯಗಳನ್ನು ಸಾಬೀತುಪಡಿಸಿದೆ - ಹಿಂದಿನ ನರಮಂಡಲಗಳನ್ನು ತೀವ್ರವಾಗಿ ಪರೀಕ್ಷಿಸಿದ ಆಟಗಳು. ಸಂಶೋಧನೆಯ ಪ್ರಕಾರ, ಪಿಟ್‌ಫಾಲ್ ಮತ್ತು ಮಾಂಟೆಜುಮಾ ರಿವೆಂಜ್ ಉತ್ತಮ ಫಲಿತಾಂಶಗಳನ್ನು ಸಾಧಿಸಲು AI ಅನ್ನು ಹೆಚ್ಚು ಪ್ರಯೋಗಿಸಲು ಒತ್ತಾಯಿಸುತ್ತದೆ. ಸೋಲಾರಿಸ್ ಮತ್ತು ಸ್ಕೀಯಿಂಗ್ ನರಮಂಡಲಗಳಿಗೆ ಕಷ್ಟಕರವಾಗಿದೆ ಏಕೆಂದರೆ ಯಶಸ್ಸಿನ ಹೆಚ್ಚಿನ ಚಿಹ್ನೆಗಳು ಇಲ್ಲ - AI ಇದು ಸರಿಯಾದ ಕೆಲಸವನ್ನು ಮಾಡುತ್ತಿದೆಯೇ ಎಂದು ದೀರ್ಘಕಾಲದವರೆಗೆ ತಿಳಿದಿಲ್ಲ. DeepMind ತನ್ನ ಲೆಗಸಿ AI ಏಜೆಂಟ್‌ಗಳ ಮೇಲೆ ನಿರ್ಮಿಸಿದ್ದು, Agent57 ಪರಿಸರವನ್ನು ಅನ್ವೇಷಿಸುವ ಮತ್ತು ಆಟಗಳ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ನಿರ್ಣಯಿಸುವ ಬಗ್ಗೆ ಉತ್ತಮ ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಅನುಮತಿಸುತ್ತದೆ, ಜೊತೆಗೆ ಸ್ಕೀಯಿಂಗ್‌ನಂತಹ ಆಟಗಳಲ್ಲಿ ಅಲ್ಪಾವಧಿಯ ಮತ್ತು ದೀರ್ಘಾವಧಿಯ ನಡವಳಿಕೆಯ ನಡುವಿನ ವ್ಯಾಪಾರವನ್ನು ಉತ್ತಮಗೊಳಿಸುತ್ತದೆ.

ಫಲಿತಾಂಶಗಳು ಆಕರ್ಷಕವಾಗಿವೆ, ಆದರೆ AI ಇನ್ನೂ ಬಹಳ ದೂರ ಸಾಗಬೇಕಾಗಿದೆ. ಈ ವ್ಯವಸ್ಥೆಗಳು ಒಂದು ಸಮಯದಲ್ಲಿ ಒಂದು ಆಟವನ್ನು ಮಾತ್ರ ನಿಭಾಯಿಸಬಲ್ಲವು, ಇದು ಡೆವಲಪರ್‌ಗಳ ಪ್ರಕಾರ, ಮಾನವ ಸಾಮರ್ಥ್ಯಗಳಿಗೆ ವಿರುದ್ಧವಾಗಿದೆ: "ಮಾನವ ಮೆದುಳಿಗೆ ತುಂಬಾ ಸುಲಭವಾಗಿ ಬರುವ ನಿಜವಾದ ನಮ್ಯತೆಯು ಇನ್ನೂ AI ಯ ವ್ಯಾಪ್ತಿಯನ್ನು ಮೀರಿದೆ."



ಮೂಲ: 3dnews.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ