DeepMind Agent57 AI đánh bại game Atari tốt hơn con người

Tạo một mạng lưới thần kinh chạy thông qua các trò chơi điện tử đơn giản là một cách lý tưởng để kiểm tra tính hiệu quả của quá trình đào tạo, nhờ khả năng đánh giá kết quả hoàn thành đơn giản. Được phát triển vào năm 2012 bởi DeepMind (một phần của Alphabet), điểm chuẩn của 57 trò chơi Atari 2600 mang tính biểu tượng đã trở thành phép thử để kiểm tra khả năng của các hệ thống tự học. Và đây là Agent57, một tác nhân RL tiên tiến (Học tăng cường) DeepMind, gần đây cho thấy một bước nhảy vọt so với các hệ thống trước đó và là phiên bản đầu tiên của AI vượt quá giới hạn cơ bản của người chơi.

DeepMind Agent57 AI đánh bại game Atari tốt hơn con người

Agent57 AI tính đến trải nghiệm của các hệ thống trước đây của công ty và kết hợp các thuật toán để khám phá môi trường một cách hiệu quả với siêu kiểm soát. Đặc biệt, Agent57 đã chứng minh được kỹ năng siêu phàm của mình trong Pitfall, Montezuma's Revenge, Solaris và Skiing - những trò chơi đã thử thách nghiêm ngặt mạng lưới thần kinh trước đó. Theo nghiên cứu, Cạm bẫy và Montezuma's Revenge buộc AI phải thử nghiệm nhiều hơn để đạt được kết quả tốt hơn. Solaris và Skiing gây khó khăn cho mạng lưới thần kinh vì không có nhiều dấu hiệu thành công - AI trong một thời gian dài không biết liệu nó có làm đúng hay không. DeepMind đã xây dựng dựa trên các tác nhân AI kế thừa của mình để cho phép Agent57 đưa ra quyết định tốt hơn trong việc khám phá môi trường và đánh giá hiệu suất của trò chơi, cũng như tối ưu hóa sự cân bằng giữa hành vi ngắn hạn và dài hạn trong các trò chơi như Trượt tuyết.

Kết quả rất ấn tượng, nhưng AI vẫn còn một chặng đường dài phía trước. Các hệ thống này chỉ có thể xử lý một trò chơi tại một thời điểm, điều này, theo các nhà phát triển, trái ngược với khả năng của con người: “Tính linh hoạt thực sự dễ dàng đến với bộ não con người vẫn nằm ngoài tầm với của AI”.



Nguồn: 3dnews.ru

Thêm một lời nhận xét