Το DeepMind Agent57 AI κερδίζει τα παιχνίδια Atari καλύτερα από έναν άνθρωπο

Η εκτέλεση ενός νευρωνικού δικτύου μέσω απλών βιντεοπαιχνιδιών είναι ένας ιδανικός τρόπος για να δοκιμάσετε την αποτελεσματικότητα της εκπαίδευσής του, χάρη στην απλή ικανότητα αξιολόγησης των αποτελεσμάτων της ολοκλήρωσης. Αναπτύχθηκε το 2012 από την DeepMind (μέρος της Alphabet), το σημείο αναφοράς 57 εμβληματικών παιχνιδιών Atari 2600 έγινε μια λυδία λίθος για τη δοκιμή των δυνατοτήτων των συστημάτων αυτομάθησης. Και εδώ ο Agent57, ένας προηγμένος πράκτορας RL (Reinforcement Learning) DeepMind, πρόσφατα έδειξε ένα τεράστιο άλμα από τα προηγούμενα συστήματα και ήταν η πρώτη επανάληψη της τεχνητής νοημοσύνης που ξεπέρασε τη γραμμή βάσης του ανθρώπινου παίκτη.

Το DeepMind Agent57 AI κερδίζει τα παιχνίδια Atari καλύτερα από έναν άνθρωπο

Το Agent57 AI λαμβάνει υπόψη την εμπειρία των προηγούμενων συστημάτων της εταιρείας και συνδυάζει αλγόριθμους για αποτελεσματική εξερεύνηση του περιβάλλοντος με μετα-έλεγχο. Συγκεκριμένα, ο Agent57 έχει αποδείξει τις υπεράνθρωπες δεξιότητές του στα Pitfall, Montezuma's Revenge, Solaris και Skiing - παιχνίδια που έχουν δοκιμάσει αυστηρά τα προηγούμενα νευρωνικά δίκτυα. Σύμφωνα με έρευνα, το Pitfall και το Montezuma's Revenge αναγκάζουν το AI να πειραματιστεί περισσότερο για να επιτύχει καλύτερα αποτελέσματα. Το Solaris και το σκι είναι δύσκολα για τα νευρωνικά δίκτυα επειδή δεν υπάρχουν πολλά σημάδια επιτυχίας - η τεχνητή νοημοσύνη δεν γνωρίζει εδώ και πολύ καιρό εάν κάνει το σωστό. Η DeepMind βασίστηκε στους κληροδοτημένους πράκτορες της AI για να επιτρέψει στον Agent57 να λαμβάνει καλύτερες αποφάσεις σχετικά με την εξερεύνηση του περιβάλλοντος και την αξιολόγηση της απόδοσης των παιχνιδιών, καθώς και τη βελτιστοποίηση της ανταλλαγής μεταξύ βραχυπρόθεσμης και μακροπρόθεσμης συμπεριφοράς σε παιχνίδια όπως το σκι.

Τα αποτελέσματα είναι εντυπωσιακά, αλλά η τεχνητή νοημοσύνη έχει ακόμη πολύ δρόμο να διανύσει. Αυτά τα συστήματα μπορούν να χειριστούν μόνο ένα παιχνίδι τη φορά, κάτι που, σύμφωνα με τους προγραμματιστές, είναι αντίθετο με τις ανθρώπινες δυνατότητες: «Η πραγματική ευελιξία που έρχεται τόσο εύκολα στον ανθρώπινο εγκέφαλο είναι ακόμα πέρα ​​από την τεχνητή νοημοσύνη».



Πηγή: 3dnews.ru

Προσθέστε ένα σχόλιο