P.A.T.
Nuovo Utente
- Registrato
- 8/5/01
- Messaggi
- 31.021
- Punti reazioni
- 1.391
Da quale giorno, il team di Demis Hassabis (acquisita Google) ha presentato la più sensazionale intelligenza artificiale al mondo, Agent57, nominato cosi' perché un unico programma vince in tutti e 57 i giochi Atari e batte anche i "superhumans", ovvero i migliori giocatori umani al mondo.
Dopo MuZero, che imparava a giocare a go e scacchi e vincere con la semplice osservazione del gioco e - a differenza di AlphaZero - senza nemmeno conoscere le regole, ora da qualche giorno e' arrivato Agent57
Agent57: Outperforming the human Atari benchmark | DeepMind
che supera gli umani in tutti i 57 giochi Atari (dicono che Muzero perdesse solo a Venture..), compreso le gare di discesa con gli sci.
Non si capisce Agent57 come giochi a Go e Scacchi. A mio avviso danno per scontato che la questione non abbia piu' interesse.
Per chi avesse solo 1 minuto da perdere nella lettura, consiglio unicamente il grafico a bolle che mostra i miglioramenti dal 2015 a quelli intervenuti nel 2019 con R2D2 e NGU (utilizzo della memoria episodica).
In piu' questo "Agent57" presenta l'introduzione dei "meta-controller" (??!)
Una dimostrazione incredibile di quanto sia intelligente il loro programma e' dato da questo video, in cui dopo solo mezz'ora di allenamento l'omino si fa beffe di ben tre mostri famelici.
All'inizio l'omino procede in assoluto "random walking" e' finisce facilmente nelle fauci dei mostriciattoli.
Poi "impara" ...e se non avete la pazienza di vedere integralmente il video guardate solo i 2 minuti finali
Dopo MuZero, che imparava a giocare a go e scacchi e vincere con la semplice osservazione del gioco e - a differenza di AlphaZero - senza nemmeno conoscere le regole, ora da qualche giorno e' arrivato Agent57
Agent57: Outperforming the human Atari benchmark | DeepMind
che supera gli umani in tutti i 57 giochi Atari (dicono che Muzero perdesse solo a Venture..), compreso le gare di discesa con gli sci.
Non si capisce Agent57 come giochi a Go e Scacchi. A mio avviso danno per scontato che la questione non abbia piu' interesse.
Per chi avesse solo 1 minuto da perdere nella lettura, consiglio unicamente il grafico a bolle che mostra i miglioramenti dal 2015 a quelli intervenuti nel 2019 con R2D2 e NGU (utilizzo della memoria episodica).
In piu' questo "Agent57" presenta l'introduzione dei "meta-controller" (??!)
Una dimostrazione incredibile di quanto sia intelligente il loro programma e' dato da questo video, in cui dopo solo mezz'ora di allenamento l'omino si fa beffe di ben tre mostri famelici.
All'inizio l'omino procede in assoluto "random walking" e' finisce facilmente nelle fauci dei mostriciattoli.
Poi "impara" ...e se non avete la pazienza di vedere integralmente il video guardate solo i 2 minuti finali
Ultima modifica: