Étude de différentes combinaisons de comportements adaptatives

Abstract

RÉSUMÉ. Cet article s’intéresse à la synthèse automatique d’agents en environnement incertain, se plaçant dans le cadre de l’apprentissage par renforcement, et plus précisément des processus de décision markoviens partiellement observables. Les agents (dénués de modèle de leur environnement et de mémoire à court terme) sont confrontés à de multiples… (More)
DOI: 10.3166/ria.20.311-344

Topics

6 Figures and Tables

Slides referencing similar topics