Jean Kaddour, Aengus Lynch, Qi Liu, Matt J. Kusner, Ricardo Silva: Causal Machine Learning. A Survey and Open Problems. 21. Juli 2022, S.70ff., arxiv:2206.15475v2.
Julian Schrittwieser, Ioannis Antonoglou, Thomas Hubert, Karen Simonyan, Laurent Sifre: Mastering Atari, Go, chess and shogi by planning with a learned model. In: Nature. Band588, Nr.7839, Dezember 2020, ISSN1476-4687, S.604–609, doi:10.1038/s41586-020-03051-4.
Richard S. Sutton: Integrated Architectures for Learning, Planning and Reacting. In: ACM SIGART Bulletin. Band2, Nr.4, 1. Juli 1991, S.160–163, doi:10.1145/122344.122377 (psu.edu [PDF]).
J. F. Knabe: Kooperatives Reinforcement Lernen in Multiagentensystemen. B. Sc. Thesis, Universität Osnabrück, 2005 (panmental.de PDF)
psu.edu
citeseerx.ist.psu.edu
Richard S. Sutton: Integrated Architectures for Learning, Planning and Reacting. In: ACM SIGART Bulletin. Band2, Nr.4, 1. Juli 1991, S.160–163, doi:10.1145/122344.122377 (psu.edu [PDF]).
redirecter.toolforge.org
Richard Sutton: Reinforcement Learning FAQ. 2. April 2004, archiviert vom Original (nicht mehr online verfügbar) am 28. August 2016; abgerufen am 21. April 2016 (englisch).
web.archive.org
Richard Sutton: Reinforcement Learning FAQ. 2. April 2004, archiviert vom Original (nicht mehr online verfügbar) am 28. August 2016; abgerufen am 21. April 2016 (englisch).
zdb-katalog.de
Ronald J. Williams: Simple statistical gradient-following algorithms for connectionist reinforcement learning. In: Machine Learning. Band8, Nr.3, 1. Mai 1992, ISSN1573-0565, S.229–256, doi:10.1007/BF00992696.
Julian Schrittwieser, Ioannis Antonoglou, Thomas Hubert, Karen Simonyan, Laurent Sifre: Mastering Atari, Go, chess and shogi by planning with a learned model. In: Nature. Band588, Nr.7839, Dezember 2020, ISSN1476-4687, S.604–609, doi:10.1038/s41586-020-03051-4.