Peter Dayan, Terrence J. Sejnowski: TD(λ) Converges with Probability 1. In: Machine Learning. Nr.14, 1994, S.295–301 (PDF [abgerufen am 22. April 2016]).PDF (Memento des Originals vom 22. April 2016 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/pdfs.semanticscholar.org
bkgm.com
Gerald Tesauro: Practical Issues in Temporal Difference Learning. In: Machine Learning. Nr.8, 1992, S.257–277 (PDF [abgerufen am 25. April 2016]).
G. A. Rummery, M. Niranjan: On-line Q-Learning Using Connectionist Systems. 1994, S.6 (PDF [abgerufen am 26. April 2016]).
redirecter.toolforge.org
Peter Dayan, Terrence J. Sejnowski: TD(λ) Converges with Probability 1. In: Machine Learning. Nr.14, 1994, S.295–301 (PDF [abgerufen am 22. April 2016]).PDF (Memento des Originals vom 22. April 2016 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/pdfs.semanticscholar.org
rhul.ac.uk
cs.rhul.ac.uk
Chris Watkins: Learning from Delayed Rewards. Ph.D. Thesis. 1989 (PDF [abgerufen am 26. April 2016]).
semanticscholar.org
pdfs.semanticscholar.org
Peter Dayan, Terrence J. Sejnowski: TD(λ) Converges with Probability 1. In: Machine Learning. Nr.14, 1994, S.295–301 (PDF [abgerufen am 22. April 2016]).PDF (Memento des Originals vom 22. April 2016 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/pdfs.semanticscholar.org
web.archive.org
Peter Dayan, Terrence J. Sejnowski: TD(λ) Converges with Probability 1. In: Machine Learning. Nr.14, 1994, S.295–301 (PDF [abgerufen am 22. April 2016]).PDF (Memento des Originals vom 22. April 2016 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/pdfs.semanticscholar.org