TipiWiki2

[ ReinforcementLearning ]

edit | Recent Changes | Find Page | All Pages | Front Page |

http://www.tecn.upf.es/~hgeffner/Andy2.pdf
Slides vom Meister persönlich ;-)

http://www.cs.bris.ac.uk/Teaching/Resources/COMSM0305/
Kursmaterialien der University of Bristol (gute Slides, die Sutton-Barto zus.fassen)

http://www.is-frankfurt.de/publikationenNeu/BekraeftigungslernendeAgentenal.pdf
Zusammenfassung auf deutsch

http://www.is-frankfurt.de/publikationenNeu/ReinforcementLearningzurLoesung.pdf
auch informativ, hier wird insbesondere auf "every visit" eingegangen

http://citeseer.ist.psu.edu/barto94monte.html
Barto's paper zu Monte Carlo und Matrix Invertierung

http://www.cs.utexas.edu/~pstone/Courses/395Tfall04/resources/index.html
Ressourcensammlung

guter Google Suchstring: "first visit" "every visit" monte carlo

http://www.cs.berkeley.edu/~nelsonb/CS188/WeeklyTopics/week13_extra.pdf
Textähnliche Zusammenfassung