Историја ревизија

Аутор SHA1 Порука Датум
  Martin Thoma ddd08a2a45 Improve pseudocode пре 9 година
  Martin Thoma dd9390388d Add protocol пре 9 година
  Martin Thoma 1f5881a6e0 Add normal-distribution-z пре 9 година
  Martin Thoma 45e56d0320 Improve pseudocode пре 9 година
  Martin Thoma 14e85b383e Improve pseudocode пре 9 година
  Martin Thoma f9cdad4e4f Fix label correction pseudocode пре 9 година
  Martin Thoma 4e5cdcde51 Fix pseudocode пре 9 година
  Martin Thoma 27a1325e83 Fix Dyna-q пре 9 година
  Martin Thoma 30c37862a8 Add dyna-q algorithm пре 9 година
  Martin Thoma 578245c784 Fix pseudocode пре 9 година
  Martin Thoma c0bbfa6811 Add q-lambda пре 9 година
  Martin Thoma 93fc9e52ed Add sarsa lambda pseudocode пре 9 година
  Martin Thoma ea63ce4d57 Not learning rate but discount factor пре 9 година
  Martin Thoma 2ec24b14b8 Add XOR problem graphic пре 9 година
  Martin Thoma 0085bb50d5 Add return value пре 9 година
  Martin Thoma 1c54ccd821 Fix error in label correction; extend for banch-and-bound пре 9 година
  Martin Thoma 001350bae4 Add q-learning and improve value iteration pseudocode пре 9 година
  Martin Thoma 807b9268d0 Improve quality of description пре 9 година
  Martin Thoma b9e2162ab8 Add dynamic programming and label correction algorithm пре 9 година
  Martin Thoma 940436c883 Update pseudocode to include cost function as parameter пре 9 година
  Martin Thoma 23462814aa Slant text to arrow пре 9 година
  Martin Thoma f4674abc32 Make Kalman filter formulas more memorizable пре 9 година
  Martin Thoma d65f5d2933 Add pseudocode for policy- and value-iteration пре 9 година
  Martin Thoma fc8c41330a Add agent environment diagram for RL пре 9 година
  Martin Thoma 2a2e2d1a88 Rename MDP, POMDP пре 9 година
  Martin Thoma 73be14bd67 Mention requirements пре 9 година
  Martin Thoma 37aa7c4ecb Update README пре 9 година
  Martin Thoma 5400ce8e04 Add elevation chart пре 9 година
  Martin Thoma 41896e3668 Add pomdp scheme пре 9 година
  Martin Thoma 868f09c3ae Add MDP schema пре 9 година