Martin Thoma преди 9 години
родител
ревизия
0085bb50d5
променени са 2 файла, в които са добавени 2 реда и са изтрити 1 реда
  1. BIN
      source-code/Pseudocode/Policy-Iteration/Policy-Iteration.png
  2. 2 1
      source-code/Pseudocode/Policy-Iteration/Policy-Iteration.tex

BIN
source-code/Pseudocode/Policy-Iteration/Policy-Iteration.png


+ 2 - 1
source-code/Pseudocode/Policy-Iteration/Policy-Iteration.tex

@@ -37,9 +37,10 @@
                     \State $\pi(x) \gets \arg \min_a \{Q(x, a)\}$
                 \EndFor
             \EndWhile
+            \Return $\pi$
         \EndProcedure
         \end{algorithmic}
-    \caption{Policy Iteration}
+    \caption{Policy Iteration: Learning a policy $\pi: \mathcal{X} \rightarrow \mathcal{A}$}
     \label{alg:policy-iteration}
     \end{algorithm}
 \end{preview}