Differences
This shows you the differences between two versions of the page.
| Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
| statnice:bakalar:b4b36zui [2025/06/03 12:02] – [Point-Based Value Iteration (PBVI)] zapleka3 | statnice:bakalar:b4b36zui [2026/05/29 15:25] (current) – [Policy Improvement] knedl1k | ||
|---|---|---|---|
| Line 351: | Line 351: | ||
| * Příliš silná heuristika (např. $h(n) > h^*(n)$) může zrychlit výpočet, ale ztrácí optimálnost. | * Příliš silná heuristika (např. $h(n) > h^*(n)$) může zrychlit výpočet, ale ztrácí optimálnost. | ||
| - | ====== 4. Algoritmy posilovaného učení | + | ===== 4. Algoritmy posilovaného učení ===== |
| **policy evaluation, policy improvement, | **policy evaluation, policy improvement, | ||
| Line 401: | Line 401: | ||
| $$ | $$ | ||
| - | \pi' | + | \pi' |
| $$ | $$ | ||
| Line 458: | Line 458: | ||
| $$ | $$ | ||
| - | V_{k+1}(s) = \max_a \sum_{s' | + | V_{k+1}(s) = \max_a \sum_{s' |
| $$ | $$ | ||
| Line 464: | Line 464: | ||
| $$ | $$ | ||
| - | \pi^*(s) = \arg\max_a \sum_{s' | + | \pi^*(s) = \arg\max_a \sum_{s' |
| $$ | $$ | ||
| Line 635: | Line 635: | ||
| * Hry s nulovým součtem, kde jsou hodnoty pro oba hráče přesně opačné. | * Hry s nulovým součtem, kde jsou hodnoty pro oba hráče přesně opačné. | ||
| - | ==== Negascout | + | ==== NegaScout |
| Další vylepšení algoritmu Alpha-Beta (resp. Negamax), které využívá předpoklad, | Další vylepšení algoritmu Alpha-Beta (resp. Negamax), které využívá předpoklad, | ||