Differences
This shows you the differences between two versions of the page.
| Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
| statnice:bakalar:b4b36zui [2025/09/20 21:57] – saniel | statnice:bakalar:b4b36zui [2026/05/29 15:25] (current) – [Policy Improvement] knedl1k | ||
|---|---|---|---|
| Line 7: | Line 7: | ||
| * **Metody prohledávání stavového prostoru** – DFS, BFS, ID-DFS, Dijkstra, A*. | * **Metody prohledávání stavového prostoru** – DFS, BFS, ID-DFS, Dijkstra, A*. | ||
| * **Algoritmy posilovaného učení** – policy evaluation, policy improvement, | * **Algoritmy posilovaného učení** – policy evaluation, policy improvement, | ||
| - | * **Algoritmy pro řešení her dvou hráčů** – minimax, alpha-beta prořezávání, | + | * **Algoritmy pro řešení her dvou hráčů** – minimax, alpha-beta prořezávání, |
| * **Strukturovaná reprezentace znalostí** – CSP, Scheduling, Situation calculus, STRIPS. | * **Strukturovaná reprezentace znalostí** – CSP, Scheduling, Situation calculus, STRIPS. | ||
| * **Neurčitost v AI** – maximalizace očekávané utility, Bayesovo pravidlo, Bayesovské sítě. | * **Neurčitost v AI** – maximalizace očekávané utility, Bayesovo pravidlo, Bayesovské sítě. | ||
| Line 401: | Line 401: | ||
| $$ | $$ | ||
| - | \pi' | + | \pi' |
| $$ | $$ | ||
| Line 458: | Line 458: | ||
| $$ | $$ | ||
| - | V_{k+1}(s) = \max_a \sum_{s' | + | V_{k+1}(s) = \max_a \sum_{s' |
| $$ | $$ | ||
| Line 464: | Line 464: | ||
| $$ | $$ | ||
| - | \pi^*(s) = \arg\max_a \sum_{s' | + | \pi^*(s) = \arg\max_a \sum_{s' |
| $$ | $$ | ||
| Line 582: | Line 582: | ||
| Hra je obvykle reprezentována stromem, ve kterém se hráči střídají v rozhodování a každý uzel odpovídá jednomu rozhodovacímu bodu. | Hra je obvykle reprezentována stromem, ve kterém se hráči střídají v rozhodování a každý uzel odpovídá jednomu rozhodovacímu bodu. | ||
| - | **minimax, alpha-beta prořezávání, | + | **minimax, alpha-beta prořezávání, |
| ==== Minimax ==== | ==== Minimax ==== | ||
| Line 635: | Line 635: | ||
| * Hry s nulovým součtem, kde jsou hodnoty pro oba hráče přesně opačné. | * Hry s nulovým součtem, kde jsou hodnoty pro oba hráče přesně opačné. | ||
| - | ==== Niggascout | + | ==== NegaScout |
| Další vylepšení algoritmu Alpha-Beta (resp. Negamax), které využívá předpoklad, | Další vylepšení algoritmu Alpha-Beta (resp. Negamax), které využívá předpoklad, | ||