Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
statnice:bakalar:b4b36zui [2025/06/03 11:50] – zapleka3 | statnice:bakalar:b4b36zui [2025/06/03 12:40] (current) – zapleka3 | ||
---|---|---|---|
Line 351: | Line 351: | ||
* Příliš silná heuristika (např. $h(n) > h^*(n)$) může zrychlit výpočet, ale ztrácí optimálnost. | * Příliš silná heuristika (např. $h(n) > h^*(n)$) může zrychlit výpočet, ale ztrácí optimálnost. | ||
- | ====== 4. Algoritmy posilovaného učení | + | ===== 4. Algoritmy posilovaného učení ===== |
**policy evaluation, policy improvement, | **policy evaluation, policy improvement, | ||
Line 914: | Line 914: | ||
$$ | $$ | ||
- | kde: - $H$ je hypotéza, | + | kde: |
+ | * $H$ – hypotéza, | ||
+ | * $D$ – pozorovaná | ||
+ | * $P(H|D)$ | ||
+ | * $P(D|H)$ | ||
+ | * $P(H)$ | ||
+ | * $P(D)$ | ||
==== Maximalizace očekávané utility ==== | ==== Maximalizace očekávané utility ==== | ||
- | Cílem rozhodování pod neurčitostí je zvolit | + | Racionální agent by měl volit takovou |
$$ | $$ | ||
Line 924: | Line 930: | ||
$$ | $$ | ||
- | kde: - $a$ je akce, - $s$ je možný stav světa, | + | kde: |
+ | * $a$ – akce, | ||
+ | * $s$ – možný stav světa, | ||
+ | * $P(s|a)$ | ||
+ | * $U(s, | ||
+ | |||
+ | Používá se v rozhodovacích sítích a obecně ve všech situacích, kde je třeba rozhodovat pod neurčitostí. | ||
==== Bayesovské sítě ==== | ==== Bayesovské sítě ==== | ||
- | Bayesovské sítě | + | Bayesovské sítě jsou **orientované acyklické grafy (DAG)**, kde: |
+ | * uzly reprezentují náhodné proměnné, | ||
+ | * hrany vyjadřují | ||
+ | * každá proměnná má tabulku | ||
- | Sítě umožňují efektivní | + | Bayesovské sítě umožňují efektivní |
+ | |||
+ | **Celková distribuční pravděpodobnost** v síti se rozpadá podle struktury grafu: | ||
+ | |||
+ | $$ | ||
+ | P(X_1, ..., X_n) = \prod_{i=1}^{n} P(X_i \mid \text{rodiče}(X_i)) | ||
+ | $$ | ||
=== Příklad Bayesovské sítě === | === Příklad Bayesovské sítě === | ||
Line 950: | Line 971: | ||
\end{document} | \end{document} | ||
</ | </ | ||
+ | |||
Tato Bayesovská síť ilustruje následující závislosti mezi náhodnými proměnnými: | Tato Bayesovská síť ilustruje následující závislosti mezi náhodnými proměnnými: | ||
Line 989: | Line 1011: | ||
$$ | $$ | ||
- | Použití: | + | **Použití:** |
- | + | * detekce spamu, | |
+ | * analýza sentimentu, | ||
+ | * lékařská | ||
==== Skrytý Markovův model (Hidden Markov Model, HMM) ==== | ==== Skrytý Markovův model (Hidden Markov Model, HMM) ==== | ||
Line 1008: | Line 1031: | ||
$$ | $$ | ||
- | Použití: - rozpoznávání řeči, - analýza časových řad, - strojový překlad, - sledování objektů. | + | **Algoritmy:** |
+ | * **Forward-backward** – výpočet marginálních pravděpodobností, | ||
+ | * **Viterbi** – nalezení nejpravděpodobnější sekvence skrytých stavů, | ||
+ | * **Baum-Welch** – EM algoritmus pro trénink HMM. | ||
- | Hlavní algoritmy: - **Forward-backward** (výpočet pravděpodobností), - **Viterbiho algoritmus** (nejpravděpodobnější posloupnost), - **Baum-Welch** (EM algoritmus pro trénink). | + | **Použití:** |
+ | | ||
+ | | ||
+ | | ||
+ | | ||
===== 8. Řešení POMDP ===== | ===== 8. Řešení POMDP ===== | ||
Line 1043: | Line 1073: | ||
1. Inicializace hodnotové funkce $V_0$. | 1. Inicializace hodnotové funkce $V_0$. | ||
2. Iterace pro každý $b \in B$: | 2. Iterace pro každý $b \in B$: | ||
- | $$ V_{i+1}(b) = \max_{a \in A} \left[ R(b, a) + \gamma \sum_{o \in Ω} P(o|b,a) \cdot V_i(b_{a, | + | $$ |
+ | V_{i+1}(b) = \max_{a \in A} \left[ R(b, a) + \gamma \sum_{o \in Ω} P(o|b,a) \cdot V_i(b_{a, | ||
+ | $$ | ||
* $b_{a,o}$ je nová víra (belief) po akci $a$ a pozorování $o$ | * $b_{a,o}$ je nová víra (belief) po akci $a$ a pozorování $o$ |