The wiki page is under active construction, expect bugs.

Differences

This shows you the differences between two versions of the page.

--- statnice:bakalar:b4b36zui [2025/06/03 11:50] – zapleka3
+++ statnice:bakalar:b4b36zui [2025/06/03 12:40] (current) – zapleka3
@@ Line 351: / Line 351: @@
   * Příliš silná heuristika (např. $h(n) > h^*(n)$) může zrychlit výpočet, ale ztrácí optimálnost.
-====== 4. Algoritmy posilovaného učení ======
+===== 4. Algoritmy posilovaného učení =====
 **policy evaluation, policy improvement, policy iteration, value iteration, Q-learning**
@@ Line 914: / Line 914: @@
 $$
-kde: - $H$ je hypotéza, - $D$ jsou data, - $P(H|D)$ je posteriorní pravděpodobnost, - $P(D|H)$ je pravděpodobnost dat za předpokladu platnosti hypotézy (likelihood), - $P(H)$ je apriorní pravděpodobnost hypotézy, - $P(D)$ je marginální pravděpodobnost dat.
+kde:
+  * $H$ – hypotéza,
+  * $D$ – pozorovaná data,
+  * $P(H|D)$ – posteriorní pravděpodobnost,
+  * $P(D|H)$ – pravděpodobnost dat za předpokladu hypotézy (likelihood),
+  * $P(H)$ – apriorní pravděpodobnost hypotézy,
+  * $P(D)$ – celková pravděpodobnost dat (normalizační konstanta).
 ==== Maximalizace očekávané utility ====
-Cílem rozhodování pod neurčitostí je zvolit akci, která maximalizuje očekávanou užitečnost:
+Racionální agent by měl volit takovou akci, která maximalizuje **očekávanou užitečnost**:
 $$
@@ Line 924: / Line 930: @@
 $$
-kde: - $a$ je akce, - $s$ je možný stav světa, - $P(s|a)$ je pravděpodobnost stavu $s$ za předpokladu akce $a$, - $U(s,a)$ je užitečnost akce $a$ ve stavu $s$.
+kde:
+  * $a$ – akce,
+  * $s$ – možný stav světa,
+  * $P(s|a)$ – pravděpodobnost stavu $s$ po provedení akce $a$,
+  * $U(s,a)$ – užitečnost výsledného stavu $s$ při akci $a$.
+Používá se v rozhodovacích sítích a obecně ve všech situacích, kde je třeba rozhodovat pod neurčitostí.
 ==== Bayesovské sítě ====
-Bayesovské sítě (též grafické modely) jsou orientované acyklické grafy, ve kterých: - vrcholy reprezentují náhodné proměnné, - hrany reprezentují podmíněné závislosti mezi proměnnými, - každá proměnná má přidruženou podmíněnou pravděpodobnostní tabulku (CPT).
+Bayesovské sítě jsou **orientované acyklické grafy (DAG)**, kde:
+  * uzly reprezentují náhodné proměnné,
+  * hrany vyjadřují podmíněnou závislost (rodič ovlivňuje potomka),
+  * každá proměnná má tabulku podmíněných pravděpodobností (CPT).
-Sítě umožňují efektivní reprezentaci a výpočet složitých pravděpodobnostních modelů a jsou základem pro inferenci (zjištění pravděpodobností nepozorovaných proměnných) a rozhodování.
+Bayesovské sítě umožňují efektivní inferenci, tj. výpočet pravděpodobností nepozorovaných proměnných.
+**Celková distribuční pravděpodobnost** v síti se rozpadá podle struktury grafu:
+$$
+P(X_1, ..., X_n) = \prod_{i=1}^{n} P(X_i \mid \text{rodiče}(X_i))
+$$
 === Příklad Bayesovské sítě ===
@@ Line 950: / Line 971: @@
 \end{document}
 </tikzjax>
 Tato Bayesovská síť ilustruje následující závislosti mezi náhodnými proměnnými:
@@ Line 989: / Line 1011: @@
 $$
-Použití: - textová klasifikace (spam, sentiment), - diagnostika v medicíně, - doporučovací systémy.
+**Použití:**
+  * detekce spamu,
+  * analýza sentimentu,
+  * lékařská diagnostika.
 ==== Skrytý Markovův model (Hidden Markov Model, HMM) ====
@@ Line 1008: / Line 1031: @@
 $$
-Použití: - rozpoznávání řeči, - analýza časových řad, - strojový překlad, - sledování objektů.
+**Algoritmy:**
+  * **Forward-backward** – výpočet marginálních pravděpodobností,
+  * **Viterbi** – nalezení nejpravděpodobnější sekvence skrytých stavů,
+  * **Baum-Welch** – EM algoritmus pro trénink HMM.
-Hlavní algoritmy: - **Forward-backward** (výpočet pravděpodobností), - **Viterbiho algoritmus** (nejpravděpodobnější posloupnost), - **Baum-Welch** (EM algoritmus pro trénink).
+**Použití:**
+  * rozpoznávání řeči,
+  * strojový překlad,
+  * analýza časových řad,
+  * sledování objektů.
 ===== 8. Řešení POMDP =====
@@ Line 1043: / Line 1073: @@
 . Inicializace hodnotové funkce $V_0$.
 . Iterace pro každý $b \in B$:
-   $$ V_{i+1}(b) = \max_{a \in A} \left[ R(b, a) + \gamma \sum_{o \in Ω} P(o|b,a) \cdot V_i(b_{a,o}) \right] $$
+$$
+V_{i+1}(b) = \max_{a \in A} \left[ R(b, a) + \gamma \sum_{o \in Ω} P(o|b,a) \cdot V_i(b_{a,o}) \right]
+$$
   * $b_{a,o}$ je nová víra (belief) po akci $a$ a pozorování $o$

Trace: • b4b01num • b0b33opt

Differences

Search

Navigation

Print/export

Tools

QR Code