The wiki page is under active construction, expect bugs.

Differences

This shows you the differences between two versions of the page.

--- statnice:bakalar:b4b33rpz [2025/06/07 11:32] – [Adaboost] mistrjirka
+++ statnice:bakalar:b4b33rpz [2025/06/07 11:45] (current) – [Příklad s TikZ] mistrjirka
@@ Line 522: / Line 522: @@
 ===== Neuronové sítě =====
 **Neuronové sítě s dopředným šířením. Struktura. Učení pomocí metody zpětného šíření. Vlastnosti (výhody a nevýhody).**
+**Neuronové sítě s dopředným šířením jsou vícevrstvé architektury inspirované biologickými neurony, které transformují vstupy na výstupy pomocí vážených spojení a nelineárních aktivačních funkcí. Učí se metodou zpětného šíření chyby.**
+==== Struktura ====
+  * Skládá se z vrstev: **vstupní** (přijímá data), **skryté** (provádí výpočty) a **výstupní** (poskytuje výsledek).
+  * Každý neuron počítá vážený součet vstupů plus bias: $z = \sum w_i x_i + b$, následovaný aktivační funkcí: $a = g(z)$.
+  * Typické nelineární funkce: sigmoida, tanh, ReLU.
+==== Učení metodou zpětného šíření ====
+  - **Dopředné šíření**: Výpočet výstupů vrstev postupně od vstupu.
+  - **Výpočet chyby**: Porovnání výstupu s cílem pomocí loss funkce (např. MSE).
+  - **Zpětné šíření**:
+    * Gradienty chyby se šíří od výstupu ke vstupu pomocí řetězového pravidla.
+    * Aktualizace vah: $w \leftarrow w - \alpha \frac{\partial L}{\partial w}$, kde $\alpha$ je learning rate.
+==== Vlastnosti ====
+  * **Výhody**: Schopnost aproximovat libovolné spojité funkce (univerzální aproximátor), automatická extrakce příznaků.
+  * **Nevýhody**: Pomalé trénování, riziko přetrénování, citlivost na inicializaci vah.
+==== Konvoluce (příklad) ====
+Operace aplikuje filtr (jádro) na vstupní matici pro extrakci lokálních vzorů. Příklad pro vstup $X$ a jádro $K$: $$
+X = \begin{pmatrix}
+& 2 & 3 \\
+& 5 & 6 \\
+& 8 & 9
+\end{pmatrix}, \quad
+K = \begin{pmatrix}
+& -1 \\
+& 0
+\end{pmatrix}
+$$ Výstup pro pozici (1,1): $$
+(1 \cdot 0) + (2 \cdot -1) + (4 \cdot 1) + (5 \cdot 0) = -2 + 4 = 2
+$$
+==== Pooling a MaxPooling (příklad ====
+Snižuje prostorové rozměry, zachovává dominantní rysy. **MaxPooling** vybírá maximální hodnotu v okně. Příklad pro okno 2×2: $$
+\text{Vstup: } \begin{pmatrix}
+& 8 & 2 \\
+& 1 & 4 \\
+& 7 & 9
+\end{pmatrix} \quad
+\text{Výstup: } \begin{pmatrix}
+\max(5,8,3,1) & \max(2,4) \\
+\max(6,7) & \max(9)
+\end{pmatrix} = \begin{pmatrix}
+& 4 \\
+& 9
+\end{pmatrix}
+$$
+==== Použití Softmax ====
+Převede výstupní vektor na pravděpodobnostní distribuci: $$
+\text{softmax}(z_i) = \frac{e^{z_i}}{\sum_{j=1}^K e^{z_j}}
+$$ Používá se ve **výstupní vrstvě** pro klasifikační úlohy (např. rozpoznání digitů v MNIST).
+==== Nevýhody lineární aktivační funkce ====
+Pokud by všechny vrstvy používaly **pouze lineární funkce** ($g(z) = z$): - Síť by se degradovala na jediný perceptron (lineární kombinátor). - Ztratila by schopnost modelovat nelineární vztahy, např. XOR problém. - Klesla by výrazně expresivita modelu.
 ===== Klasifikace metodou nejbližšího souseda =====
 **Klasifikace metodou nejbližšího souseda. Výhody a nevýhody. Řadu nevýhod triviální implementace lze odstranit, jak?**
+**Metoda k-NN (k-Nearest Neighbors) je algoritmus učení s učitelem, který klasifikuje neznámý vzorek na základě většinové třídy jeho //k// nejbližších sousedů v trénovacích datech. Nevýhody triviální implementace řeší např. k-D stromy.**
+==== Příklad ====
+Uvažujme 2D datovou sadu s třídami △ (modrá) a ● (červená):
+<tikzjax>
+\usepackage{amsmath}
+\usepackage{pgfplots}
+\usetikzlibrary{automata, positioning, arrows, calc, cd, intersections,arrows.meta}
+\begin{document}
+\begin{tikzpicture}[scale=0.6]
+\draw[gray!30] (0,0) grid (6,5);
+\draw[->] (0,0) -- (6.2,0);
+\draw[->] (0,0) -- (0,5.2);
+\foreach \point/\col in {(1,1)/blue, (1,3)/blue, (2,2)/blue, (4,4)/red, (5,3)/red, (5,5)/red}
+    \fill[\col] \point circle (4pt);
+\node[blue] at (1,1) {$\triangle$};
+\node[blue] at (1,3) {$\triangle$};
+\node[blue] at (2,2) {$\triangle$};
+\node[red] at (4,4) {$\bullet$};
+\node[red] at (5,3) {$\bullet$};
+\node[red] at (5,5) {$\bullet$};
+\fill[green] (3,3) circle (4pt); % Testovací bod
+\node at (3,3.3) {?};
+\end{tikzpicture}
+\end{document}
+</tikzjax>
+Pro testovací bod (3,3) a //k//=3:\\
+. Vzdálenosti k △: √5≈2.24, √1=1, √2≈1.41\\
+. Vzdálenosti k ●: √2≈1.41, √4=2, √5≈2.24\\
+Nejbližší sousedé: △ (1.0), ● (1.41), △ (1.41) → většina △ → klasifikace jako △.
+==== Využití ====
+  * Rozpoznávání obrazců (OCR, detekce objektů)
+  * Doporučovací systémy (“uživatelé s podobným profilem”)
+  * Lékařská diagnostika (klasifikace vzorků)
+==== Výhody ====
+  - **Jednoduchá implementace** bez potřeby tréninkového modelu\\
+  - **Adaptabilita** na nová data (stačí přidat vzorky)\\
+  - **Vhodná pro vysoký počet tříd** (i stovky tříd) [1]\\
+  - **Neparametrická** – nedělá předpoklady o distribuci dat
+==== Nevýhody ====
+  - **Výpočetní náročnost** – O(//n//) pro každou klasifikaci (prohledávání všech vzorků)\\
+  - **Citlivost na šum a irelevantní atributy**\\
+  - **Problém vysoké dimenzionality** (curse of dimensionality)\\
+  - **Nevhodná pro nevyvážená data** (dominance větších tříd)
+==== Řešení nevýhod ====
+  * <WRAP>
+**k-D stromy** (k-dimensional trees):\\
+Binární stromy pro hierarchické rozdělení prostoru. Příklad pro 2D:
+<code>
+Root: (x=3.5)
+├─ Vlevo: body s x<3.5 (rozděl na y=2.5)
+└─ Vpravo: body s x≥3.5 (rozděl na y=4)
+</code>
+Složitost klesne na O(log //n//) při nízkých dimenzích [1].\\
+</WRAP>
+  * **Vážení atributů** (např. ReliefF algoritmus)\\
+  * **Normalizace dat** (potlačení vlivu škálování)\\
+  * **Výběr optimálního //k//** (křížová validací)
+==== Omezení k-D stromů ====
+  * Efektivita klesá pro dimenze >20 (“curse of dimensionality”)\\
+  * Konstrukce stromu O(//n// log //n//), ale jednorázová investice [1]
 ===== Shlukování metodou k-means =====
-**Shlukování metodou k-means, formulace úlohy a popis algoritmu. Vlastnosti algoritmu. Zobecnění - použití pro jiné ztrátové funkce než L2.**
+**Shlukování metodou k-means, formulace úlohy a popis algoritmu. Vlastnosti algoritmu. Zobecnění – použití pro jiné ztrátové funkce než L2.**
+==== Formulace úlohy ====
+Cílem je rozdělit množinu $n$ datových bodů $\mathcal{D} = \{ \mathbf{x}_1, \ldots, \mathbf{x}_n \}$ v $d$-rozměrném prostoru do $k$ shluků ($k$ předem zadané). Optimalizuje se ztrátová funkce:\\
+$$
+J = \sum_{i=1}^k \sum_{\mathbf{x} \in C_i} \|\mathbf{x} - \boldsymbol{\mu}_i\|^2
+$$\\
+kde $C_i$ je $i$-tý shluk a $\boldsymbol{\mu}_i$ jeho centroid (průměr bodů ve shluku).
+==== Popis algoritmu ====
+  - **Inicializace:** Náhodný výběr $k$ počátečních centroidů.\\
+  - **Přiřazení bodů:** Každý bod přiřazen k nejbližšímu centroidu (Eukleidovská vzdálenost):\\
+$$
+C_i = \{ \mathbf{x} : \|\mathbf{x} - \boldsymbol{\mu}_i\|^2 \leq \|\mathbf{x} - \boldsymbol{\mu}_j\|^2 \, \forall j \}
+$$\\
+  - **Aktualizace centroidů:**\\
+$$
+\boldsymbol{\mu}_i = \frac{1}{|C_i|} \sum_{\mathbf{x} \in C_i} \mathbf{x}
+$$\\
+  - **Ukončení:** Opakování kroku 2–3, dokud se přiřazení bodů nemění nebo nedojde k maximálnímu počtu iterací.
+==== Příklad ====
+<tikzjax>
+\usepackage{amsmath}
+\usepackage{pgfplots}
+\usetikzlibrary{automata, positioning, arrows, calc, cd, intersections,arrows.meta}
+\begin{document}
+\begin{tikzpicture}
+% Data points
+\filldraw[blue] (0.5,1.5) circle (2pt);
+\filldraw[blue] (1,1) circle (2pt);
+\filldraw[blue] (1.5,0.5) circle (2pt);
+\filldraw[red] (3,2) circle (2pt);
+\filldraw[red] (3.5,2.5) circle (2pt);
+\filldraw[red] (4,3) circle (2pt);
+\filldraw[green] (2,4) circle (2pt);
+\filldraw[green] (2.5,4.5) circle (2pt);
+\filldraw[green] (3,5) circle (2pt);
+% Centroids (after convergence)
+\filldraw[black] (1,1) circle (4pt) node[below] {$\mu_1$};
+\filldraw[black] (3.5,2.5) circle (4pt) node[below] {$\mu_2$};
+\filldraw[black] (2.5,4.5) circle (4pt) node[above] {$\mu_3$};
+\end{tikzpicture}
+\end{document}
+</tikzjax>
+//Výsledek po konvergenci: 3 shluky s centroidy $\mu_1, \mu_2, \mu_3$.//
+==== Vlastnosti algoritmu ====
+  * **Rychlý a škálovatelný** pro velká data ($O(n \cdot k \cdot d)$ na iteraci).\\
+  * **Citlivý na inicializaci** (špatná volba centroidů → suboptimální řešení).\\
+  * **Předpokládá konvexní shluky** stejné velikosti (špatně zpracuje nestejnoměrná data).\\
+  * **Lokální optimum:** Konverguje k nejbližšímu lokálnímu minimu $J$.
+==== Zobecnění pro jiné ztrátové funkce ====
+Místo Eukleidovské vzdálenosti ($\ell_2$) lze použít:\\
+- **Manhattanská vzdálenost ($\ell_1$):**\\
+$$
+  J = \sum_{i=1}^k \sum_{\mathbf{x} \in C_i} \|\mathbf{x} - \boldsymbol{\mu}_i\|_1
+  $$\\
+Centroid aktualizován jako **medián** shluku (odolnější vůči odlehlým hodnotám).\\
+- **Obecná Minkowského metrika ($\ell_p$):**\\
+$$
+  \|\mathbf{x} - \boldsymbol{\mu}_i\|_p = \left( \sum_{j=1}^d |x_j - \mu_{ij}|^p \right)^{1/p}
+  $$\\
+- **Kosinová podobnost:** Pro textová/data s vysokou dimenzí.
+==== K-means++ ====
+Vylepšení inicializace centroidů:\\
+. První centroid náhodně vybrán z dat.\\
+. Každý další centroid vybrán s pravděpodobností úměrnou $\|\mathbf{x} - \mu_{\text{nejblížší}}\|^2$.\\
+**Výhody:** Snižuje riziko špatné konvergence, často dosáhne globálního optima s menším počtem iterací.
+==== Aplikace ====
+  * Segmentace zákazníků, analýza genomických dat, komprese obrazu (redukce barev), detekce anomálií.

Trace: • b0b35apo • b4b01num • b0b35lsp • b0b33opt • b0b36prp

Differences

Search

Navigation

Print/export

Tools

QR Code