Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
statnice:bakalar:b4b01dma [2025/05/28 11:24] – mistrjirka | statnice:bakalar:b4b01dma [2025/05/31 10:26] (current) – [Příklad 2 – násobný kořen] mistrjirka | ||
---|---|---|---|
Line 1: | Line 1: | ||
- | ==== Způsoby popisu rozdělení náhodných veličin a vektorů. Odhady parametrů rozdělení. Základní statistické testy. Markovské řetězce a jejich asymptotické vlastnosti. ==== | + | ====== Vlastnosti celých |
- | [[https:// | + | [[https:// |
- | * **Definice pravděpodobnosti (Kolmogorovova)** – nezávislost náhodných jevů, podmíněná pravděpodobnost, | + | * **Dělitelnost** – definice, základní vlastnosti (například tranzitivita), výpočet gcd(a, b). |
- | * **Náhodné vektory a jejich popis** – nezávislost náhodných veličin, kovariance | + | * **Celá čísla modulo n** – definice kongruence, pravidla počítání, inverzní číslo |
- | * **Čebyševova nerovnost** – centrální limitní věta. | + | * **Bezoutova identita** – vyjádření gcd jako lineární kombinace čísel a, b. Využití pro řešení diofantických rovnic a hledání inverzního čísla modulo n. |
- | * **Základní pojmy statistiky** – náhodný výběr, empirické rozdělení. | + | * **Euklidův algoritmus** – teorie a praxe výpočtu gcd postupným dělením se zbytkem. Rozšířená verze umožňující získat Bezoutovu identitu. |
- | * **Obecné vlastnosti odhadů parametrů** – odhady střední hodnoty, rozptylu, směrodatné odchylky, momentů. Odhady parametrů metodou momentů a metodou maximální věrohodnosti. Intervalové odhady. | + | * **Binární relace** – definice a příklady. Čtyři základní vlastnosti: reflexivita, symetrie, antisymetrie, tranzitivita. Ilustrace grafem relace nebo příklady ze života. |
- | * **Princip statistického testování hypotéz** – testy střední hodnoty | + | * **Indukce** – princip matematické indukce, slabá |
- | * **Markovovy řetězce** – základní pojmy a vlastnosti, popis přechodovým diagramem a maticí přechodu. Klasifikace stavů, periodicita, | + | * **Rekurentní rovnice** – vlastnosti |
+ | ===== 1. Dělitelnost ===== | ||
- | ===== Definice | + | ==== Definice, základní vlastnosti (tranzitivita a podobně), gcd(a,b). ==== |
- | **Definice pravděpodobnosti (Kolmogorovova)** – nezávislost náhodných jevů, podmíněná pravděpodobnost, | + | |
- | < | + | Nechť $a,b\in \mathbb{Z}$. Řekneme, že $a$ dělí $b$, značeno |
- | Kolmogorovova definice pravděpodobnosti je založená na axiomech, které stanovují základní vlastnosti pravděpodobnostních jevů. Tyto axiomy jsou: | + | |
- | </ | + | |
- | * **Axiom nezápornosti**: | + | |
- | * **Axiom normovanosti**: | + | |
- | * **Axiom aditivity**: | + | |
- | ==== Podmíněná pravděpodobnost ==== | + | |
- | **Podmíněná pravděpodobnost** je pravděpodobnost jevu A za předpokladu, že nastal jev B. Definuje se jako: | + | |
- | $$P(A|B) = \frac{P(A \cap B)}{P(B)}, \quad P(B) > 0$$ | + | |
- | Tato rovnice říká, | + | |
- | Z toho vyplývá tato identita: | + | Tato relace je: |
- | $$P(A) = P(A|B)P(B) + P(A|B^c)P(B^c)$$ | + | * **reflexivní** – každé číslo dělí samo sebe, $a \mid a$. |
+ | * **tranzitivní** – pokud $a \mid b$ a $b \mid c$, pak $a \mid c$. | ||
+ | * **antisymetrická** – pokud $a \mid b$ a $b \mid a$, pak $|a| = |b|$. | ||
+ | * **nesymetrická** – obecně neplatí, že $a \mid b \Rightarrow b \mid a$. | ||
- | ==== Bayesova věta ==== | + | Množina $\mathbb{Z}$ je uzavřená na operace sčítání, odčítání i násobení. |
- | **Bayesova věta** je důležitý nástroj pro výpočet podmíněných pravděpodobností. Umožňuje přepočítat pravděpodobnost jevu A za předpokladu, | + | |
- | $$ | + | |
- | P(A|B) = \frac{P(B|A)P(A)}{P(B)}$$ | + | |
- | Tento vzorec ukazuje, jak lze využít pravděpodobnost B vzhledem k A a apriorní pravděpodobnost A k výpočtu podmíněné pravděpodobnosti A vzhledem k B. | + | |
- | ==== Náhodná veličina ==== | + | ==== Společný dělitel a GCD ==== |
- | Měřitelná funkce, která přiřazuje každému elementárnímu jevu reálné číslo. Jeji chování popisuje neklesající distribuční funkce | + | |
- | Hustota pravděpodobnosti je derivací distribuční funkce, pokud existuje: | + | Číslo $d \in \mathbb{N}$ je **společný dělitel** |
- | $$ | + | |
- | f(t) = \frac{dF(t)}{dt}$$ | + | Největší společný dělitel (greatest common divisor) čísel $a$ a $b$ označujeme $\text{gcd}(a,b)$ a definujeme jako největší číslo, které dělí obě čísla: |
- | $$ f(t) \geq 0$$ | + | |
- | Pravděpodobnostní funkce je funkce $p_x(t) = P(X = t)$, která udává pravděpodobnost, že náhodná veličina $X$ nabude konkrétní hodnoty $t$. | + | |
- | === Diskrétní náhodná veličina === | ||
- | Nabývá konečný počet hodnot, distrbuční funkce je schodová funkce, pravděpodobnostní funkce je dána jako: | ||
$$ | $$ | ||
- | p(t) = P(X = t) = \sum_{i} p_i \delta(t - t_i) | + | n = \text{gcd}(a,b) \iff n \mid a \land n \mid b \land \forall d \in \mathbb{Z}: (d \mid a \land d \mid b \Rightarrow d \leq n) |
$$ | $$ | ||
+ | Platí: | ||
+ | * $\text{gcd}(0, | ||
+ | * $\text{gcd}(a, | ||
+ | * $\text{gcd}(a, | ||
- | {{:statnice: | + | ==== Poznámky ==== |
+ | * Dvě čísla $a$, $b$ jsou **nesoudělná**, | ||
+ | * Existuje také pojem **společný násobek**: $m$ je společný násobek čísel $a$, $b$, pokud $a \mid m$ a $b \mid m$. | ||
+ | * Nejmenší takové $m$ je **nejmenší společný násobek** (lcm), značíme $\text{lcm}(a,b)$. | ||
+ | * Platí: | ||
+ | $$ | ||
+ | \text{lcm}(a, b) \cdot \text{gcd}(a, | ||
+ | $$ | ||
+ | * pokud $a, b \neq 0$. | ||
+ | * Pro libovolné $a$: $\text{lcm}(a, | ||
+ | * Lze se k tomu dostat přes prvočíslený rozklad | ||
- | === Spojitá náhodná veličina | + | ===== 2. Celá čísla modulo n ===== |
- | Nabývá nekonečný počet hodnot, distribuční funkce je spojitá a pravděpodobnostní funkce je dána jako hustota pravděpodobnosti. Ale pravděpodobnost, | + | |
- | $$ | + | |
- | f(t) = \frac{dF(t)}{dt} | + | |
- | $$ | + | |
- | {{: | + | |
- | === Smíšená náhodná veličina | + | |
- | Nabývá jak diskrétních, | + | |
- | $$ | + | |
- | f(t) = \sum_{i} p_i \delta(t - t_i) + f_c(t),$$ | + | |
- | kde $p_i$ jsou pravděpodobnosti diskrétních hodnot $t_i$ a $f_c(t)$ je hustota spojité části. | + | |
- | ==== Střední hodnota, rozptyl a směrodatná odchylka ==== | + | – co je kongruence, jak se tam počítá, co je inverzní |
- | **Střední hodnota** (očekávaná hodnota) náhodné veličiny $X$ je definována jako: | + | |
- | $$ | + | |
- | E(X) = \int_{-\infty}^{\infty} t f(t) dt,$$ | + | |
- | kde $f(t)$ je hustota pravděpodobnosti pro spojitou náhodnou veličinu, nebo pro diskrétní náhodnou veličinu: | + | |
- | $$ | + | |
- | E(X) = \sum_{i} t_i p_i,$$ | + | |
- | kde $t_i$ jsou hodnoty, které náhodná veličina $X$ může nabývat, a $p_i$ jsou jejich pravděpodobnosti. | + | |
- | **Rozptyl** náhodné veličiny $X$ je definován jako: | + | |
- | $$ | + | |
- | Var(X) = E((X - E(X))^2) = E(X^2) - (E(X))^2, | + | |
- | kde $E(X^2)$ je očekávaná hodnota druhé mocniny náhodné veličiny. | + | |
- | **Směrodatná odchylka** je druhá odmocnina rozptylu: | + | |
- | $$ | + | |
- | \sigma(X) = \sqrt{Var(X)}$$ | + | |
- | **Moment** náhodné veličiny $X$ je definován jako: | + | |
- | $$ | + | |
- | M_k(X) = E(X^k) = \int_{-\infty}^{\infty} t^k f(t) dt,$$ | + | |
- | pro $k = 1, 2, \ldots$ | + | |
- | Pro diskrétní náhodnou veličinu je moment definován jako: | + | |
- | $$ | + | |
- | M_k(X) = \sum_{i} t_i^k p_i,$$ | + | |
- | kde $t_i$ jsou hodnoty, které náhodná veličina $X$ může nabývat, a $p_i$ jsou jejich pravděpodobnosti. | + | |
- | ==== Základní typy rozdělení ==== | + | |
- | === Diskrétní rozdělení === | + | |
- | **Binomické rozdělení** | + | |
- | $$ | + | |
- | P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k = 0, 1, \ldots, n$$ | + | |
- | **Poissonovo rozdělení** – popisuje | + | |
- | $$ | + | |
- | P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, | + | |
- | **Geometrické rozdělení** – popisuje počet pokusů potřebných k dosažení prvního úspěchu v sérii nezávislých Bernoulliho pokusů. Distribuční funkce je dána jako: | + | |
- | $$ | + | |
- | P(X = k) = (1 - p)^{k - 1} p, \quad k = 1, 2, \ldots$$ | + | |
- | **Alternativní rozdělení** – popisuje počet pokusů potřebných k dosažení prvního úspěchu v sérii nezávislých Bernoulliho pokusů, ale s různými pravděpodobnostmi úspěchu v jednotlivých pokusech. Distribuční funkce je dána jako: | + | |
- | $$ | + | |
- | P(X = k) = \prod_{i=1}^{k-1} (1 - p_i) p_k, \quad k = 1, 2, \ldots$$ | + | |
- | **Rovnoměrné rozdělení** – popisuje náhodnou veličinu, která může nabývat hodnot v intervalu $[a, b]$ s rovnoměrnou pravděpodobností. Distribuční funkce je dána jako: | + | |
- | $$ | + | |
- | P(X = k) = \frac{1}{b - a + 1}, \quad k = a, a + 1, \ldots, b$$ | + | |
- | **Hypergeometrické rozdělení** – popisuje počet úspěchů v náhodném výběru $n$ položek z populace o velikosti $N$, která obsahuje $K$ úspěšných položek. Distribuční funkce je dána jako: | + | |
- | $$ | + | |
- | P(X = k) = \frac{\binom{K}{k} \binom{N - K}{n - k}}{\binom{N}{n}}, | + | |
- | Napřiklad " | + | |
- | $$ | + | |
- | E(x) = \frac{(J \cdot S)}{M} | + | |
- | $$ | + | |
- | === Spojitá rozdělení | + | ==== Modulo |
- | **Rovnoměrné rozdělení** – popisuje náhodnou veličinu, která může nabývat hodnot v intervalu $[a, b]$ s rovnoměrnou pravděpodobností. Distribuční funkce je dána jako: | + | |
- | $$ | + | |
- | F(x) = \begin{cases} | + | |
- | 0, & x < a \\ | + | |
- | \frac{x - a}{b - a}, & a \leq x < b \\ | + | |
- | 1, & x \geq b | + | |
- | \end{cases} | + | |
- | $$ | + | |
- | Hustota je tvaru | + | |
- | $$ | + | |
- | f(x) = \begin{cases} | + | |
- | \frac{1}{b - a}, & a < x < b \\ | + | |
- | 0, & \text{jinak} | + | |
- | \end{cases} | + | |
- | $$ | + | |
- | **Normální rozdělení** – popisuje náhodnou veličinu, která má symetrické rozdělení | + | **Modulo** znamená „zbytek po dělení“. Zapisujeme jako $a \bmod n$ a označuje zbytek po celočíselném dělení |
- | $$ | + | |
- | \Phi(x) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{x} e^{-\frac{t^2}{2}}\, | + | |
- | $$ | + | |
- | Hustota je tvaru | + | Příklad: |
- | $$ | + | |
- | f(x) = \frac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}} | + | |
- | $$ | + | |
- | **Exponenciální rozdělení** – popisuje čas mezi událostmi v Poissonově procesu. Distribuční funkce je dána jako: | + | |
- | $$ | + | |
- | F(x) = 1 - e^{-\lambda x}, \quad x \geq 0$$ | + | |
- | Hustota pravděpodobnosti je dána jako: | + | |
- | $$ | + | |
- | f(x) = \lambda e^{-\lambda x}, \quad x \geq 0$$ | + | |
- | ===== Náhodné vektory a jejich popis ===== | ||
- | **Náhodné vektory a jejich popis** – nezávislost náhodných veličin, kovariance a korelace. | ||
- | **Náhodný vektor** je n-rozměrný vektor $(X_1, X_2, \ldots, X_n)$, kde každá složka $X_i$ je náhodná veličina (Měřitelná funkce, která přiřazuje každému elementárnímu jevu reálné číslo) definovaná na stejném pravděpodobnostním prostoru. | + | ==== Kongruence ==== |
- | Společná distribuční funkce náhodného vektoru je definována jako: | + | Čísla $a,b\in \mathbb{Z}$ jsou **kongruentní modulo** $n$, pokud mají stejný zbytek po dělení $n$. |
+ | |||
+ | Formálně: | ||
$$ | $$ | ||
- | F(x_1, x_2, \ldots, x_n) = P(X_1 \leq x_1, X_2 \leq x_2, \ldots, X_n \leq x_n) | + | a \equiv b \pmod{n} |
$$ | $$ | ||
+ | což znamená, že existuje $k \in \mathbb{Z}$ takové, že $a = b + kn$. | ||
- | Pro spojitý náhodný vektor existuje společná hustota pravděpodobnosti $f(x_1, x_2, \ldots, x_n)$ taková, že: | + | Ekvivalentně také platí: |
$$ | $$ | ||
- | F(x_1, x_2, \ldots, x_n) = \int_{-\infty}^{x_1} \int_{-\infty}^{x_2} \cdots \int_{-\infty}^{x_n} f(t_1, t_2, \ldots, t_n) dt_1 dt_2 \cdots dt_n | + | a \bmod n = b \bmod n |
$$ | $$ | ||
- | ==== Nezávislost náhodných veličin ==== | + | Kongruence vytváří **ekvivalenční relaci** na množině $\mathbb{Z}$ a rozděluje ji do tříd zbytků. |
- | Náhodné veličiny | + | |
+ | Každé číslo $a$ patří do třídy zbytků $[a]_n$, která obsahuje všechna čísla kongruentní s $a$ modulo $n$. | ||
+ | |||
+ | ==== Počítání v $\mathbb{Z}_n$ | ||
+ | |||
+ | Nechť $n \in \mathbb{N}$, a platí $a \equiv u \pmod{n}$ a $b \equiv v \pmod{n}$, pak: | ||
+ | |||
+ | * $a + b \equiv u + v \pmod{n}$ | ||
+ | | ||
+ | | ||
+ | |||
+ | Tyto operace v modulo aritmetice definují strukturu **komutativního okruhu** $\mathbb{Z}_n$ (množina všech zbytkových tříd modulo $n$). | ||
+ | |||
+ | Alternativní zápis (například v kryptografii nebo při implementaci): | ||
+ | * $a \oplus b = (a + b) \bmod n$ | ||
+ | * $a \odot b = (a \cdot b) \bmod n$ | ||
+ | |||
+ | ==== Inverzní číslo ==== | ||
+ | |||
+ | Nechť $a \in \mathbb{Z}$ a $n \in \mathbb{N}$. Číslo $x \in \mathbb{Z}$ je **inverzní k $a$ modulo $n$**, pokud: | ||
$$ | $$ | ||
- | F(x_1, x_2, \ldots, x_n) = F_1(x_1) | + | a \cdot x \equiv 1 \pmod{n} |
$$ | $$ | ||
- | kde $F_i(x_i)$ je marginální distribuční funkce náhodné veličiny $X_i$. | ||
- | Pro spojité náhodné veličiny je podmínka nezávislosti ekvivalentní | + | Takové $x$ převádí $a$ na jedničku v $\mathbb{Z}_n$, |
+ | |||
+ | **Podmínka existence**: | ||
+ | |||
+ | **Výpočet**: | ||
+ | * Pomocí **rozšířeného Eukleidova algoritmu** – najdeme $x, y \in \mathbb{Z}$ tak, že $a \cdot x + n \cdot y = 1$, potom $x \bmod n$ je hledané inverzní číslo. | ||
+ | * Inverzi nelze spočítat, pokud $a$ a $n$ mají společného dělitele většího než 1 (například $2^{-1} \bmod 4$ neexistuje). | ||
+ | |||
+ | ==== Prvočísla ==== | ||
+ | |||
+ | Prvočísla hrají v počítání modulo důležitou roli. | ||
+ | |||
+ | **Definice**: | ||
+ | |||
+ | V $\mathbb{Z}_p$ pro prvočíslo $p$ má **každý nenulový prvek inverzi** – $\mathbb{Z}_p$ je tedy pole. | ||
+ | |||
+ | Čísla, která nejsou prvočísla a mají více než dva různé dělitele, nazýváme **složená čísla**. | ||
+ | |||
+ | |||
+ | ===== 3. Bezoutova identita ===== | ||
+ | – Která gcd poskytne jako lineární kombinaci čísel $a,b$. K čemu se dá použít: hledání inverzního čísla ve světě modulo, řešení diofantických rovnic. | ||
+ | |||
+ | Bezoutova identita říká, že největší společný dělitel dvou čísel $a, b \in \mathbb{Z}$ lze zapsat jako jejich lineární kombinaci | ||
$$ | $$ | ||
- | f(x_1, x_2, \ldots, x_n) = f_1(x_1) | + | \gcd(a,b) = \alpha a + \beta b \quad \text{pro nějaká } \alpha, \beta \in \mathbb{Z} |
$$ | $$ | ||
- | ==== Kovariance | + | Tato identita je základem pro řadu dalších výsledků v teorii čísel, zejména při řešení diofantických rovnic |
- | **Kovariance** dvou náhodných veličin $X$ a $Y$ je definována jako: | + | |
+ | Příklad: | ||
$$ | $$ | ||
- | \text{Cov}(X, Y) = E[(X - E(X))(Y - E(Y))] | + | \gcd(12, 42) = 6 = (-3) \cdot 12 + 1 \cdot 42 |
$$ | $$ | ||
- | < | ||
+ | Jedno z možných řešení pro $(\alpha, | ||
- | **Vlastnosti kovariance: | ||
- | </ | ||
- | * $\text{Cov}(X, | ||
- | * $\text{Cov}(X, | ||
- | * $\text{Cov}(aX + b, cY + d) = ac \cdot \text{Cov}(X, | ||
- | * $Var(X + Y) = Var(X) + Var(Y) + 2\text{Cov}(X, | ||
- | < | ||
- | **Korelace** je to kovariance pro normované náhodné veličiny, definovaná jako: | + | ==== Hledání inverzního čísla ==== |
- | </ | + | |
+ | Chceme nalézt inverzní prvek $a^{-1} \in \mathbb{Z}_n$, | ||
+ | |||
+ | Postup: | ||
+ | | ||
+ | | ||
+ | | ||
+ | * Inverzní | ||
+ | |||
+ | Neboli: | ||
+ | * Najdeme $\gcd(a, n)$ ve tvaru $1 = A \cdot a + B \cdot n$ (rozšířený Eukleidův algoritmus). | ||
+ | * Pokud $\gcd(a, | ||
+ | * Pokud $\gcd(a,n) = 1$, pak $A$ je právě inverzní prvek $a^{-1} \mod n$, protože: | ||
+ | |||
+ | ==== Diofantické rovnice ==== | ||
+ | |||
+ | Pojem **lineární diofantická rovnice** označujme libovolnou rovnici typu $ax + by = c$ s neznámými $x,y\in \mathbb{Z}$, | ||
+ | |||
+ | **Definice**: | ||
$$ | $$ | ||
- | \rho(X, Y) = \frac{\text{Cov}(X, | + | ax + by = c |
- | Korelace nabývá hodnot v intervalu $[-1, 1]$ a měří sílu lineární závislosti mezi náhodnými veličinami. Pokud $\rho(X, Y) = 0$, pak jsou $X$ a $Y$ nezávislé. | + | |
$$ | $$ | ||
- | Var(X + Y) = Var(X) + Var(Y) + 2 \cdot \text{Cov}(X, | ||
- | $$ | ||
- | ===== Čebyševova nerovnost ===== | ||
- | < | ||
- | **Čebyševova nerovnost** – centrální limitní věta. | ||
- | Čebyševova nerovnost | + | Řešení existuje tehdy a jen tehdy, když $c$ je dělitelná $\gcd(a,b)$. Bezoutova identita pak dává způsob, jak jedno řešení najít. |
- | </ | + | **Řešení diofantických rovnic:** |
- | **Formulace:** Nechť $X$ je náhodná veličina s konečnou střední hodnotou $E(X) = \mu$ a konečným rozptylem $Var(X) = \sigma^2$. Pak pro libovolné $\epsilon > 0$ platí: | + | |
- | $$ | + | |
- | P(|X - \mu| \geq \epsilon) \leq \frac{\sigma^2}{\epsilon^2}$$ | + | |
- | < | + | |
- | **Ekvivalentní formulace: | + | Nechť |
- | </ | + | |
- | $$ | + | |
- | P(|X - \mu| < \epsilon) \geq 1 - \frac{\sigma^2}{\epsilon^2}$$ | + | |
- | < | + | |
- | **Interpretace: | + | Jeli daná diofantická rovnice $ax +by = c$, pak definujeme její **přidruženou homogenní rovnici** jako $ax + by = 0$. |
- | - Nerovnost | + | |
- | </ | + | |
- | | + | |
- | | + | |
- | < | + | |
- | **Praktický význam:** | + | **Věta o řešení homogeních rovnic**: |
- | - Poskytuje univerzální odhad platný pro všechna rozdělení s konečným rozptylem | + | |
- | - Je základem pro odvození zákona velkých čísel | + | |
- | - Používá se jako teoretické zdůvodnění pro centrální limitní větu | + | |
- | **Kontext k CLV:** Čebyševova nerovnost umožňuje dokázat slabý zákon velkých čísel, který je klíčovým krokem k pochopení centrální limitní věty. CLV pak zpřesňuje asymptotické chování průměrů nezávislých náhodných veličin. | + | Uvažujme rovnici $ax+by=0$ pro $a,b \in \mathbb{Z}$. Množina všech jejích celočíslených řešení je $$\left\{ \left(k \frac{b}{\gcd(a, b)}, - k \frac{a}{\gcd(a, b)}\right) : k \in \mathbb{Z} \right\} $$ |
- | </ | + | |
- | ==== Centrální limitní věta ==== | + | |
- | < | + | |
- | **Centrální limitní věta (CLV)** je jedním z nejdůležitějších výsledků v teorii pravděpodobnosti. Říká, že pokud máme dostatečně velký počet nezávislých a identicky rozdělených náhodných veličin, jejich průměr se bude blížit normálnímu rozdělení bez ohledu na původní rozdělení těchto veličin. | + | |
- | </ | + | |
- | **Formulace: | + | |
- | $$ | + | |
- | \frac{\sqrt{n}(\bar{X}_n - \mu)}{\sigma} \xrightarrow{d} N(0, 1)$$ | + | |
- | kde $\bar{X}_n = \frac{1}{n} \sum_{i=1}^{n} X_i$ je průměrná hodnota těchto veličin a $N(0, 1)$ je standardní normální rozdělení. | + | |
- | < | + | |
- | Praktický vzorec pro CLV: | ||
- | </ | ||
- | $$ | ||
- | P(X \leq x) \approx P(\text{norm}(X) \leq \frac{x - \mu}{\sigma / \sqrt{n}}) = \Phi\left(\frac{x - \mu}{\sigma / \sqrt{n}}\right), | ||
- | $$ | ||
- | kde $\mu$ je střední hodnota, $\sigma$ je směrodatná odchylka a $\Phi$ je distribuční funkce standardního normálního rozdělení. | ||
- | ===== Základní pojmy statistiky ===== | ||
- | **Základní pojmy statistiky** – náhodný výběr, empirické rozdělení. | ||
- | ==== Náhodný výběr | + | ==== Algoritmus řešení diofantických rovnic |
- | Náhodnému vektoru $\mathbb{X} = (X_1, X_2, \ldots, X_n)$ nezávisle rozdělených náhodných veličin s distribuční funkcí $F_{\theta}$, | + | |
- | Funkce | + | |
- | $$ | + | |
- | | + | |
- | $$ | + | |
- | náhodného výběru $\mathbb{X} = (X_1, X_2, \ldots, X_n)$ se nazývá **výběrový průměr** a je to odhad střední hodnoty náhodného vektoru. | + | |
- | $S_{n}^{2} | + | **Algoritmus** pro nalezení všech celočíselných řešení rovnice |
- | * Výběrový průměr | + | - Najdeme $gcd(a, |
- | * Výběrový průměr | + | - Jestliže $c$ není násobkem gcd(a,b), pak neexistuje řešení |
+ | - Jestliže $gcd(a,b)$ dělí c: | ||
+ | - Zadefinujeme $c'=\frac{c}{gcd(a,b)}$ a získáme partikulární řešení $x_p=Ac' | ||
+ | - Pro jednochost zápisu zadefinujeme $a'=\frac{a}{gcd(a,b)}$, $b'=-\frac{b}{gcd(a,b)}$ pro $k\in \mathbb{Z}$(Toto vychází z věty o řešení homogeních rovnic). | ||
+ | - Sečtením partikulárního a obecného homogenního řešení získáme množinu všech celočíselných řešení | ||
+ | |||
+ | Pro řešení difonatických rovnic musíme najít | ||
- | ==== Empirické rozdělení ==== | + | ==== Bonus: Malá Fermatova věta ==== |
- | Nechť $x_1, x_2, \ldots, x_n$ je realizace náhodného výběru rozsahu | + | |
- | **Empirická distribuční funkce** (ECDF) | + | Malá Fermatova věta se často používá při hledání inverzních prvků modulo prvočíslo. |
+ | |||
+ | * Pro každé prvočíslo | ||
+ | $$ | ||
+ | a^p \equiv a \pmod{p} | ||
+ | $$ | ||
+ | | ||
+ | $$ | ||
+ | a^{p-1} \equiv 1 \pmod{p} | ||
+ | $$ | ||
+ | |||
+ | Z toho plyne, že inverzní prvek lze vypočítat | ||
$$ | $$ | ||
- | F_n(x) = \frac{1}{n} \sum_{i=1}^{n} I(x_i \leq x) | + | a^{-1} \equiv a^{p-2} \pmod{p} |
$$ | $$ | ||
- | kde $I(A)$ je indikátorová funkce události $A$, která je rovna 1, pokud je událost $A$ pravdivá, a 0 jinak. Jinými slovy, $F_n(x)$ udává podíl pozorování | + | ===== 4. Euklidův algoritmus ===== |
- | Graf Empirické distribuční funkce | + | – jak funguje, teoreticky |
- | Například | + | |
+ | Ve své základní verzi slouží k hledání GCD (Největšího společného dělitele). | ||
+ | |||
+ | Postupně počítáme zbytky po dělení, přičemž | ||
+ | Níže je uveden příklad | ||
< | < | ||
+ | \usepackage{tikz} | ||
+ | \usetikzlibrary{matrix, | ||
+ | |||
\begin{document} | \begin{document} | ||
\begin{tikzpicture} | \begin{tikzpicture} | ||
- | \draw[-> | + | |
- | \draw[-> | + | matrix of nodes, |
- | \draw[thick] (0,0) -- (1,0) -- (1,0.75) -- (2,0.75) -- (2,2.25) -- (3,2.25) -- (3,3) -- (5,3); | + | nodes in empty cells, |
- | \foreach | + | nodes={font=\ttfamily, |
- | \draw[fill] | + | column sep=0.1em, |
- | \draw[] (\x,{0.75*(\x>1) + 2.25*(\x> | + | |
- | } | + | 408 & \verb!|! & & \\ |
- | \node[below] at (1,0) {1}; | + | 108 & \verb!|! & $(-3)\times$ & \\ |
- | \node[below] at (2,0) {2}; | + | 84 & \verb!|! & $(-1)\times$ & \\ |
- | \node[below] at (3,0) {3}; | + | 24 & \verb!|! & $(-3)\times$ & \\ |
- | \node[left] at (0,0.75) {0.25}; | + | 12 & \verb!|! & $(-2)\times$ & \\ |
- | \node[left] at (0,2.25) {0.75}; | + | 0 & \verb!|! & & \\ |
- | \node[left] at (0,3) {1}; | + | |
+ | \end{tikzpicture} | ||
+ | \end{document} | ||
+ | </ | ||
+ | |||
+ | Díky postupnému zmenšování čísel má algoritmus logaritmickou časovou složitost, což z něj dělá velmi efektivní metodu i pro velká čísla. | ||
+ | |||
+ | ==== Rozšířený Euklidův algoritmus ==== | ||
+ | |||
+ | Rozšířený Euklidův algoritmus najde nejen GCD (největší společný dělitel), ale zároveň i lineární kombinaci počátečních čísel ze kterých se GCD skládá, což je kritické pro použití Bezoutovy identity a řešení diofantických rovnic. Pro shrnutí: Nechť $a,b \in \mathbb{N}$, | ||
+ | |||
+ | Po jeho použití dostaneme rovnou Bezoutovu identitu, zkonstruujeme ho následující tabulkou, kde vedle původních čísel dosadíme jednotkovou matici | ||
+ | |||
+ | Každý řádek se skládá z $r_i$ | $x_i$ | $y_i$, kde $r_i = x_i\cdot a + y_i\cdot b$. Pro výpočet řádku $i+1$ hledáme $a = \textbf{floor}(r_{i-1} / r_i)$ poté nový řádek je $r_{i+1}$ | $x_i\cdot | ||
+ | |||
+ | Každý řádek obsahuje tři hodnoty $r_i \;|\; x_i \;|\; y_i$, kde: | ||
+ | * $r_i$ je aktuální zbytek, | ||
+ | * $x_i$ a $y_i$ jsou koeficienty, | ||
+ | |||
+ | < | ||
+ | \usepackage{tikz} | ||
+ | \usetikzlibrary{matrix,arrows.meta,positioning} | ||
+ | |||
+ | \begin{document} | ||
+ | \begin{tikzpicture} | ||
+ | % set up the matrix | ||
+ | \matrix | ||
+ | matrix of nodes, | ||
+ | nodes in empty cells, | ||
+ | nodes={font=\ttfamily, minimum width=1.5em, minimum height=1.2em, align=center}, | ||
+ | column sep=1em, | ||
+ | ] { | ||
+ | & \verb!|! & 408 & 108 & \\ | ||
+ | 408 & \verb!|! & 1 & 0 & \\ | ||
+ | 108 & \verb!|! & 0 & 1 & \\ | ||
+ | 84 & \verb!|! & 1 & -3 & \\ | ||
+ | 24 & \verb!|! & -1 & 4 & \\ | ||
+ | 12 & \verb!|! & 4 & -15 & \\ | ||
+ | 0 & \verb!|! & & & | ||
+ | }; | ||
+ | |||
+ | \draw[-{Stealth}] | ||
+ | | ||
+ | node[midway, | ||
+ | | ||
+ | |||
+ | \draw[-{Stealth}] | ||
+ | | ||
+ | node[midway, | ||
+ | (m-3-5.west); | ||
+ | |||
+ | | ||
+ | | ||
+ | node[midway, anchor=west, | ||
+ | (m-4-5.west); | ||
+ | |||
+ | | ||
+ | | ||
+ | node[midway, | ||
+ | (m-5-5.west); | ||
+ | |||
+ | | ||
+ | {$12 \;=\; 4\cdot408 \;+\;(-15)\cdot108$}; | ||
+ | |||
+ | | ||
+ | | ||
+ | node[midway, | ||
+ | (eq.west); | ||
+ | |||
+ | | ||
\end{tikzpicture} | \end{tikzpicture} | ||
\end{document} | \end{document} | ||
+ | |||
</ | </ | ||
- | < | ||
- | **Vlastnosti empirické distribuční funkce:** | + | Rozšířený Euklidův algoritmus |
- | </ | + | |
- | * Je to schodovitá funkce, která má skoky velikosti $1/n$ (nebo násobku $1/n$, pokud se některé hodnoty $x_i$ opakují) | + | |
- | * Pro každé pevné $x$ je $F_n(x)$ náhodná veličina. | + | |
- | * $F_n(x)$ je nestranným odhadem teoretické distribuční funkce $F(x)$, tj. $E[F_n(x)] = F(x)$. | + | |
- | * Podle Glivenko-Cantelliho | + | |
- | < | + | |
- | To znamená, že s rostoucím počtem pozorování se empirická distribuční funkce stále více přibližuje skutečné distribuční funkci. | + | |
- | </ | + | ===== 5. Binární relace ===== |
+ | – definice a ilustrace na jednoduchých příkladech. Čtyři základní vlastnosti (reflexivita, | ||
- | ====== | + | ==== Definice |
- | < | + | |
- | Při odhadování neznámých parametrů základního souboru na základě pozorovaných dat z náhodného výběru se snažíme, aby naše odhady měly určité žádoucí vlastnosti. Tyto vlastnosti nám pomáhají posoudit kvalitu odhadu a vybrat ten nejlepší možný. | + | |
- | </ | + | |
- | ===== Značení ===== | + | Nechť $A, B$ jsou množiny. **Binární relace** $R$ z $A$ do $B$ je libovolná podmnožina kartézského součinu: |
- | < | + | $$ |
- | Nejprve si zavedeme značení, které se v teorii odhadu běžně používá: | + | R \subseteq A \times B |
- | </ | + | $$ |
- | * $\vartheta$: | + | |
- | | + | |
- | | + | |
- | | + | |
- | ===== Žádoucí vlastnosti bodových odhadů ===== | + | Jestliže $(a, b) \in R$, zapisujeme $a \mathcal{R} b$ a říkáme, že **prvek $a$ je v relaci s $b$** vzhledem k relaci $\mathcal{R}$. |
- | < | + | Pokud $(a, b) \notin R$, pak $a$ **není v relaci** s $b$. |
- | Bodový odhad je funkce náhodného výběru, jejíž předpis nezávisí na odhadovaném parametru. | + | |
- | 1. **Nestrannost | + | Pokud je relace na jedné množině |
- | </ | + | |
- | * Odhad $\hat{\Theta}_n$ se nazývá nestranný, pokud jeho střední hodnota | + | |
- | < | + | |
- | * Pokud tato podmínka není splněna, odhad je **vychýlený**. | + | |
- | 2. **Asymptotická nestrannost**: | + | ==== Čtyři základní vlastnosti ==== |
- | </ | + | |
- | * Odhad $\hat{\Theta}_n$ je asymptoticky nestranný, pokud se jeho střední hodnota blíží skutečné hodnotě parametru $\vartheta^*$ s rostoucím rozsahem výběru $n$, tj. $\lim_{n\rightarrow\infty} E[\hat{\Theta}_n] | + | |
- | < | + | |
- | 3. **Konzistence**: | + | Relace |
- | </ | + | |
- | * Odhad $\hat{\Theta}_n$ je konzistentní, | + | |
- | * Je asymptoticky nestranný: $\lim_{n\rightarrow\infty} E[\hat{\Theta}_n] = \vartheta^*$ (nebo $E[\hat{\Theta}_n - \vartheta^*] = 0$). | + | |
- | * Jeho rozptyl se blíží k nule: $\lim_{n\rightarrow\infty} D[\hat{\Theta}_n] = 0$ (nebo $\lim_{n\rightarrow\infty} \sigma_{\hat{\Theta}_n} = 0$). | + | |
- | < | + | |
- | 4. | + | |
- | </ | + | * $\mathcal{R}$ je symetrická, |
- | * Efektivní odhad je takový, který | + | * $\mathcal{R}$ je antisymetrická, |
- | * Tato chyba se dá rozložit na $D[\hat{\Theta}_n] + (E[\hat{\Theta}_n] - \vartheta^*)^2$. | + | * $\mathcal{R}$ je tranzitivní, když $\forall a, b, c \in A$ platí $ (a\mathcal{R}b \land b\mathcal{R}c) \implies a\mathcal{R}c$. Pokud $a$ souvisí s $b$ a $b$ s $c$, pak $a$ souvisí s $c$. Např. „je předchůdce“ nebo „má stejné příjmení jako“. |
- | * Pro **nestranný odhad** se střední kvadratická chyba redukuje pouze na rozptyl | + | |
- | < | + | |
- | * **Nejlepší nestranný odhad** | + | |
- | 5. **Robustnost**: | + | ==== Ekvivalence ==== |
- | * Robustní odhad je odolný vůči šumu nebo odlehlým hodnotám v datech. | + | |
- | * Přesné matematické kritérium pro robustnost často chybí, ale jedná se o velmi praktickou vlastnost. | + | |
- | </ | + | |
- | ===== Odhady konkrétních parametrů ===== | + | Relace |
- | * **Odhady střední hodnoty** ($\mu$): | + | |
- | * Výběrový průměr $\overline{X}_n = \frac{1}{n} \sum_{i=1}^{n} X_i$ je nestranným a konzistentním odhadem střední hodnoty $E[X]$. | + | |
- | * **Odhady rozptylu ($\sigma^2$)**: | + | |
- | * Výběrový rozptyl | + | |
- | | + | |
- | * Výběrová směrodatná odchylka $S_n = \sqrt{S^2_n}$ je odhadem směrodatné odchylky $\sigma$. | + | |
- | < | + | |
- | * **Odhady momentů**: | + | |
- | </ | + | |
- | * Pro odhad $k$-tého obecného momentu $E[X^k]$ se používá výběrový $k$-tý obecný moment $m_{X^k} = \frac{1}{n}\sum_{j=1}^{n}x_j^k$. | + | |
+ | Taková relace přirozeně rozdělí množinu $A$ na **třídy ekvivalence** – tedy podmnožiny, | ||
- | ===== Metody odhadování parametrů ===== | + | **Definice třídy ekvivalence**: |
- | < | + | Pro $a \in A$ definujeme: |
- | Existuje několik metod pro konstrukci odhadů. Dvě základní jsou: | + | $$ |
+ | [a]_{\mathcal{R}} | ||
+ | $$ | ||
- | 1. **Metoda momentů (MM)**: | + | Každý prvek $a$ náleží právě jedné třídě, množina |
- | * Princip: Klademe do rovnosti teoretické momenty (které závisí na neznámých parametrech) a jejich výběrové protějšky spočítané z dat. | + | |
- | </ | + | |
- | * Například pro $k$ neznámých parametrů $\theta_1, \ldots, \theta_k$ řešíme soustavu $k$ rovnic $E[X^i] = m_{X^i}$ pro $i=1, \ldots, k$. Alternativně, | + | |
- | < | + | |
- | * Výhody: Často jednoduché získání vzorců. | + | |
- | * Nevýhody: Řešení nemusí vždy existovat. | + | |
- | * Volí se často v případech, kdy je soustava | + | |
- | 2. **Metoda maximální věrohodnosti (MLE - Maximum Likelihood Estimation)**: | + | ==== Částečné uspořádání |
- | * Princip: Hledáme takové hodnoty parametrů, které maximalizují tzv. věrohodnostní funkci. | + | |
- | </ | + | |
- | * Pro náhodný výběr $X_1, \ldots, X_n$ z rozdělení s hustotou $f(x; \theta)$ (spojitý případ) nebo pravděpodobnostní funkcí $P(X=x; \theta)$ (diskrétní případ), je věrohodnostní funkce $L(\theta; x)$ definována jako součin těchto funkcí přes všechna pozorování: | + | |
- | * Spojitý případ: $L(\theta; x) = \prod_{i=1}^{n} f(x_i; \theta)$. | + | |
- | * Diskrétní případ: $L(\theta; x) = \prod_{i=1}^{n} P(X_i=x_i; \theta)$. | + | |
- | < | + | |
- | * Postup: | + | |
- | </ | + | |
- | * Sestrojíme věrohodnostní funkci $L(\theta)$. | + | |
- | * Často je výhodnější pracovat s logaritmem věrohodnostní funkce (log-likelihood) $l(\theta) | + | |
- | * Položíme derivaci $l(\theta)$ podle parametru $\theta$ rovnu nule: $\frac{\partial l(\theta)}{\partial \theta} = 0$. | + | |
- | * Řešením této rovnice (nebo soustavy rovnic, pokud je parametrů více) získáme maximálně věrohodný odhad $\hat{\theta}$. | + | |
- | < | + | |
- | * Myšlenka: Hledáme parametry, které nejlépe " | + | |
- | * Pro základní rozdělení dávají obě metody (MM a MLE) shodné výsledky. | + | |
- | </ | + | |
- | ===== Intervalové odhady (Intervaly spolehlivosti) ===== | + | Relace $\mathcal{R}$ na množině $A$ je **částečné uspořádání**, pokud splňuje: reflexivitu, antisymetrii, tranzitivitu. |
- | < | + | |
- | Na rozdíl od bodového odhadu, který poskytuje jedinou hodnotu parametru, intervalový odhad udává interval, ve kterém se s určitou pravděpodobností (tzv. koeficientem spolehlivosti) nachází skutečná hodnota parametru. | + | |
- | </ | + | Takovou relaci značíme často symbolem |
- | * **Definice**: | + | |
- | * $1 - \alpha$ je **koeficient spolehlivosti** | + | |
- | * $\alpha$ je **hladina významnosti** (pravděpodobnost, že interval nepokryje skutečnou hodnotu parametru). | + | |
- | * Intervaly mohou být **oboustranné**, | + | |
- | * Symetrický oboustranný odhad znamená, že pravděpodobnost překročení horní meze je stejná jako pravděpodobnost podkročení dolní meze (obvykle $\alpha/2$ pro každou stranu). | + | |
- | Konstrukce intervalových odhadů vyžaduje znalost rozdělení pravděpodobnosti odhadu $\hat{\Theta}_n$ nebo nějaké z něj odvozené statistiky. | + | |
- | < | + | |
- | Toto jsou základní obecné vlastnosti a metody odhadování parametrů. Konkrétní vzorce pro odhady a intervaly spolehlivosti se pak liší v závislosti na konkrétním rozdělení dat a odhadovaném parametru. | + | ==== Hasseův diagram |
- | </ | + | |
- | ===== Princip statistického testování hypotéz | + | |
- | **Princip statistického testování hypotéz** – testy střední hodnoty a rozptylu, porovnání dvou rozdělení, | + | |
- | < | + | |
- | **Princip statistického testování hypotéz** je metoda pro ověřování tvrzení (hypotéz) o parametrech nebo rozdělení náhodných veličin na základě dat. Zahrnuje následující kroky: | + | |
- | 1. **Formulace hypotéz**: | + | **Hasseův diagram** je grafické znázornění |
- | - **Nulová hypotéza (H₀)**: Základní tvrzení, které se testuje (např. " | + | |
- | - **Alternativní hypotéza (H₁)**: Tvrzení, které se považuje za alternativu k H₀ (např. " | + | |
- | </ | + | * Vrcholy představují prvky množiny $A$. |
- | * **Volba hladiny významnosti ($\alpha$)**: | + | * Hrana mezi $a$ a $b$ značí relaci $a \mathcal{R} b$, kde $a < b$ a neexistuje $c$, pro které by $a < c < b$. |
- | <markdown> | + | * Prvek $a$ je v diagramu **níž** než $b$, pokud $a \mathcal{R} b$. |
- | - Pravděpodobnost, že zamítneme H₀, i když je pravdivá (často 0.05 nebo 0.01). | + | |
- | 3. **Výběr testové statistiky**: | + | **Další pojmy v uspořádání**: |
- | </ | + | |
- | * Výpočet statistiky, která kvantifikuje rozdíl mezi daty a H₀ (např. t-statistika, | + | |
- | < | + | |
- | 4. **Výpočet kritické hodnoty nebo p-hodnoty**: | + | |
- | - **Kritická hodnota**: Mez, kterou porovnáváme s testovou statistikou. | + | * **Maximum** – prvek, nad kterým už není žádný jiný. |
- | - **p-hodnota**: Pravděpodobnost, že bychom získali pozorované nebo extrémnější výsledky, pokud je H₀ pravdivá. | + | * **Nejmenší prvek** – prvek, ze kterého vede cesta ke všem ostatním (nemusí existovat). |
+ | * **Minimum** – prvek, pod kterým už není žádný jiný. | ||
- | 5. **Rozhodnutí**: | + | **Linearizace částečného uspořádání**: |
- | </ | + | Z Hasseova diagramu vytvoříme posloupnost prvků (např. zleva doprava, po úrovních), |
- | * Pokud p-hodnota < $\alpha$ nebo testová statistika překročí kritickou hodnotu, zamítáme H₀. | + | |
- | < | + | |
- | - Jinak nezamítáme H₀. | + | |
- | </ | + | ===== 6. Indukce ===== |
+ | – je třeba rozumět principu, vnímat různé verze (slabá, silná), umět případně ilustrovat na nějakém jednoduchém důkazu. | ||
- | ====== Testy střední hodnoty a rozptylu ====== | + | ==== Slabý princip matematické indukce |
- | < | + | Nechť $n_0 \in \mathbb{Z}$, ať $V(n)$ |
- | **Testy střední hodnoty**: | + | Předpokládejme, |
- | - **Jednovýběrový t-test**: Ověřuje, zda střední hodnota populace | + | * $V(n_0)$ |
- | - **Dvouvýběrový t-test**: Porovnává střední hodnoty dvou nezávislých skupin. | + | |
- | - **Párový t-test**: Porovnává střední hodnoty dvou závislých skupin | + | |
- | **Testy rozptylu**: | + | Pak $V(n)$ platí pro všechna $n \geq n_0$. |
- | - **F-test**: Porovnává rozptyly dvou populací | + | |
- | </ | + | |
- | * **$\chi^2$-test rozptylu**: Ověřuje, zda rozptyl populace je roven zadané hodnotě. | + | |
- | ====== Porovnání dvou rozdělení ====== | + | ==== Příklad (slabá indukce) |
- | < | + | Dokážeme, že $2^n \ge n+1$ pro každé $n \in \mathbb{N}_0$. |
- | **Porovnání dvou rozdělení**: | + | |
- | - **Kolmogorov-Smirnovův test**: Testuje, zda dvě výběrová rozdělení pocházejí ze stejné populace. | + | |
- | - **Mann-Whitneyho test**: Neparametrický test pro porovnání dvou nezávislých výběrů (bez předpokladu normality). | + | |
- | - **Wilcoxonův test**: Neparametrický test pro porovnání dvou závislých výběrů. | + | |
- | </ | + | |
- | ====== $\chi^2$-test dobré shody ====== | + | * **Základ: |
+ | * **Indukční krok:** Předpokládáme $2^n \ge n+1$. Pak: | ||
+ | $$ | ||
+ | 2^{n+1} = 2 \cdot 2^n \ge 2(n+1) \ge (n+1)+1 | ||
+ | $$ | ||
+ | protože $n+1 \ge 1$ | ||
- | **$\chi^2$-test dobré shody**: | + | ==== Silný princip matematické indukce ==== |
- | < | + | |
- | - Ověřuje, zda pozorovaná data odpovídají očekávanému rozdělení (např. binomické, normální). | + | |
- | - **Výpočet**: | + | |
- | </ | + | |
- | $$\chi^2 | + | |
- | kde $O_i$ jsou pozorované četnosti a $E_i$ očekávané četnosti. | + | |
- | **Předpoklady**: | + | |
- | ====== Test nezávislosti | + | **Vysvětlení: |
+ | Na rozdíl od slabé indukce zde při kroku $n+1$ předpokládáme, | ||
+ | Je to, jako bys stavěl schody a u každého nového stupínku směl využít celou „platformu“ před sebou, nejen poslední schod. | ||
- | < | + | Formálně: |
- | **Test nezávislosti v kontingenční tabulce**: | + | Pokud platí |
- | - Ověřuje, zda dvě kategorické proměnné jsou nezávislé. | + | |
- | - **Výpočet**: | + | |
- | | + | pak $V(n)$ platí pro všechna $n \geq n_0$. |
- | $$\chi^2 = \sum \frac{(O_{ij} - E_{ij})^2}{E_{ij}}$$ | + | |
- | | + | |
- | * **Předpoklady**: | + | |
- | ===== Markovovy | + | ==== Příklad (silná indukce) |
- | **Markovovy řetězce** – základní pojmy a vlastnosti, popis přechodovým diagramem a maticí přechodu. Klasifikace stavů, periodicita, | + | |
- | ==== Základní pojmy a popis ==== | + | Dokážeme, že každé celé číslo $n \ge 2$ lze zapsat jako součin prvočísel. |
- | < | + | |
- | Markovovy řetězce jsou stochastické procesy s konečným nebo spočetným počtem stavů, kde pravděpodobnost přechodu do dalšího stavu závisí pouze na aktuálním stavu (vlastnost Markova). | + | |
- | - **Přechodový diagram**: Graf s uzly (stavy) a hranami (pravděpodobnosti přechodu). | + | |
- | + | ||
- | </ | + | |
- | * **Matice přechodu** $ P(t) $: Matice velikosti | + | |
- | === Klasifikace stavů === | + | * **Základ: |
- | < | + | * **Indukční krok:** Předpokládáme, |
- | | Typ stavu | + | * Uvažujme $n+1$: |
- | |-----------------|--------------------------------------------------------------------------| | + | - Pokud je $n+1$ prvočíslo, |
- | </ | + | - Pokud je složené, existují $a, b$ taková, že $n+1 = a \cdot b$ a $2 \le a,b \le n$. |
- | | **Absorbující** | $p_{jj} = 1$ (po vstupu nelze opustit) | | + | - Podle indukčního předpokladu lze $a$ i $b$ rozložit na součin prvočísel. |
- | < | + | - Součinem těchto rozkladů získáme rozklad i pro $n+1$. |
- | | **Tranzientní** | Existuje nenulová pravděpodobnost, že se nikdy nevrátíme do tohoto stavu | | + | |
- | | **Rekurentní** | + | **Krátký slovní popis: |
- | </ | + | V kroku $n+1$ můžeme předpokládat platnost tvrzení pro **každé** $k$ s $2\le k\le n$. |
- | | **Periodický** | Návrat do stavu je možný pouze v násobcích čísla | + | Je-li $n+1$ složené, rozdělíme ho na dva menší činitele $a,b$ (to lze díky tomu že víme, že čísla která nejsou prvočíslo jsou dělitelná ne jen sama sebou a 1) a pro oba už známe rozklad (protože čísla jsou menší než $n$ a pro ty už jsme si to dokázali) → jejich součinem dostaneme |
- | | **Aperiodický** | + | rozklad i pro $n+1$. |
+ | |||
+ | ===== 7. Rekurentní rovnice ===== | ||
+ | |||
+ | – základní vlastnosti homogenních lineárních rekurentních rovnic (jejich množina řešení tvoří vektorový prostor dimenze rovné řádu rovnice, takže řešení lze generovat pomocí vhodné báze), jak najít vhodnou bázi (pomocí kořenů charakteristického polynomu). | ||
+ | |||
+ | **Definice:** | ||
+ | |||
+ | Rekurentní (nebo také rekurzivní) vztah pro posloupnost $\{a_k\}$ je libovolná rovnice typu: | ||
+ | $$ | ||
+ | F(a_n, a_{n-1}, a_{n-2}, \dots, a_0) = 0 | ||
+ | $$ | ||
+ | kde $F$ je nějaká funkce. | ||
+ | |||
+ | Například problém Hanojských věží lze vyjádřit vztahem: | ||
+ | $$ | ||
+ | H_n = 2 \cdot H_{n-1} + 1 | ||
+ | \quad\text{tedy}\quad | ||
+ | H_n - 2H_{n-1} - 1 = 0 | ||
+ | $$ | ||
+ | |||
+ | ====Lineární rekurentní rovnice==== | ||
+ | |||
+ | Lineární rekurentní rovnice (nebo také lineární rekurzivní rovnice) **řádu $k$** je rovnice tvaru: | ||
+ | $$ | ||
+ | a_{n+k} + c_{k-1}(n)a_{n+k-1} + \dots + c_1(n)a_{n+1} + c_0(n)a_n = b_n | ||
+ | \quad \text{pro všechna } n \geq n_0 | ||
+ | $$ | ||
+ | |||
+ | * $k$ je řád rovnice – největší indexový posun v levé straně. | ||
+ | * Koeficienty $c_i(n)$ jsou funkce $\mathbb{Z} \to \mathbb{R}$ (mohou být konstantní nebo závislé na $n$). | ||
+ | * $b_n$ je tzv. pravá strana rovnice (např. nulová, nebo jiná posloupnost). | ||
+ | |||
+ | Rovnice se nazývá **homogenní**, | ||
+ | |||
+ | * Množina všech řešení homogenní rovnice tvoří **vektorový prostor** dimenze $k$. | ||
+ | * Řešení lze vyjádřit pomocí **báze** tohoto prostoru, kterou určujeme z kořenů tzv. charakteristického polynomu. | ||
+ | |||
+ | ====Řešení==== | ||
+ | |||
+ | Nechť je dána lineární rekurentní rovnice: | ||
+ | $$ | ||
+ | a_{n+k} + c_{k-1}(n)a_{n+k-1} + \dots + c_1(n)a_{n+1} + c_0(n)a_n = b_n | ||
+ | $$ | ||
+ | |||
+ | **Řešením** rozumíme posloupnost $\{a_n\}_{n=n_0}^\infty$, | ||
+ | |||
+ | ====Charakteristická rovnice==== | ||
+ | |||
+ | **Definice: | ||
+ | $$ | ||
+ | a_{n+k} + c_{k-1}a_{n+k-1} + \dots + c_0a_n = b_n | ||
+ | $$ | ||
+ | |||
+ | Pokud je $b_n = 0$ pro všechna $n$, rovnice se nazývá | ||
+ | $$ | ||
+ | p(\lambda) = \lambda^k + c_{k-1}\lambda^{k-1} + \dots + c_1\lambda + c_0 | ||
+ | $$ | ||
+ | |||
+ | Řešením rovnice $p(\lambda) = 0$ (tzv. **charakteristická rovnice**) jsou tzv. **charakteristická čísla** (nebo také **kořeny** či „vlastní čísla“). | ||
+ | |||
+ | * Každé charakteristické číslo $\lambda$ generuje | ||
+ | * Pokud má polynom $p$ více různých kořenů $\lambda_1, | ||
+ | $$ | ||
+ | a_n = \alpha_1\lambda_1^n+\dots+\alpha_m\lambda_m^n | ||
+ | $$ | ||
+ | * je také řešením, takže celý prostor řešení má dimenzi $m$. | ||
+ | * Má-li | ||
+ | |||
+ | Pomocí těchto tvarů sestavíme obecné řešení homogenní rovnice – každý kořen přispívá jedním nebo více lineárně nezávislými členy. | ||
+ | |||
+ | ====Příklad | ||
+ | |||
+ | Homogenní rovnice druhého řádu | ||
+ | $$ | ||
+ | a_{n+2}-3a_{n+1}+2a_n=0 | ||
+ | $$ | ||
+ | má charakteristický polynom $p(\lambda)=\lambda^2-3\lambda+2$ | ||
+ | a kořeny $\lambda_1=1, | ||
+ | |||
+ | | ||
+ | | ||
+ | | ||
+ | |||
+ | ====Příklad 2 – násobný kořen==== | ||
+ | |||
+ | Rovnice | ||
+ | $$ | ||
+ | a_{n+2}-2a_{n+1}+a_n=0 | ||
+ | $$ | ||
+ | má charakteristický polynom $p(\lambda)=(\lambda-1)^2$, | ||
+ | |||
+ | | ||
+ | * Obecné řešení: | ||
+ | * Znovu dostáváme 2-rozměrný prostor řešení, tentokrát s bází $\{\,1,\,n\}$. | ||
- | ==== Rozložitelnost a asymptotika ==== | ||
- | < | ||
- | - **Rozložitelnost (reducibilní řetězec)**: | ||
- | - **Irreducibilní řetězec**: | ||
- | </ | ||
- | * **Asymptotické chování**: | ||
- | ==== Přechodový diagram a matice ==== | ||
- | Příklad diagramu: | ||
- | < | ||
- | \usepackage{tikz} | ||
- | \usetikzlibrary{matrix, | ||
- | \begin{document} | ||
- | \begin{tikzpicture} | ||
- | \node (A) at (0,0) {A}; | ||
- | \node (B) at (2,0) {B}; | ||
- | \node (C) at (4,0) {C}; | ||
- | \draw[->, | ||
- | \draw[->, | ||
- | \draw[->, | ||
- | \draw[->, | ||
- | \draw[->, | ||
- | \draw[->, | ||
- | \end{tikzpicture} | ||
- | \end{document} | ||
- | </ | ||
- | ==== Matice přechodu ==== | ||
- | | | A | B | C | | ||
- | | **A** | 0.0 | 0.5 | 0.3 | | ||
- | | **B** | 0.0 | 1.0 | 0.0 | | ||
- | | **C** | 0.1 | 0.2 | 0.7 | |