The wiki page is under active construction, expect bugs.

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
statnice:bakalar:b0b01pst [2025/06/08 17:20] – [Test nezávislosti v kontingenční tabulce] zapleka3statnice:bakalar:b0b01pst [2025/06/09 23:58] (current) – [Základní typy rozdělení] mistrjirka
Line 1: Line 1:
-==== Způsoby popisu rozdělení náhodných veličin a vektorů. Odhady parametrů rozdělení. Základní statistické testy. Markovské řetězce a jejich asymptotické vlastnosti. ====+====== Způsoby popisu rozdělení náhodných veličin a vektorů. Odhady parametrů rozdělení. Základní statistické testy. Markovské řetězce a jejich asymptotické vlastnosti. ======
  
 [[https://fel.cvut.cz/cz/education/bk/predmety/46/81/p4681506.html|B0B01PST]] [[https://cmp.felk.cvut.cz/~navara/stat/index.htm|Webové stránky předmětu]] [[https://math.fel.cvut.cz/en/people/heliskat/01pst2.html|Helisova stránky předmětu]] [[https://fel.cvut.cz/cz/education/bk/predmety/46/81/p4681506.html|B0B01PST]] [[https://cmp.felk.cvut.cz/~navara/stat/index.htm|Webové stránky předmětu]] [[https://math.fel.cvut.cz/en/people/heliskat/01pst2.html|Helisova stránky předmětu]]
Line 196: Line 196:
 {{:statnice:bakalar:pasted:20250526-103420.png}} {{:statnice:bakalar:pasted:20250526-103420.png}}
  
- 
-=== Smíšená náhodná veličina === 
-Nabývá jak diskrétních, tak spojitých hodnot. Distribuční funkce je kombinací schodové a spojité části. Hustota pravděpodobnosti je definována jako: 
-$$ 
-f(t) = \sum_{i} p_i \delta(t - t_i) + f_c(t),$$ 
-kde $p_i$ jsou pravděpodobnosti diskrétních hodnot $t_i$ a $f_c(t)$ je hustota spojité části. 
  
 === Smíšená náhodná veličina === === Smíšená náhodná veličina ===
Line 284: Line 278:
 ==== Základní typy rozdělení ==== ==== Základní typy rozdělení ====
 === Diskrétní rozdělení === === Diskrétní rozdělení ===
-**Binomické rozdělení** – popisuje počet úspěchů v $n$ nezávislých Bernoulliho pokusech, kde každý pokus má pravděpodobnost úspěchu $p$. Distribuční funkce je dána jako:+**Binomické rozdělení** – popisuje počet úspěchů v $n$ nezávislých Bernoulliho pokusech, kde každý pokus má pravděpodobnost úspěchu $p$. Distribuční funkce je dána jako: 
 $$ $$
 P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k = 0, 1, \ldots, n$$ P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k = 0, 1, \ldots, n$$
-**Poissonovo rozdělení** – popisuje počet událostí, které nastanou v pevném časovém intervalu, pokud jsou tyto události nezávislé a nastávají s konstantní průměrnou rychlostí $\lambda$. Distribuční funkce je dána jako:+Střední hodnota $EX = np$, rozptyl $varX = np(1-p)$.  
 + 
 +**Poissonovo rozdělení** – popisuje počet událostí v pevném intervalu při konstantní intenzitě $\lambda$. Distribuční funkce je: 
 $$ $$
 P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots$$ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots$$
-**Geometrické rozdělení** – popisuje počet pokusů potřebných k dosažení prvního úspěchu v sérii nezávislých Bernoulliho pokusů. Distribuční funkce je dána jako:+Střední hodnota i rozptyl $EX = varX = \lambda$. 
 + 
 +**Geometrické rozdělení** – popisuje **počet neúspěchů před prvním úspěchem** v sérii nezávislých Bernoulliho pokusů s pravděpodobností úspěchu $p$. Distribuční funkce je:
 $$ $$
-P(X = k) = (1 - p)^{k - 1p, \quad k = 1, 2, \ldots$$ +P(X = k) = p(1 - p)^{k}, \quad k = 0, 1, 2, \ldots$$ 
-**Alternativní rozdělení** – popisuje počet pokusů potřebných k dosažení prvního úspěchu v sérii nezávislých Bernoulliho pokusů, ale různými pravděpodobnostmi úspěchu v jednotlivých pokusechDistribuční funkce je dána jako+Střední hodnota $EX = \frac{1-p}{p}$, rozptyl $varX = \frac{1-p}{p^2}$. 
-$$ +*(Pozn.: V některých definicích se udává počet pokusů do prvního úspěchu $(k=1,2,\ldots)$, materiály však explicitně uvádějí $k=0$).* 
-P(X = k) = \prod_{i=1}^{k-1} (1 - p_i) p_k\quad k = 1, 2, \ldots$$ + 
-**Rovnoměrné rozdělení** – popisuje náhodnou veličinu, která může nabývat hodnot v intervalu $[a, b]$ s rovnoměrnou pravděpodobností. Distribuční funkce je dána jako:+**Alternativní (Bernoulliho) rozdělení** - popisuje **jediný pokus** s pravděpodobností úspěchu $p$Nabývá hodnot
 +  $X=1$ (úspěch) s $P(X=1)=p$ 
 +  * $X=0$ (neúspěch) s $P(X=0)=1-p$ 
 +  * Střední hodnota $EX=p$rozptyl $varX=p(1-p)$.  
 +  * (Pozn.: Popis "počet pokusů do prvního úspěchu s různými $p_i$" neodpovídá Alt(p) v materiálech).* 
 + 
 +**Rovnoměrné rozdělení** – popisuje náhodnou veličinu nabývající hodnot $a, a+1, \ldots, b$ s rovnoměrnou pravděpodobností:
 $$ $$
 P(X = k) = \frac{1}{b - a + 1}, \quad k = a, a + 1, \ldots, b$$ P(X = k) = \frac{1}{b - a + 1}, \quad k = a, a + 1, \ldots, b$$
-**Hypergeometrické rozdělení** – popisuje počet úspěchů v náhodném výběru $n$ položek z populace o velikosti $N$, která obsahuje $K$ úspěšných položek. Distribuční funkce je dána jako+ 
-$$ +**Hypergeometrické rozdělení**  
-P(X = k) = \frac{\binom{K}{k} \binom{N - K}{n - k}}{\binom{N}{n}}, \quad k = 0, 1, \ldots, \min(K, n)$$ +  * popisuje počet úspěchů při $n$ náhodných výběrech bez vracení z populace $N$ $K$ úspěšnými položkami:  
-Napřiklad "M" losů z nichž "J" vyhrává, tak udává počet výherních losů, z výtažených "S" losů. +$$ P(X = k) = \frac{\binom{K}{k} \binom{N - K}{n - k}}{\binom{N}{n}}, \quad k = \max(0, n - (N - K)), \ldots, \min(K, n)$$ 
-$+Střední hodnota $E(X) = \frac{K}{N}$.
-E(x) = \frac{(J \cdot S)}{M} +
-$$+
  
 === Spojitá rozdělení === === Spojitá rozdělení ===
-**Rovnoměrné rozdělení** – popisuje náhodnou veličinu, která může nabývat hodnot v intervalu $[a, b]$ s rovnoměrnou pravděpodobností. Distribuční funkce je dána jako:+**Rovnoměrné rozdělení** – popisuje náhodnou veličinu na intervalu $[a, b]$ s konstantní hustotou: 
 +$$ 
 +f(x) = \begin{cases} 
 +\frac{1}{b - a}, & a < x < b \\ 
 +0, & \text{jinak} 
 +\end{cases}$$ 
 +Distribuční funkce:
 $$ $$
 F(x) = \begin{cases} F(x) = \begin{cases}
Line 316: Line 324:
 \end{cases} \end{cases}
 $$ $$
-Hustota je tvaru +$E[X] = \frac{b-a}{2}$ 
-$+$\text{Var}(X) = \frac{(b-a)^2}{12}$ 
-f(x) = \begin{cases+**Normální rozdělení** – symetrické rozdělení se střední hodnotou $\mu$ a rozptylem $\sigma^2$.  Hustota:
-\frac{1}{b - a}, & a < x < b \\ +
-0, & \text{jinak+
-\end{cases}+
 $$ $$
 +f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}$$
 +Distribuční funkce $\Phi(x)$ nemá uzavřený tvar. Speciální případ: **N(0,1)** s hustotou $f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}$. 
  
-**Normální rozdělení** – popisuje náhodnou veličinu, která má symetrické rozdělení kolem střední hodnoty $\mu$ a standardní odchylky $\sigma$. Distribuční funkce je dána jako:+**Exponenciální rozdělení** – popisuje **dobu mezi událostmi v Poissonově procesu** s intenzitou $\lambda$
 +Hustota:
 $$ $$
-\Phi(x) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{x} e^{-\frac{t^2}{2}}\,dt. +f(x) = \lambda e^{-\lambda x}\quad x \geq 0$$ 
-$$ +Distribuční funkce:
- +
-Hustota je tvaru +
-$$ +
-f(x) = \frac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}} +
-$$ +
-**Exponenciální rozdělení** – popisuje čas mezi událostmi v Poissonově procesu. Distribuční funkce je dána jako:+
 $$ $$
 F(x) = 1 - e^{-\lambda x}, \quad x \geq 0$$ F(x) = 1 - e^{-\lambda x}, \quad x \geq 0$$
-Hustota pravděpodobnosti je dána jako: 
-$$ 
-f(x) = \lambda e^{-\lambda x}, \quad x \geq 0$$ 
- 
 ===== 2. Náhodné vektory a jejich popis ===== ===== 2. Náhodné vektory a jejich popis =====
 **Náhodné vektory a jejich popis** – nezávislost náhodných veličin, kovariance a korelace. **Náhodné vektory a jejich popis** – nezávislost náhodných veličin, kovariance a korelace.
Line 704: Line 702:
  
  
-==== Odhady konkrétních parametrů ==== 
-  * **Odhady střední hodnoty** ($\mu$): 
-    * Výběrový průměr $\overline{X}_n = \frac{1}{n} \sum_{i=1}^{n} X_i$ je nestranným a konzistentním odhadem střední hodnoty $E[X]$.  
-  * **Odhady rozptylu ($\sigma^2$)**: 
-    * Výběrový rozptyl $S^2_n = \frac{1}{n-1} \sum_{i=1}^{n}(X_i - \overline{X}_n)^2$ je nestranným a konzistentním odhadem rozptylu $D[X]$.  
-  * **Odhady směrodatné odchylky ($\sigma$)**: 
-    * Výběrová směrodatná odchylka $S_n = \sqrt{S^2_n}$ je odhadem směrodatné odchylky $\sigma$.  
-<markdown> 
-* **Odhady momentů**: 
-</markdown> 
-    * Pro odhad $k$-tého obecného momentu $E[X^k]$ se používá výběrový $k$-tý obecný moment $m_{X^k} = \frac{1}{n}\sum_{j=1}^{n}x_j^k$.  
  
 ==== Odhady konkrétních parametrů ==== ==== Odhady konkrétních parametrů ====
Line 908: Line 895:
  
 ==== Test nezávislosti v kontingenční tabulce ==== ==== Test nezávislosti v kontingenční tabulce ====
- 
-<markdown> 
-**Test nezávislosti v kontingenční tabulce**: 
-- Ověřuje, zda dvě kategorické proměnné jsou nezávislé. 
-- **Výpočet**: 
-  </markdown> 
-$$\chi^2 = \sum \frac{(O_{ij} - E_{ij})^2}{E_{ij}}$$ 
-kde $O_{ij}$ jsou pozorované četnosti a $E_{ij}$ očekávané četnosti (vypočtené jako $E_{ij} = \frac{r_i \cdot c_j}{n}$). 
-  * **Předpoklady**: Větší očekávané četnosti (obvykle $\geq$ 5). 
- 
- 
 **Test nezávislosti**: **Test nezávislosti**:
   * Používá se u dvou kategoriálních proměnných – např. pohlaví a preference typu produktu.   * Používá se u dvou kategoriálních proměnných – např. pohlaví a preference typu produktu.
Line 939: Line 915:
  
 ===== 7. Markovovy řetězce ===== ===== 7. Markovovy řetězce =====
-**Markovovy řetězce** – základní pojmy a vlastnostipopis echodovým diagramem a maticí přechoduKlasifikace stavů, periodicita, rozložitelnost. Asymptotické chování Markovových řetězců.  +**Markovovy řetězce** – modely náhodného vývoje systému v diskrétním časekde echod do dalšího stavu závisí pouze na aktuálním stavu (tzv*Markova vlastnost*).  
  
 ==== Základní pojmy a popis ==== ==== Základní pojmy a popis ====
-<markdown> 
-Markovovy řetězce jsou stochastické procesy s konečným nebo spočetným počtem stavů, kde pravděpodobnost přechodu do dalšího stavu závisí pouze na aktuálním stavu (vlastnost Markova).   
-- **Přechodový diagram**: Graf s uzly (stavy) a hranami (pravděpodobnosti přechodu).  
-  
-</markdown> 
-  * **Matice přechodu** $ P(t) $: Matice velikosti $ n \times n $, kde $ p_{ij}(t) $ je pravděpodobnost přechodu ze stavu $ i $ do stavu $ j $ v čase $ t $.   
  
-=== Klasifikace stavů === +**Markovův řetězec** je posloupnost náhodných veličin $X_0, X_1, X_2, \ldots$, kde pro každý $n$ a všechny stavy $i_0, \dots, i_{n+1}$ platí: 
-<markdown> +$$ 
-| Typ stavu       | Definice                                                                 | +P(X_{n+1} = i_{n+1} \mid X_n = i_n, X_{n-1} = i_{n-1}, \ldots, X_0 = i_0) = P(X_{n+1} = i_{n+1} \mid X_n = i_n) 
-|-----------------|--------------------------------------------------------------------------| +$
-</markdown> +Tato rovnost říká, že vývoj závisí pouze na aktuálním stavu.
-**Absorbující** $p_{jj} = 1(po vstupu nelze opustit)                                | +
-<markdown> +
-| **Tranzientní**   | Existuje nenulová pravděpodobnost, že se nikdy nevrátíme do tohoto stavu | +
-| **Rekurentní**    | Stav je navštíven nekonečně často s pravděpodobností                   | +
-</markdown> +
-| **Periodický**   | Návrat do stavu je možný pouze v násobcích čísla $d_j$ (perioda    | +
-| **Aperiodický**  | Perioda $d_j = 1$                                                     |+
  
-==== Rozložitelnost a asymptotika ==== +Pokud jsou pravděpodobnosti přechodu nezávislé na čase (tj. homogenní), pak označujeme: 
-<markdown> +$$ 
-**Rozložitelnost (reducibilní řetězec)**: Pokud neexistuje cesta mezi některými stavy  +p_{ij} P(X_{n+1} j \mid X_n i) 
-- **Irreducibilní řetězec**Všechny stavy jsou vzájemně dosažitelné.   +$$ 
-</markdown> +a tyto pravděpodobnosti uspořádáme do **matice přechodu** $P = (p_{ij})$
-  * **Asymptotické chování**: Pro irreducibilní, aperiodické a pozitivně rekurentní řetězce konverguje distribuce k **stacionárnímu rozdělení** $\pi$, které splňuje $\pi = \pi P$.  + 
 +Součet pravděpodobností v každém řádku je roven 1: 
 +$$ 
 +\sum_{j} p_{ij} = 1 \quad \text{pro každé } i 
 +$$ 
 +$n$-tá mocnina matice $P^n$ udává pravděpodobnosti přechodu za $nkroků. Prvek $p_{ij}^{(n)}$ je pravděpodobnostže se systém dostane ze stavu $i$ do stavu $j$ za právě $nkroků.
  
 ==== Přechodový diagram a matice ==== ==== Přechodový diagram a matice ====
-íklad diagramu:+ 
 +**echodový diagram** je grafická reprezentace Markovova řetězce. Umožňuje vizuálně sledovat, jak se systém může pohybovat mezi jednotlivými stavy a s jakou pravděpodobností. 
 +  * **Uzly** představují možné **stavy systému** (např. A, B, C). 
 +  * **Orientované hrany** značí **možné přechody** mezi stavy. 
 +  * **Čísla na hranách** udávají **pravděpodobnosti přechodu** z jednoho stavu do druhého. 
 + 
 +Diagram se tedy chová jako mapa dynamiky systému — zobrazuje nejen směr možného vývoje, ale i jeho pravděpodobnost. 
 <tikzjax> <tikzjax>
 \usepackage{tikz} \usepackage{tikz}
Line 981: Line 956:
  
   \draw[->, >=latex] (A) to[bend left] node[above] {0.5} (B);   \draw[->, >=latex] (A) to[bend left] node[above] {0.5} (B);
-  \draw[->, >=latex] (A) to[bend left] node[below] {0.3} (C);+  \draw[->, >=latex] (A) to[bend left] node[below] {0.5} (C);
   \draw[->, >=latex] (B) to[loop above] node {1.0} (B);   \draw[->, >=latex] (B) to[loop above] node {1.0} (B);
   \draw[->, >=latex] (C) to[bend left] node[above] {0.1} (A);   \draw[->, >=latex] (C) to[bend left] node[above] {0.1} (A);
Line 990: Line 965:
 </tikzjax> </tikzjax>
  
-==== Matice přechodu ====+**Matice přechodu**: Tento diagram můžeme přepsat do **matice přechodu** $P$, kde řádky odpovídají výchozím stavům a sloupce cílovým stavům. Hodnota na pozici $p_{ij}$ je pravděpodobnost přechodu ze stavu $i$ do stavu $j$. 
 |       | A     | B     | C     | |       | A     | B     | C     |
-| **A** | 0.0   | 0.5   | 0.  |+|-------|-------|-------|-------| 
 +| **A** | 0.0   | 0.5   | 0.  |
 | **B** | 0.0   | 1.0   | 0.0   | | **B** | 0.0   | 1.0   | 0.0   |
 | **C** | 0.1   | 0.2   | 0.7   | | **C** | 0.1   | 0.2   | 0.7   |
 +
 +**Jak číst tuto matici:**
 +  * První řádek: Pokud jsme ve stavu **A**, máme 0% šanci zůstat v A, 50% šanci jít do B a 50% do C.
 +  * Druhý řádek: Ze stavu **B** se nikam jinam nedostaneme, zůstáváme v B (s pravděpodobností 1).
 +  * Třetí řádek: Ze stavu **C** máme 10% šanci jít do A, 20% do B a 70% zůstat v C.
 +
 +
 +==== Rozložitelnost a komponenty ====
 +
 +  * **Rozložitelný řetězec** (reducibilní): Ne všechny stavy jsou vzájemně dosažitelné. Existují skupiny stavů, mezi kterými není přechod.
 +  * **Nerozložitelný řetězec** (irreducibilní): Každý stav je dosažitelný z každého jiného – tvoří jednu komunikující třídu.
 + 
 +  * **Uzavřená množina stavů**: Jakmile se do této množiny dostaneme, nemůžeme ji opustit.
 +  * **Komponenta**: Největší možná uzavřená množina, která neobsahuje menší uzavřenou podmnožinu.
 +
 +==== Asymptotické chování a stacionární rozdělení ====
 +
 +Pro ireducibilní, aperiodický a pozitivně rekurentní řetězec existuje **stacionární rozdělení** $\pi = (\pi_1, \ldots, \pi_n)$, které splňuje:
 +$$
 +\pi = \pi P \quad \text{a} \quad \sum_{i=1}^{n} \pi_i = 1
 +$$
 +  * Toto rozdělení reprezentuje **dlouhodobé pravděpodobnosti** – tj. jaký podíl času systém stráví ve stavech v limitě $t \to \infty$.
 +  * Lze ho nalézt jako **vlastní vektor** matice $P$ k vlastnímu číslu 1.
 +
 +==== Konvergence a rozklad matice ====
 +Pro markovský řetězec s trvalými a přechodnými stavy lze matici přechodu přepsat jako blokovou matici:
 +$$
 +P = \begin{bmatrix}
 +D & 0 \\
 +R & Q
 +\end{bmatrix}
 +$$
 +  * $D$: přechody mezi trvalými stavy
 +  * $Q$: přechody mezi přechodnými stavy
 +  * $R$: přechody z přechodných do trvalých
 +
 +Matice **fundamentální** $F = (I - Q)^{-1}$ a **absorpční pravděpodobnosti**:
 +$$
 +M = F \cdot R = (I - Q)^{-1} R
 +$$
 +vyjadřují pravděpodobnosti, že systém skončí v některém z trvalých stavů.
 +
 +==== Asymptotické chování stavů ====
 +  * **Přechodný stav**: $\lim_{n \to \infty} p_{ii}^{(n)} = 0$
 +  * **Trvalý nulový stav**: $\lim_{n \to \infty} p_{ii}^{(n)} = 0$
 +  * **Trvalý nenulový, aperiodický**: $\lim_{n \to \infty} p_{ii}^{(n)} = \pi_i$
 +  * **Periodický stav**: Limitní pravděpodobnosti oscilují v závislosti na periodě.
 +
 +
Navigation

Playground

QR Code
QR Code statnice:bakalar:b0b01pst (generated for current page)