Table of Contents
Regulární jazyky a bezkontextové jazyky. Popis těchto jazyků pomocí automatů a gramatik, vlastnosti regulárních a bezkontextových jazyků
- Deterministické a nedeterministické konečné automaty a jejich vztah.
- Regulární jazyky a jejich vlastnosti. Lemma o vkládání (Pumping lemma) a Nerodova věta.
- Regulární výrazy a jejich vztah k regulárním jazykům.
- Bezkontextové gramatiky. Chomského hierarchie jazyků. Bezkontextové jazyky a jejich vlastnosti. Lemma o vkládání pro bezkontextové jazyky (Pumping lemma pro bezkontextové jazyky).
- Zásobníkové automaty (nedeterministické i deterministické ) a jejich vztah k bezkontextovým jazykům.
Deterministické a nedeterministické konečné automaty
Deterministický konečný automat (DFA) má přechodovou funkci, která z daného stavu a vstupního symbolu určuje právě jeden další stav. Má jeden počáteční stav a množinu koncových stavů. Nedeterministický konečný automat (NFA) umožňuje více možných přechodů ze stavu pro stejný vstupní symbol nebo přechody bez vstupu (ε-přechody).
Vizualizace
Deterministický automat (DFA)
Vlastnosti: Každý vstupní symbol má přesně jeden přechod (např. a
přechází z $q_0$ do $q_1$, b
zůstává v $q_0$).
Nedeterministický automat (NFA)
Vlastnosti: Některé přechody jsou vícevýběrové (např. $q_0$ na vstup 0
může jít do $q_1$ nebo $q_2$).
Epsilon-NFA (s ε-přechody)
Vlastnosti: Přechody bez vstupu (např. $q_0$ → $q_1$ přes $\varepsilon$), které umožňují “volné” přechody.
Vztah mezi DFA a NFA:
- Ekvivalencí schopností: Každý NFA lze konstruktivně převést na ekvivalentní DFA (pomocí podmnožinové konstrukce).
- Podmnožinová konstrukce: Stavy nového DFA reprezentují množiny stavů původního NFA. Přechody v DFA simuluji všechny možné přechody NFA.
- Regulární jazyky: Obě modely přijímají právě třídu regulárních jazyků. Nedeterminismus nepřidává výpočetní sílu, pouze usnadňuje popis některých automatů.
Příklad: NFA hledající podslovo “011” může mít v přechodu mezi stavy více možností, ale existuje ekvivalentní DFA s přesnými přechody.
Regulární jazyky
Regulární jazyky a jejich vlastnosti. Lemma o vkládání (Pumping lemma) a Nerodova věta.
Definice:
Regulární jazyk je jazyk, který lze přijmout deterministickým (alebo nedeterministickým) konečným automatem (DFA/NFA). Třída všech regulárních jazyků značíme Reg.
Vlastnosti:
1. Uzávěrnost:
- Uzavřena na sjednocení, průnik, doplněk, rozdíl, zřetězení a Kleeneho operátor (★).
- Například, pro regulární jazyky $L_1, L_2$ je $L_1 \cup L_2$, $L_1 \cap L_2$, $L_1^{\text{C}}$ i $L_1 \circ L_2$ regulární .
- Regulární výrazy:
- Každý regulární jazyk lze popsat regulárním výrazem, který obsahuje operace sjednocení (+), součin (kontatenace), a Kleeneho zhvězdu (★).
Lemma o vkládání (Pumping lemma):
Pro každý regulární jazyk $L$ existuje číslo $n$, takže pro každé slovo $u \in L$ s $|u| > n$ lze rozdělit na $u = xwy$, kde:
- $|xw| \leq n$,
- $w \neq \varepsilon$,
- $xw^i y \in L$ pro všechna $i \geq 0$.
Lemma slouží k dokazování, že určité jazyky nejsou regulární (např. $\{a^nb^n \mid n \geq 0\}$).
Nerodova věta tvrdí, že jazyk $L$ nad abecedou $\Sigma$ je regulární právě tehdy, když existuje ekvivalence $R$ na $\Sigma^*$ splňující:
1. $L$ je sjednocení některých tříd ekvivalence $R$.
2. Pro $uRv$ a libovolné $w \in \Sigma^*$ platí $uwRvw$.
3. $R$ má konečně mnoho tříd ekvivalence .
Regulární výrazy
Formální popis regulárních výrazů a jejich ekvivalence s regulárními jazyky přijímanými konečnými automaty.
Regulární výrazy jsou formální zápis popisující regulární jazyky. Skládají se z operací: - Sjednocení (R|S) - Zřetězení (R·S) - Kleeneho hvězda (R*)
Každý regulární výraz lze převést na ekvivalentní ε-NFA (nedeterministický konečný automat s ε-přechody). Základní konstrukce [1]: 1. Elementární výraz a
(pro a ∈ Σ
):
- Sjednocení
R|S
:- Kombinace ε-přechody z nového počátečního stavu do počátků R a S.
- Zřetězení
R·S
:- Přidání ε-přechodů z koncových stavů R do počátečního stavu S.
- Kleeneho hvězda
R*
:- Přidání ε-přechodů: z nového počátečního stavu do R, z koncových stavů R zpět do jeho počátku.
Příklad převodu (0|ε)1*
na ε-NFA [1]:
Vysvětlení:
- Stav q0
rozděluje výpočet na větev pro 0
(přes q1
) a větev pro 1*
(přes q2
, q3
).
- Cyklus v q3
umožňuje opakované čtení 1
, ε-přechody spojují komponenty bez spotřeby vstupu [1].
Regulární jazyky jsou právě ty jazyky, které lze popsat regulárním výrazem nebo přijímat konečným automatem (DFA/NFA/ε-NFA) [1].
Bezkontextové gramatiky
Formální systém pro generování jazyků pomocí pravidel přepisování proměnných, schopný popsat mnoho přirozených i programovacích jazyků.
Chomského hierarchie jazyků
Hierarchie klasifikuje formální jazyky podle výpočetní složitosti jejich gramatik: 1. Typ 0 (Rekurzivně spočetné jazyky): Neomezené gramatiky (Turingovy stroje) 2. Typ 1 (Kontextové jazyky): Kontextové gramatiky (lineárně omezené automaty) 3. Typ 2 (Bezkontextové jazyky): Bezkontextové gramatiky (zásobníkové automaty) 4. Typ 3 (Regulární jazyky): Regulární gramatiky (konečné automaty)
Bezkontextové gramatiky
Definovány čtveřicí $G = (V, \Sigma, P, S)$: - $V$: Konečná množina neterminálů (proměnné) - $\Sigma$: Konečná množina terminálů (abeceda) - $P$: Množina pravidel tvaru $A \to \alpha$ ($A \in V$, $\alpha \in (V \cup \Sigma)^*$) - $S \in V$: Počáteční symbol
Příklad gramatiky pro jazyk $L = \{a^nb^n \mid n \geq 0\}$:
$G = (\{S\}, \{a,b\}, P, S)$ s pravidly:
1. $S \to aSb$
2. $S \to \varepsilon$
Vlastnosti bezkontextových jazyků
- Uzávěrové vlastnosti:
- Uzavřené na: Sjednocení, zřetězení, iteraci, homomorfismus
- Neuzavřené na: Průnik, doplněk
- Rozhodnutelné problémy:
- Prázdnost jazyka ($L(G) \overset{?}{=} \emptyset$)
- Náležitost slova ($w \overset{?}{\in} L(G)$ – CYK algoritmem)
- Paměťový mechanismus: Zásobníkové automaty
Lemma o vkládání (Pumping Lemma)
Formulace: Pro každý bezkontextový jazyk $L$ existuje konstanta $p$ tak, že každé slovo $z \in L$ délky $|z| \geq p$ lze zapsat jako $z = uvwxy$ splňující:
1. $|vwx| \leq p$
2. $|vx| \geq 1$
3. $\forall i \geq 0: uv^iwx^iy \in L$
Aplikace: Důkaz, že jazyk není bezkontextový.
Příklad: Jazyk $L = \{a^nb^nc^n \mid n \geq 0\}$ není bezkontextový:
- Zvolíme $z = a^pb^pc^p$
- Pro libovolné rozdělení $z = uvwxy$:
- Pokud $vwx$ obsahuje dva druhy symbolů, pumpováním porušíme pořadí
- Pokud obsahuje jeden symbol, pumpováním změníme počet jen u jednoho písmena
Zásobníkové automaty
Zásobníkové automaty (nedeterministické i deterministické) a jejich vztah k bezkontextovým jazykům.
Definice
Zásobníkový automat (PDA) je sedmice $A = (Q, \Sigma, \Gamma, \delta, q_0, Z_0, F)$, kde: - $Q$: konečná množina stavů. - $\Sigma$: vstupní abeceda. - $\Gamma$: zásobníkové symboly. - $\delta$: přechodová funkce $\delta: Q \times (\Sigma \cup \{\varepsilon\}) \times \Gamma \to \mathcal{P}(Q \times \Gamma^*)$. - $q_0$: počáteční stav. - $Z_0$: počáteční zásobníkový symbol. - $F \subseteq Q$: koncové stavy.
Typy zásobníkových automatů
Nedeterministický PDA (NPDA):
- Přechody mohou být více možností.
- Přijímá jazyk $L(A) = \{ w \mid (q_0, w, Z_0) \vdash_A^* (p, \varepsilon, \gamma), p \in F \}$.
- Příklad: Jazyk $L = \{ a^n b^n \mid n \geq 0 \}$.
- Na $a$ zásobník naplní symboly $A$.
- Na $b$ zásobník vyprázdní $A$.
Deterministický PDA (DPDA):
- Pro každý stav $q$, symbol $a \in \Sigma \cup \{\varepsilon\}$ a vrchol $X \in \Gamma$ je $|\delta(q,a,X)| \leq 1$.
- Pokud $\delta(q,\varepsilon,X) \neq \emptyset$, pak $\delta(q,a,X) = \emptyset$ pro všechna $a \in \Sigma$.
- Příklad: Jazyk $L = \{ a^n b^n c^n \mid n \geq 0 \}$ nelze přijmout deterministicky, ale např. jazyk $L = \{ a^n b^n \mid n \geq 0 \}$ s přísnými přechody:
- Determinismus vyžaduje, aby přechody na $a$ a $b$ byly navzájem vyloučené.
Vztah k bezkontextovým jazykům
- Věta 0.4.9: Každá bezkontextová gramatika $G$ lze převést na NPDA $A$, takže $L(G) = N(A)$.
- Podstatné rozdíly:
- NPDA přijímají všechny bezkontextové jazyky.
- DPDA přijímají podmnožinu (deterministické jazyky). Například jazyk $\{ a^n b^n c^n \}$ není deterministický.
Bezprefixové jazyky
- Jazyk přijatý DPDA prázdným zásobníkem je bezprefixový (neobsahuje slovo jako prefix jiného slova).
- Pro každý DPDA $A$ existuje DPDA $B$, který přijímá $N(A) = L(B)$ koncovým stavem [1].