Statistická analýza, modely a jejich hodnocení. Redukce dimenzionality. Shlukování.
BE4M36SAN Webové stránky předmětu
- Vícenásobná lineární regrese – popis modelu a jeho předpokladů. Zpracování kvalitativních nezávislých proměnných, kolinearita a odlehlé hodnoty. Rozhodování o užitečnosti modelu. Overfitting, výběr příznaků, regularizace modelu.
- Nelineární regrese – polynomiální regrese, splajny, lokální regrese.
- Diskriminační analýza – LDA, QDA a logistická regrese.
- Robustní statistika – robustní odhady polohy a měřítka, M-odhady. Robustní regrese. Neparametrické testy.
- Redukce dimenzionality – definice úlohy, manifold, vnitřní dimenze. PCA a kernel PCA. Metody nelineární redukce dimenzionality.
- Shlukování – formalizace úlohy a její složitost. Metody shlukování: k-means, EM GMM shlukování, hierarchické shlukování, shlukování založené na hustotě. Spektrální shlukování.