====== Statistická analýza, modely a jejich hodnocení. Redukce dimenzionality. Shlukování. ====== [[https://fel.cvut.cz/en/education/bk/predmety/47/02/p4702306.html|BE4M36SAN]] [[https://cw.fel.cvut.cz/wiki/courses/B4M36SAN|Webové stránky předmětu]] * **Vícenásobná lineární regrese** – popis modelu a jeho předpokladů. Zpracování kvalitativních nezávislých proměnných, kolinearita a odlehlé hodnoty. Rozhodování o užitečnosti modelu. Overfitting, výběr příznaků, regularizace modelu. * **Nelineární regrese** – polynomiální regrese, splajny, lokální regrese. * **Diskriminační analýza** – LDA, QDA a logistická regrese. * **Robustní statistika** – robustní odhady polohy a měřítka, M-odhady. Robustní regrese. Neparametrické testy. * **Redukce dimenzionality** – definice úlohy, manifold, vnitřní dimenze. PCA a kernel PCA. Metody nelineární redukce dimenzionality. * **Shlukování** – formalizace úlohy a její složitost. Metody shlukování: k-means, EM GMM shlukování, hierarchické shlukování, shlukování založené na hustotě. Spektrální shlukování.