Vzhledem k tomu, že data nemají vlastní prostorovou složku, musí vizualizace tyto abstraktní hodnoty uměle mapovat na geometrické vlastnosti. Nejpřesnějším vizuálním kanálem je kódování na pozici.

Bodový graf (Scatterplot):
- Kdy použít: Pokud chceme zkoumat vztah mezi přesně dvěma spojitými atributy.
- Proč: Využívá pozici na společné 2D škále (ortogonální osy X a Y), což je nejpřesnější vizuální kanál. Okamžitě odhalí trendy, korelace a odlehlé hodnoty (outliers).
Matice bodových grafů (Scatterplot Matrix - SPLOM):
- Kdy použít: Pro porovnávání vztahů mezi více spojitými atributy najednou (faceting).
- Proč: Řeší omezení 2D prostoru zobrazením všech možných párů atributů vedle sebe. Pro efektivní analýzu je nutné využít interakci Brushing and Linking (výběr v jednom grafu se okamžitě zvýrazní ve všech ostatních), čímž lze sledovat složitější vícerozměrné vztahy.
Paralelní souřadnice (Parallel Coordinates):
- Kdy použít: Pro vysoký počet atributů (dimenzí), které by již ve SPLOMu byly nepřehledné.
- Proč: Místo kolmých os staví všechny osy rovnoběžně vedle sebe. Bod v $n$-dimenzionálním prostoru je zde zobrazen jako lomená čára protínající jednotlivé osy. Skvěle zobrazuje korelace (čáry se nekříží = pozitivní korelace, kříží se do tvaru X = negativní) a shluky, i když k plnému využití je nutná interaktivní permutace (přeskládání) os.

Při velkém počtu atributů lze využít i kódování pomocí tvaru, tedy tzv. glyfy. Ty fungují dobře, pokud počet položek není příliš velký (jinak dochází k překrývání / overplottingu).

Obecné glyfy (Glyphs):
- Kdy použít: Když chceme najít podobnosti a rozdíly ve vizuálních rysech, abychom mohli položky seskupovat podle jejich celkového “profilu”.
- Proč: Mapují datové atributy na vizuální parametry geometrického symbolu (velikost částí, délku čar, úhly). Zásadní je sémanticky správné mapování (např. invertovat osy u negativních jevů, aby vizuálně “větší plocha” vždy znamenala celkově “lepší” stav).
Hvězdicové glyfy (Star Glyphs):
- Kdy použít: Pro vizualizaci “otisku” jednotlivých záznamů. Často se skládají do mřížky nebo se umisťují do 2D scatterplotu (kde X a Y kódují 2 hlavní atributy a tvar glyfu kóduje zbytek).
- Proč: Osy (atributy) jsou rozmístěny do stejných úhlů kolem kružnice (ze středu ven). Hodnoty na osách jsou spojeny uzavřenou lomenou čarou, která tvoří unikátní polygonální tvar položky.
Hvězdicový graf (Star Plot):
- Kdy použít: Pro porovnání menšího počtu položek mezi sebou přímo na jedněch osách.
- Proč: Na rozdíl od hvězdicových glyfů (kde má každá položka svůj vlastní glyf) se zde vykresluje více položek (lomených čar) na jednom společném hvězdicovém základu. Funguje jako kruhová varianta paralelních souřadnic. (Nevýhodou je méně místa pro rozlišení hodnot blízko středu).
Chernoffovy tváře (Chernoff Faces):
- Kdy použít: Pro intuitivní a rychlé posouzení celkového “stavu” nebo “zdraví” položek na základě mnoha parametrů.
- Proč: Využívají evoluční výhodu lidského mozku, který dokáže extrémně rychle a precizně detekovat i drobné změny ve výrazu tváře. Atributy se mapují na rysy (velikost očí, sklon obočí, zakřivení úst). Klíčové je opět sémantické mapování (dobré hodnoty by měly vytvořit vizuálně šťastnou tvář).

3. Jaké vizualizace použít pro diskrétní/kategorické atributy a proč

U čistě kategorických dat (nominálních nebo ordinálních) selhávají výše zmíněné techniky (jako scatterplot nebo paralelní souřadnice), protože všechny body “napadají” na tytéž diskrétní hodnoty os (tzv. overplotting / překrývání), a my nevidíme skutečnou hustotu dat. Musíme proto přejít k agregaci a místo jednotlivých záznamů vizualizovat četnosti (frekvence).

Kruhový graf (Pie chart):
- Kdy použít: Pro zobrazení distribuce (proporcí) v rámci pouze jednoho kategorického atributu.
- Proč: Velikost výseče přímo odpovídá agregovanému počtu položek v dané kategorii. Je to základní a jednoduchá metoda, ale neumožňuje vizualizovat vztahy mezi více atributy současně.
Bargrams (Icicle plot):
- Kdy použít: Pro rychlý přehled o marginálních distribucích několika atributů nezávisle na sobě.
- Proč: Pro každý atribut se vytvoří jedna osa (horizontální pruh), která se rozdělí na úseky. Délka úseku je úměrná počtu položek v dané kategorii. Hlavní nevýhoda: Nelze z nich vyčíst vztahy mezi atributy (ukážou, kolik je dětí a kolik lidí přežilo, ale neukážou, kolik dětí přežilo).
Paralelní množiny (Parallel Sets):
- Kdy použít: Pro zobrazení toků a vztahů mezi několika kategorickými atributy (jde o kategorickou variantu paralelních souřadnic, která řeší problém Bargramů).
- Proč: Propojují jednotlivé Bargramy pomocí rovnoběžníků (pásů). Šířka pásu je úměrná frekvenci položek, které sdílejí danou kombinaci kategorií. Dělí se stromově shora dolů a ukazují, jak se podmnožiny dat přelévají. Nezbytná je interakce (přeskládání os), aby bylo možné sledovat různé vazby.
- *(Poznámka: Pro omezení vizuálního chaosu u velkého počtu atributů lze použít tzv. Bundled layout (seskupené uspořádání), které propojuje pouze sousední osy a nesleduje čáry přes celou strukturu, čímž se ale ztrácí možnost vidět vícerozměrné závislosti napříč grafem).*
Mozaikové grafy (Mosaic Plots):
- Kdy použít: Pro zobrazení proporcí a hierarchických vztahů mezi více kategorickými proměnnými jako alternativu k paralelním množinám.
- Proč: Rozdělují 2D prostor do vnořených obdélníků (rekurzivní dělení střídavě podle osy X a Y). Plocha každého obdélníku je přímo úměrná počtu položek v dané kombinaci kategorií. Skvěle komunikují hierarchii. Nevýhodou je, že porovnávání velikosti různě tvarovaných ploch je pro oko méně přesné než porovnávání šířky pásů.
Matice mozaikových grafů (Mosaic Plot Matrix):
- Kdy použít: Pokud máme velké množství kategorických atributů a klasický mozaikový graf by byl příliš hluboce vnořený a nečitelný.
- Proč: Využívá principu facetingu. Vytvoří matici (podobně jako SPLOM u bodových grafů), kde se pro každou možnou kombinaci dvou atributů zobrazí samostatný, jednoduchý mozaikový graf. Umožňuje tak zkoumat dvourozměrné vztahy mezi všemi páry proměnných současně.

Question 2: Direct volume rendering, Average Intensity Projection (AIP) a vše o tom

1. Přímé objemové renderování (Direct Volume Rendering - DVR)

2. Co je AIP a kam se řadí

3. Princip a matematický výpočet (AIP)

4. Vlastnosti, využití a analogie (AIP)

Question set 5

Question 1: Barevný prostor HSV a nelinearita (percepční neuniformita) barevného prostoru

1. Barevný prostor HSV a jeho charakteristika

2. Nelinearita (percepční neuniformita) barevného prostoru

Question 2: Vektorová pole – Marching Squares

1. Co je Marching Squares a základní princip

2. Dělení hran a topologické stavy

3. Problém ambiguity a jeho řešení

Question set 6

Question 1: Integrace paprsku (Ray Integration) – Back to Front vs. Front to Back

1. Co je integrace paprsku a přenosová funkce

2. Skládání zezadu dopředu (Back to Front Composition)

3. Skládání zepředu dozadu (Front to Back Composition)

Question 2: Mapování na barvu – Problémy a úskalí

1. Percepční neuniformita a problém duhové škály

2. Vnímání barvy je relativní (Vliv kontextu)

3. Vliv velikosti a vzdálenosti

4. Barvoslepost (Color blindness)

5. Nesoulad typu dat a barevné škály

Question set 7

Question 1: Marching Cubes (3D konturování) vs. Marching Tetrahedrons

1. Princip algoritmu Marching Cubes

2. Problém ambiguity v Marching Cubes a jeho řešení

3. Marching Tetrahedrons jako alternativa a srovnání

Question 2: First hit (Izo-povrchová funkce) - popis metody a její realizace

1. Co je metoda First hit (Izo-povrchová funkce)

2. Matematický princip a rovnice

3. Jak bychom metodu realizovali (Postup algoritmu)

4. Výhody a nevýhody oproti Marching Cubes

Question set 8

Question 1: Volumetrická data – Renderování, Back-to-front vs. Front-to-back a Přenosová funkce

1. Přímé objemové renderování a Integrace paprsku

2. Skládání vzorků: Back-to-front vs. Front-to-back

3. Přenosová funkce (Transfer Function) v integraci paprsku

Question 2: Odlehlé hodnoty (Outliers) – Co to je, co znamenají a k čemu slouží

1. Co je to odlehlá hodnota (Outlier) a co znamená

2. K čemu je dobré je vizualizovat a detekovat (Vliv a Využití)

3. Vizualizace outlierů a výzvy v Big Data

Question set 9

Question 1: Vizualizační proces - jeho části a příklady interakce v každém kroku

1. Fáze vizualizačního procesu

2. Příklady interakce v jednotlivých krocích procesu

Question 2: Brushing a linking, dělení dat do jednotlivých pohledů

1. Organizace datových pohledů a dělení dat (Faceting)

2. Brushing a Linking (Prořezávání a propojení)

Question set 10

Question 1: Vizualizační řetězec - komponenty a možné interakce uživatele

1. Komponenty vizualizačního řetězce (Referenční model)

2. Možné interakce uživatele v jednotlivých komponentách

3. Vizualizační mantra a taxonomie interakčních úloh

Question 2: Korelace a Linking (Scatterplot, Paralelní souřadnice) a pravidla pro přehlednost

1. Vizualizace korelace ve vícerozměrných datech

2. Brushing a Linking (Propojování pro zachování přehlednosti)

3. Co dalšího je třeba dodržet pro přehlednost (Řešení problémů)

Question set 12

Question 1: Relační data - typy grafů, jak je vizualizovat, jaké úlohy ty vizualizace řeší

1. Typy relačních dat (grafů a sítí)

2. Jak relační data vizualizovat (Techniky)

3. Jaké úlohy vizualizace relačních dat řeší

Question 2: Geometrický, sémantický, Fisheye zoom - příklad využití, kde to není dobré

1. Geometrické přiblížení (Geometric Zoom)

2. Sémantické přiblížení (Semantic Zooming)

3. Přiblížení rybím okem (Fisheye Zoom / Focus+Context)

Question set 13

Question 1: Focus + Context - výhody, nevýhody, příklady a využití u prostorových dat

1. Princip, výhody a nevýhody Focus + Context

2. Příklady technik Focus + Context

3. Jak to udělat v prostorových datech (Spatial Data)

Question 2: 3 techniky pro vizualizaci stromů/hierarchií, jejich porovnání a vhodné úlohy

1. Node-link diagram (Tradiční stromové rozvržení)

2. Treemap (Vizualizace pomocí ohraničení)

3. Radiální / Hyperbolický strom

Trace: • b4m39viz

Table of Contents

Vizualizace

Question set 1

Question 1: Klasifikace dat – atributy dat (typy) a jaké máme požadavky na vizuální kanály při jejich zobrazování

Question 2: Vektorová pole – vše o LIC (Integrální konvoluce čáry / Line Integral Convolution)

Question set 2

Question 1: Interakce focus + context (význam, výhody, nevýhody, příklady využití a technik, výběr fokusu)

Question 2: Relační data – Sugiyamův rámec (Sugiyama framework)

Question set 3

Question 1: Časová data - primitiva, domény, problémy a typy vizualizace

Question 2: Vektorová pole – Streamlines, pathlines, streaklines a důvod jejich použití

Question set 4

Question 1: Tabulková data – Obecný popis, volba vizualizací a zdůvodnění