Veškerý svět kolem nás je vícerozměrný. Kromě vnímání třírozměrného tvaru můžeme každý objekt popsat celou řadou dalších charakteristik, jako je třeba barva, hmotnost, chuť atd. Přes tuto skutečnost, kterou vnímáme každý den, je pro nás ovšem problémem představit si tento stav popsaný ve formě datové tabulky nebo jej dokonce nějakým způsobem popsat jinému člověku - nastává zde tedy místo pro speciální typ analýzy, vícerozměrnou analýzu.
Metody vícerozměrné analýzy jsou velmi užitečným prostředkem pro explorativní analýzu složitých dat. Ačkoliv klasická statistika zná řadu způsobů popisu jednotlivých měřených nebo pozorovaných proměnných, je pro nás v případě hodnocení velkého množství proměnných velmi obtížné si tyto výstupy poskládat do jednolitého obrazu vedoucího k pochopení podstaty. Právě vícerozměrná analýza dat je nástrojem sloužícím k usnadnění tohoto procesu a její přínos lze shrnout následovně:
Ačkoliv je v případě vícerozměrných analýz používána celá řada matematických postupů, jedno mají všechny tyto analýzy společné - hledání souvislostí a jejich výklad.
Na tomto místě musíme uvést i nevýhody vícerozměrné analýzy dat. Zjednodušení vícerozměrného problému je možné pouze tehdy, kdy existuje vazba mezi naměřenými proměnnými. Pokud by mezi nimi žádná vazba neexistovala, nebo byla velmi slabá, nemá smysl vícerozměrné metody používat.
Dalším problémem může být nesprávné použití metody, které může vést k zavádějícím výsledkům. Při zpracovávání vícerozměrných dat ovšem nemusí být tato chyba patrná, protože je zakryta složitou strukturou dat a náročností výpočtu.
Čtěte také: Životní prostředí Petrohradu
Příklady užití vícerozměrných metod můžeme najít v různých oblastech, nejen v přírodovědných a medicínských oborech, ale také v technice, kybernetice, sociologii, ekonomii i marketingu. Z oblasti biologických věd můžeme zmínit aplikace v ekologii, ekotoxikologii, taxonomii, etologii, antropologii atd.
Konkrétně z ekologie můžeme uvést využití mnohorozměrných metod např. Acta Univ. Agric. Silvic. Mendelianae Brun. Použitá metoda kombinace faktorové analýzy a Fourierovy transformace není ve vodárenství zcela běžně využívaná. Vzhledem k tomu, že použitý statistický program Prognost je schopen provádět analýzy pouze z omezeného počtu veličin, byl do analýz zahrnut jen okruh vybraných ukazatelů jakosti povrchové vody.
Nebylo proto možné prokázat vliv všech případných činitelů v povodí (antropogenních i přírodních) podílejících se na jakosti vody v nádrži Vranov nad Dyjí. Vybranými ukazateli bylo možné postihnout především vliv intenzivní zemědělské činnosti, osídlení a rekreace (zvláště z pohledu vypouštění a čištění odpadních vod), klimatických vlivů (srážky) a částečně i přírodního pozadí. Vybrané ukazatele kvality vody nehodnotí například vliv průmyslu.
Korespondenční analýza nachází časté uplatnění při sledování vztahů druhů k prostředí v ekologii společenstev. Byla v tomto oboru velice populární v 80.-90. letech. Ve stejném období byla ke zpracování dat ekologických společenstev často používána i analýza hlavních komponent.
Použití korespondenční analýzy a analýzy hlavních komponent při zpracování ekologických dat má jedno důležité pravidlo týkající se odpovědí druhu na gradient prostředí. Pod gradientem si můžeme představit například vlhkost a dále uvažujme vztah nějakého rostlinného druhu k vlhkosti prostředí. Z ekologie je známé, že druhy mají při určité hodnotě vlhkosti své optimum a při snižující či zvyšující se vlhkosti se jejich početnost, resp. pravděpodobnost výskytu snižuje. Při určitých hodnotách, které jsou pro daný druh suboptimální, se tento již nevyskytuje. Odpověď daného druhu na vlhkostní gradient je unimodální.
Čtěte také: Ekologické aspekty vody v podniku
V ordinačních metodách můžeme pracovat buď s lineární odpovědí druhu na gradient prostředí, nebo s unimodální. Lineární model předpokládá, že abundance nebo pravděpodobnost výskytu každého druhu buď roste, nebo klesá s hodnotami každé environmentální proměnné nebo gradientu. Unimodální model předpokládá, že abundance nebo pravděpodobnost výskytu každého druhu má v rámci rozpětí hodnot každého gradientu optimum.
Unimodální modely jsou mnohem obecnější než modely monotónní (Obr. 4), proto se doporučuje použít unimodální model a rozhodnout se později, zda si můžeme tento model zjednodušit na lineární. Poznámka: Abychom mohli rozhodnout o použití lineárního anebo unimodálního modelu, musíme odměřit délku nejdelšího gradientu a tedy gradient první ordinační osy. Délka gradientu se měří v násobcích směrodatné odchylky (s.d.). Druhová data jsou standardizována tak, že unimodální křivka probíhá přes 4 s.d. Proto u vzorků, které jsou od sebe vzdáleny 4 s.d., můžeme předpokládat, že nemají společný žádný druh.
Doporučená volba mezi unimodálním a lineárním modelem je následující. Unimodální model volíme tehdy, když je délka nejdelšího gradientu větší nebo rovna 4 s.d.. Lineární model volíme tehdy, když je délka nejdelšího gradientu menší než 3 s.d., není ovšem ani v tomto případě nutnost použít lineární model.
Výhodou použití PCA je, že zobrazení druhů a vzorků poskytuje víc kvantitativních informací než korespondenční analýza. Nevýhodou analýzy hlavních komponent je předpoklad lineárních dat. Zpravidla platí, že techniky váženého průměrování (korespondenční analýza) jsou lepší pro heterogenní data naznačující silný environmentální gradient (jde zejména o kontingenční tabulky obsahujících mnoho nulových hodnot).
Čtěte také: Nerezová ocel a životní prostředí
tags: #faktorova #ekologie #priklad