Předmět je úvodem do aplikované analýzy dat pro studenty biologických a případně klinických vědních oborů. Látka je probírána od teoretických základů (principy provádění statistických odhadů, existence stochastických rozložení, základy statistických testů), přes jednoduché aplikace (jednovýběrové a dvouvýběrové testy, korelační analýza) až po základy stochastického modelování a experimentálního designu (plánování experimentů, základy regresní analýzy, analýza rozptylu).
Teorie je vždy probírána v přímé spojitosti s praktickými příklady. Součástí přednášky jsou několik dvouhodinových praktik na zpracování dat, nikoli jako podmínku ke zkoušce.
Zásady statistické inference zahrnují pravděpodobnost, odhad, interval spolehlivosti. Dva požadavky na odhad: nevychýlený a spolehlivý. Zásady statistického modelování zahrnují tvorbu modelu, testování modelu, residuály.
Variabilita je zkoumání nějaké proměnné. Příklad: výška stromů v lesích různého stáří. Zkoumání jedné proměnné: sama o sobě, v jakém je vztahu k jiné/jiným proměnným. Rozložení hodnot a jeho popis: průměr, medián, rozptyl atd.
Proměnné mohou být nominální (přítomnost/absence), ordinální (v jakém pořadí seřadit, příp. smysl medián a kvantily), intervalová (má smysl průměr a rozptyl), poměrová. Proměnné spojité a nespojité. Obecný předpoklad statistického zpracování je vzájemná nezávislost objektů.
Čtěte také: Životní prostředí Petrohradu
Pravděpodobnost a frekvence mají formální podobnost, ale zásadní rozdíly. Data jsou výsledkem empirického měření, pravděpodobnostní rozložení je výsledek teoretického procesu. Binomické a normální rozdělení pravděpodobností. Pojem parametru rozdělení. Binomické rozdělení (nespojité proměnné): model hodu mincí. Normální rozdělení: výsledek působení mnoha nezávislých vlivů: většinou se kompensují, někdy ne.
Výběrový průměr z normálního rozdělení má také normální rozdělení. Chování výběru jako náhodné proměnné, cf. házení korunou. Spolehlivost tohoto odhadu. Jediné co mohu udělat je provést výběr a zkoumat jedince ve výběru.
Testování hypotéz: zda tato konkrétní data representují dva odlišné základní soubory. Použiju testové kritérium/statistiku k popisu zjištěného rozdílu. Chyba I. a II. druhu. Zvláštní postavení nulové hypotézy: nepředpokládá nic dodatečného. Signifikance vs. size.
Regrese a korelace se zabývají závislostí dvou kvantitativních veličin. Regrese je asymetrický případ (vím, která je závislá a která ne). Statistický model lineární regrese: Eyi = bxi + a. Metoda nejmenších čtverců: minimalizace kritéria shody. Regresní koeficient a úsek na ose Y.
Problémem může být korelace mezi nezávislými proměnnými. Koeficient mnohonásobné korelace R, determinace: R2. Testy v mnohorozměrné regresi.
Čtěte také: Ekologické aspekty vody v podniku
Nelineární regrese je vhodná, pokud znám mechaniku sledovaného procesu nebo geometrii závislosti. Polynomická regrese: aplikace mnohonásobné regrese. Lokální regrese: zásady, použití.
Analýza rozptylu (ANOVA) se používá, pokud je závislá proměnná kvantitativní. Statistický model jednocestné ANOVA. Vztah mezi ANOVA a regresí. Předpoklady: normální rozdělení, homogenita variancí. Mnohonásobná porovnávání: Proč nelze párově testovat. II (náhodné efekty) ANOVA.
Analýza frekvencí zahrnuje kontingenční tabulky. Frekvenční tabulka (obecný případ, speciální případ 2x2). Testy dobré shody (Goodness of fit). Logistická regrese: sigmoidní křivka.
Zobecněné lineární modely umožňují modelovat proměnnou s různým rozložením (např. binomické, Poissonovo, Gamma). Opakování: Co to je statistický model. Normal linear model, GLM: očekávaná hodnota y je lineární funkcí prediktorů.
Přehled testů na různé typy ekologických problémů. Přehled běžného softwaru. Základy plánování ekologických pokusů. Zásady sběru dat. Úvod do analýzy dat v čase a prostoru.
Čtěte také: Nerezová ocel a životní prostředí
| Typ dat | Test | Popis |
|---|---|---|
| Kvantitativní | T-test | Srovnání průměrů dvou skupin |
| Kvantitativní | ANOVA | Srovnání průměrů více skupin |
| Kvalitativní | Chi-kvadrát test | Testování závislosti mezi kategoriálními proměnnými |
| Kvantitativní | Regrese | Modelování vztahu mezi proměnnými |
tags: #ekologie #výběrový #průměr #definice