Kas yra dispersijos analizė?

Atliekant tyrimą kartais prireikia analizuoti duomenis lyginant daugiau nei dvi imtis ar grupes. Išvadinės statistikos testo tipas, dispersijos analizė (ANOVA), leidžia vienu metu ištirti keletą imčių, siekiant nustatyti, ar tarp jų yra reikšmingas ryšys. Samprotavimas yra identiškas t-testams, tik dispersijos analizė apima nepriklausomus dviejų ar daugiau imčių kintamuosius. Nustatomi skirtumai tarp mėginių, taip pat skirtumas tarp vieno mėginio. ANOVA pagrįsta keturiomis prielaidomis: matavimo lygiu, atrankos metodu, populiacijos pasiskirstymu ir dispersijos homogeniškumu.

Siekiant nustatyti, ar skirtumai yra reikšmingi, ANOVA yra susijusi su skirtumais tarp imčių ir jų viduje, o tai vadinama dispersija. ANOVA gali išsiaiškinti, ar dispersija tarp imčių yra didesnė, nei tarp imties narių. Jei nustatoma, kad tai tiesa, skirtumai laikomi reikšmingais.

Atliekant ANOVA testą reikia priimti tam tikras prielaidas. Pirmasis yra tai, kad naudojamas nepriklausomas atsitiktinės atrankos metodas, o imties narių pasirinkimas iš vienos populiacijos neturi įtakos vėlesnių populiacijų narių pasirinkimui. Priklausomi kintamieji pirmiausia matuojami intervalo santykio lygiu; tačiau dispersijos analizę galima taikyti eilinio lygio matavimams. Galima daryti prielaidą, kad populiacija pasiskirsto normaliai, nors to neįmanoma patikrinti, o populiacijų dispersijos yra vienodos, o tai reiškia, kad populiacijos yra vienalytės.

Tyrimo hipotezėje daroma prielaida, kad bent vienas vidurkis skiriasi nuo kitų, tačiau skirtingos priemonės nėra identifikuojamos kaip didesnės ar mažesnės. Numatomas tik faktas, kad skirtumas egzistuoja. ANOVA tikrina nulinę hipotezę, o tai reiškia, kad nėra skirtumo tarp visų vidutinių verčių, kad A = B = C. Tam reikia nustatyti alfa, atsižvelgiant į tikimybės lygį, kai nulinė hipotezė bus atmesta.

F santykis yra testo statistika, naudojama specialiai dispersijos analizei, nes F balas parodo, kur prasideda nulinės hipotezės atmetimo sritis. F formulė, kurią sukūrė statistikas Ronaldas Fisheris, yra tokia: F = tarp grupės dispersijos įverčio (MSB), padalytas iš grupės viduje esančio dispersijos įverčio (MSW), kad F = MSB/MSW. Kiekvienas dispersijos įvertis susideda iš dviejų dalių – kvadratų sumos (SSB ir SSW) ir laisvės laipsnių (df). Naudojant biologinių, žemės ūkio ir medicinos tyrimų statistines lenteles, alfa gali būti nustatyta ir remiantis tuo, o nulinė hipotezė, kad nėra skirtumo, gali būti atmesta. Galima daryti išvadą, kad tarp visų grupių yra reikšmingas skirtumas, jei taip yra.