Ar statistika gali būti klaidinanti?

Yra senas posakis, kad figūros nemeluoja, bet melagiai žino, kaip suprasti. Tam tikra prasme tai rodo žmonių atsargumą statistikos atžvilgiu. Dėl statistinio aiškinimo duomenys gali pasirodyti klaidinantys. Tai priklauso nuo statistiko duomenų interpretavimo ir nuo to, kokie skaičiai pateikiami kaip pagrindiniai statistinės ataskaitos taškai.
Pavyzdžiui, vidurinėje mokykloje mokiniai dabar tiria centrinės tendencijos matmenis, kurie yra vidurkis, mediana, režimas ir diapazonas. Vidurkis yra visų duomenų suma, padalinta iš duomenų skaičiaus. Pavyzdžiui, galima gauti asmens testų balų sumą ir padalyti ją iš testų skaičiaus, kad būtų nustatytas pažymys. Tačiau vidurkį gali paveikti tai, kas vadinama išskirtine verte – skaičiumi, gerokai už įprasto bandymo diapazono ribų. Tai gali reikšti, kad vidurkis gali būti klaidinantis našumo vertinimo būdas.

Jei žmogus puikiai laiko penkis testus, o šeštojo neišlaiko ir taip uždirba nulį, tai atspindi vidurkis. Pavyzdžiui, jei visi testai yra verti 100 taškų, vidutinis balas yra maždaug 85%. Tačiau šiuo atveju tai tikrai nerodo vidutinio našumo, nes nulinis skirtumas.

Kitas centrinės tendencijos matas, kurį galima naudoti, yra medianos įvertinimas. Mediana yra vidurinis skaičius duomenų grupėje, išdėstytoje skaitine tvarka. Jei statistikas vertina medianą, tai gali neatspindėti tikrojo našumo vidurkio arba to, kas yra vertinama. Mediana negali atsižvelgti į duomenų diapazoną, kuris gali būti didžiulis ir todėl gali būti klaidinantis.

Centrinė tendencija, vertinama pagal režimą, reiškia tik pažvelgti į skaičių, kuris dažniausiai pasitaiko duomenų rinkinyje. Taigi, pavyzdžiui, testo laikytojas turi 100 režimą. Tačiau tai nereiškia, kad testą atliekantis asmuo jo neišlaikė, o tai yra klaidinanti.

Kiti būdai, kuriais statistika gali būti klaidinanti, yra klausimų uždavimo būdas, galbūt apklausoje, ir tai, kokiu mastu apklausa yra reprezentatyvi bendruomenės imtis. Jei apklausiate vidurinės mokyklos mokinių grupę ir paklausite: „Ar esate patenkintas savo išsilavinimu 1–5 balų skalėje? galima gauti labai skirtingus atsakymus, priklausomai nuo to, ar grupė atstovauja „vidutiniam“ studentui.

Jei apklausiama grupė mokinių, kurie visi mokosi ir mokosi fantastiškoje, gerai finansuojamoje mokykloje, skelbti tokius duomenis kaip reprezentatyvią imtį būtų sąmoningai klaidinanti. Jei paklaustume skirtingų mokyklų mokinių, turinčių skirtingus pažymius, tikėtina, kad apklausa bus reprezentatyvesnė ir teisingesnė. Tačiau paklausus mokinių, ką jie mano apie mokyklas, ir paskelbus rezultatus kaip reprezentatyvią bendros populiacijos imtį, atsakymai bus labai iškreipti.
Skaičiai gali atrodyti labai konkretūs, o kai kuriuos skaičiai suklaidina vien todėl, kad jie atrodo faktai ir turi neginčijamą vertę. Taigi statistiniai duomenys dažnai gali būti naudojami klaidinančiai, siekiant sužavėti žmones skaičiais ir ginčijamus dalykus atrodyti kaip faktus. Gerbiami statistikai žino, kad klausimus reikia apibendrinti, taip pat jų reikia užduoti žmonėms, atstovaujantiems gyventojams.

Tačiau skaičiai ir statistika gali būti klaidinantys, nes jie neatspindi asmens. Jie gali parodyti, kaip žmonės „apskritai“ reaguoja į idėją, produktą ar politinį kandidatą. Jie negali parodyti, kaip jausis vienas žmogus su visomis savo be galo įvairiomis savybėmis.