Koks skirtumas tarp medianos ir vidurkio?

Statistikoje vidurkis ir mediana yra skirtingi pagrindinės duomenų rinkinio tendencijos arba skaičių tendencijos susieti su tam tikra verte matai. Vertybių grupėje gali būti pageidautina rasti tipiškiausią. Vienas iš būdų tai padaryti yra rasti vidurkį arba vidurkį, kuris yra visų reikšmių suma, padalyta iš bendro reikšmių skaičiaus. Kitas būdas yra rasti vidutinę arba vidurinę vertę, esančią sutvarkyto skaičių sąrašo centre. Geresnis metodas priklauso nuo programos ir duomenų pobūdžio.

Vidurkis

Gauti kažko vidurkį yra tas pats, kas gauti vidutinį skaičių duomenų rinkinyje. Aibės reikšmių suma padalinama iš reikšmių skaičiaus. Pavyzdžiui, mokytojas gali įvertinti penkis testo balus, visus vienodai įvertintus, kad nustatytų mokinio pažymį. Jei penki testo balai yra 80, 85, 60, 90 ir 100, šie skaičiai sumuojami ir gaunama 415, kurią padalinus iš 5 gaunamas vidutinis balas 83. Tai apskaičiavęs, mokytojas gali priskirti pažymį mokiniui.

Mediana
Atliekant vidutinį matavimą, duomenys yra išdėstyti nuo mažiausio iki didžiausio: 60, 80, 85, 90 ir 100. Vidurinis skaičius šioje aibėje yra mediana. Šiame pavyzdyje mediana yra 85, trečiasis ir vidurinis rinkinio skaičius. Tai šiek tiek skiriasi nuo 83 balų vidurkio. Mokytojas gali norėti pažvelgti į balų vidurkį, nes jis paprastai atmeta neįprastai žemą balą, pavyzdžiui, 60, kuris sumažintų vidurkį.

Kai reikšmių skaičius lygus, imamas dviejų centrinių skaičių vidurkis. Šie du skaičiai sumuojami ir dalijami iš dviejų. Pavyzdžiui, dešimties mokinių klasėje testo rezultatai didėjimo tvarka gali būti 48, 56, 57, 61, 65, 68, 68, 71, 77 ir 82. Šio duomenų rinkinio mediana būtų penkto ir šešto skaičių vidurkis – 65 ir 68, tai yra 66.5.

Programos
Abu šie metodai naudojami norint rasti „tipinę“ reikšmę iš duomenų rinkinio. Vidurkis yra dažniausiai naudojamas centrinės tendencijos matavimas, tačiau yra atvejų, kai jis nėra tinkamas. Pavyzdžiui, duomenys gali būti „kreipti“, o tai reiškia, kad dauguma skaičių yra link žemiausios arba aukščiausios skalės dalies arba kad yra viena vertė, kuri labai skiriasi nuo visų kitų – tai žinoma kaip Pašalinių. Ypač mažame duomenų rinkinyje vidutinė vertė šiais atvejais nebus tipiška.

Pavyzdžiui, jei penki mokiniai laiko testą, o balai yra 24, 85, 89, 91 ir 95, balų vidurkis yra 60.6. Tačiau tai netipiška – vidurkis buvo sumažintas vienu išskirtiniu balu – 24, galbūt dėl ​​to, kad vienas studentas nesimokė. Šiuo atveju 89 mediana yra daug tipiškesnė.
Kitas retkarčiais naudojamas metodas yra režimas, kuris paprasčiausiai yra dažniausia duomenų rinkinio reikšmė. Jis kartais naudojamas, kai galimos reikšmės duomenų rinkinyje yra ribotos ir viena kitą paneigiančios. Pavyzdžiui, norint rasti populiariausią prekės ženklą, gali būti atlikta nešiojamųjų kompiuterių savininkų apklausa. Šiuo atveju vidutinis arba vidutinis prekės ženklas nebūtų prasmingas, o populiariausias prekės ženklas būtų režimas.

Norint pateikti pavyzdį, kai gali būti naudojami visi trys metodai, gali būti renkami tam tikri duomenys, susiję su įmonės darbuotojais. Atliekant analizę būtų galima apskaičiuoti vidutinį atlyginimą, tačiau jį gali iškreipti nedidelis skaičius labai daug uždirbančių aukštesnės grandies vadovų, todėl vidutinis atlyginimas gali padėti geriau suprasti, kiek įprastam darbuotojui mokama. Jei duomenys būtų suskirstyti pagal išsilavinimą, galima būtų pastebėti, kad dauguma darbuotojų turi aukštąjį universitetinį išsilavinimą – toks būtų būdas.