Kas yra dėžutės sklypas?

Dėžutės diagrama arba dėžutės ir ūsų diagrama yra skaitmeninių duomenų išdėstymo vienoje skaičių eilutėje, kuri gali būti horizontali arba vertikali, metodas. Tikrasis langelis, kai sklypas yra horizontalus, yra šiek tiek virš skaičių linijos ir susideda iš trijų vertikalių linijų, sujungtų horizontaliomis linijomis. Horizontalios laukelio ribos rodo pirmąjį ir trečiąjį kvartilius (25 ir 75 procentilius), atskirtus vidurine linija, kuri yra duomenų mediana arba 50 procentilis. Abiejose dėžutės pusėse nuo horizontalių linijų vidurio tęsiasi vertikalios linijos, kartais vadinamos ūsais. Kai jie pasiekia mažiausią ir didžiausią duomenų rinkinio skaičių, jie baigiasi mažesnėmis horizontaliomis linijomis, nors tai gali šiek tiek skirtis priklausomai nuo duomenų sklaidos.

Yra keletas svarbių elementų, kurie sudaro gerą langelį, ir kai kurie skaičiai, kuriuos žmonės turi žinoti kurdami šias diagramas. Pirmasis iš jų vadinamas penkių skaičių santrauka, dažnai sutrumpintai kaip penkių skaičius. suma. Tai yra pirmojo ir trečiojo kvartilių, medianos ir minimalaus bei didžiausio duomenų skaičiaus sąrašas. Kai kuriose programose žmonės turės juos išvardyti šalia sklypo, nors analizuojant sklypą su gera skaičių linija taip pat galima gauti šiuos skaičius, žiūrint į tris horizontalias linijas ir baigiamuosius ūsus. Tai ne vištienos/kiaušinio klausimas asmeniui, piešiančiam siužetą, nes penkių skaičius. suma. turi būti naudojami kuriant siužetą.

Žmonės taip pat turi žinoti skaičių, vadinamą interkvartiliniu diapazonu (IQR). Iš trečiojo kvartilio atėmus pirmąjį kvartilį, gaunamas IQR, o naudojant skirtingą programinę įrangą ar mokslinius skaičiuotuvus taip pat galima gauti šį skaičių ir penkių skaičių suvestinę įvedus visus duomenis. IQR yra svarbus, nes linijos, besitęsiančios iš langelio, paprastai tęsiasi tik iki 1.5 karto IQR. Duomenys už šio taško žymimi taškais, o ne ištisine linija. Šie taškai dažnai rodo, kad duomenys turi nukrypimų.

Dėžutės sklypo panaudojimo galimybės yra įvairios. Virš vienos skaičių linijos gali būti nubraižyti keli brėžiniai ir galima palyginti panašius duomenų rinkinius, atskirtus pagal kokį nors svarbų veiksnį. Pavyzdžiui, mokslininkai ar statistikos specialistai gali užregistruoti vyrų ir moterų širdies susitraukimų dažnį, o tada sudaryti du sukrautus langelius, kad nustatytų reikšmingus diapazono ir kvartilių skirtumus.

Dėžutės diagramos nenurodo duomenų dažnio. Jei nėra papildomos skalės (vertikalios arba horizontalios), praleidžiama informacija apie pasikartojančius skaičius, duomenų rinkinio dydį ir daugumą atskirų skaičių. Žmogus, žiūrintis į langelio diagramą, geriausiai supras penkių skaičių suvestinę, diapazoną ir tai, ar duomenys turi kokių nors nukrypimų. Dėžutės dydis, medianos santykis su kvartiliais ir ūsų ilgis gali parodyti, ar duomenys yra iškreipti, tačiau jie negali pasakyti apie tokius dalykus kaip vidurkis, režimas ar standartinis nuokrypis. Kitos diagramos, pvz., histogramos, gali būti naudingesnės, kai žmonės nori pateikti tokius dalykus kaip dažnis arba gauti geresnių duomenų apie duomenų paskirstymą.