Kas yra histogramos klasės?

Histogramos klasės yra verčių diapazonai, kuriuose yra duomenų taškai dažnio skirstinyje arba neapdorotų duomenų lentelė. Jie taip pat vadinami intervalais, dėžėmis arba šiukšliadėžių pločiais. Histogramoje, tam tikro tipo juostinėje diagramoje, šios klasės vaizduojamos kaip vertikalūs stulpeliai, kur stulpelio aukštis rodo duomenų taškų, esančių klasės diapazone, skaičių. Paprastai histogramos klasė pasirenkama siekiant pagerinti vizualinį duomenų statistikos arba tendencijų atvaizdavimą.

Kai rodomas didelis duomenų kiekis, histograma ypač naudinga vaizduojant jos pasiskirstymo formą. Visas duomenų diapazonas suskirstomas į intervalus, o į kiekvieną patenkančių duomenų taškų skaičius skaičiuojamas, kad būtų nustatytas klasės dažnis. Intervalo diapazonas arba plotis lemia histogramos klasių skaičių ir įtakoja grafiko formą.

Jei intervalas yra per platus, gali būti praleista svarbi informacija, nes klasės yra per daug įtraukiančios. Kai intervalo pločio pasirinkimas yra per siauras, žemos klasės dažnis gali suteikti pernelyg didelę reikšmę tam, kas iš tikrųjų yra atsitiktinis pokytis. Yra keletas būdų, kaip nustatyti tinkamą duomenų rinkinio histogramų klasių skaičių.

Pagal Sturgio taisyklę klasių skaičius turėtų būti artimas baziniam 2 duomenų taškų skaičiaus logui, plius vienas. Naudojant Rice’o taisyklę, apibrėžtų klasių skaičius turėtų būti du kartus didesnis už duomenų taškų skaičiaus kubinę šaknį. Kad ir kuris metodas būtų naudojamas pasirenkant histogramos klasių skaičių, reikia išbandyti kelis skirtingus pločius, kad būtų galima patikrinti histogramos formos jautrumą klasės dydžiui. Teisingas klasių skaičius yra tas, kuris tiksliausiai parodo duomenų pasiskirstymą.

Turint tinkamą histogramos klasių skaičių įvairiems duomenims, turėtų būti gautas prasmingas grafinis vaizdas, leidžiantis aiškiai interpretuoti. Histogramoje turėtų būti parodytas duomenų centras ir sklaida, bet koks iškrypimas arba duomenų asimetrija, nuokrypiai arba duomenų taškai, esantys už numatomo verčių diapazono ribų. Režimas arba dažniausiai pasitaikanti reikšmė turėtų būti aiškūs, taip pat grupės, galinčios nurodyti kelis modalumą. Histogramos analizė taip pat gali rodyti duomenų rinkimo proceso klaidas.

Ilgą laiką finansuose ir socialiniuose moksluose naudotos histogramos tampa vis labiau pažįstamos buitinės elektronikos grafiniuose ekranuose. Skaitmeninė fotografija yra ypač atvira, nes daugelis fotoaparatų turi spalvų histogramą, rodančią baltos spalvos balansą ir ekspoziciją. Skaitmeninės fotografijos histogramoje pikseliai taip pat gali būti rodomi kaip histogramos klasės, sudarytos iš pilkų atspalvių.