Determinacijos koeficientas yra koreliacijos koeficiento kvadrato matematinis skaičiavimas. Koreliacijos koeficientas yra modelio tikslumo apskaičiavimas. Šie terminai naudojami statistinėje analizėje, siekiant paaiškinti gana logiškus skaičiavimus.
Statistikoje analitiko darbas yra pažvelgti į duomenis, surinktus iš konkretaus scenarijaus ar įvykio, ir sukurti matematinį modelį, kuris paaiškintų duomenis. Norint sukurti šį modelį, reikia atsižvelgti į tam tikrus faktus.
Kiekviename skaičiavime ir renkant duomenis yra klaidų galimybė. Kadangi tai nuoseklu, į modelį turi būti įtrauktas klaidų lygis. Atsižvelgus į šią klaidą, ji nustoja būti svarbi nustatant, ar siūlomas modelis pateikia patikimą duomenų paaiškinimą.
Faktinis determinacijos koeficiento skaičiavimas yra
R2 = klaidų kvadratu suma
Klaidų kvadratų suma + Regresinė kvadratų suma
Tai modelio tikslumo apskaičiavimas paaiškinant duomenis.
Naudojama statistinėje analizėje, ši vertė suteikia įžvalgos apie statistinio modelio „tinkamumą“ duomenims. Koeficiento reikšmė yra nuo 0 iki 1. Puikiai modelio pritaikymas variacijai paaiškinti yra 1, o 0 yra reikšmė, kai modelis visiškai nepaaiškina variacijos.
Nustatant determinacijos koeficientą atsižvelgiama į duomenų klaidas arba nuokrypius ir kvadratų regresijos sumą. Šios vertės vieneto nėra, nes tai iš esmės yra santykis ir visiškai nesusijęs su imties dydžiu. Kuo didesnė vertė, artėjanti prie 1, tuo geriau modelis pateikia variacijos paaiškinimą.
Paprastas būdas vizualizuoti šią koncepciją yra sukurti visų duomenų, susijusių su konkretų įvykį, grafiką. Pietų kambaryje išdėliokite tris padėklus sausainių, šokolado, migdolų ir žemės riešutų. Stebėkite, kaip žmonės ateina į pietų kambarį ir užrašo, kiek sausainių išima, kokių rūšių ir kokia tvarka. Nubraižykite šiuos duomenis grafike.
Sukurkite numatyto elgesio formulę. Pavyzdys būtų numatyti, kad kiekvienas žmogus, paėmęs 1 šokoladinį sausainį, paėmė ir 2 migdolus, bet ne žemės riešutus. Remiantis šia prielaida, galima parašyti paprastą tiesinę lygtį ir nubraižyti ją.
Nubraižykite liniją, vaizduojančią tos prognozės tiesinę lygtį. Palyginkite eilutę su faktiniu stebėjimo duomenų rinkimu. Apskaičiuokite determinacijos koeficientą, kad gautumėte numatomo elgesio tikslumo matą, palyginti su faktiniais duomenimis.
Determinacijos koeficientas rodo duomenų pasklidimo aplink liniją kiekį. Tai rodo, kokia gera ar bloga buvo prognozė, palyginti su tikrosiomis vertėmis. Determinacijos koeficientas leidžia vartotojams taikyti statistiniame modelyje siūlomų duomenų „tikrovės patikrinimą“. Yra dvi reikšmės: stebimos arba faktinės vertės ir sumodeliuotos arba numatomos vertės.
Tokio tipo statistinė analizė yra labai paplitusi moksle ir versle. Daugelis verslo sprendimų yra pagrįsti būsimos elgsenos prognozėmis. Svarbu išanalizuoti realius rezultatus ir palyginti juos su prognozėmis. Šis procesas pagerina kitą modelį, taigi ir prognozių tikslumą.