Determinācijas koeficients ir korelācijas koeficienta kvadrāta matemātisks aprēķins. Korelācijas koeficients ir modeļa precizitātes aprēķins. Šie termini tiek izmantoti statistiskajā analīzē, lai izskaidrotu diezgan loģiskus aprēķinus.
Statistikā analītiķa uzdevums ir aplūkot datus, kas savākti no konkrēta scenārija vai notikuma, un izveidot matemātisko modeli, kas izskaidro datus. Lai izveidotu šo modeli, ir jāņem vērā daži fakti.
Katrā aprēķinos un datu apkopošanā pastāv kļūdu iespējamība. Tā kā tas ir konsekvents, kļūdu līmenis ir jāiekļauj modelī. Ņemot vērā šo kļūdu, tā vairs nav būtiska, lai noteiktu, vai piedāvātais modelis sniedz pārliecinošu datu skaidrojumu.
Faktiskais determinācijas koeficienta aprēķins ir
R2 = kļūdu kvadrātā summa
Kļūdu kvadrātā summa + kvadrātu regresijas summa
Šis ir modeļa precizitātes aprēķins datu skaidrošanā.
Izmantojot statistiskajā analīzē, šī vērtība sniedz ieskatu par statistikas modeļa “piemērotību” datiem. Koeficienta vērtība ir no 0 līdz 1. Modeļa perfekta atbilstība, lai izskaidrotu variāciju, ir 1, un 0 ir vērtība, kad modelis vispār nepaskaidro variāciju.
Determinācijas koeficients ņem vērā kļūdas ar datiem jeb izņēmumus un kvadrātu regresijas summu. Šai vērtībai nav vienības, jo tā būtībā ir attiecība un nav pilnībā saistīta ar izlases lielumu. Jo augstāka vērtība, tuvojoties 1, jo labāku variācijas skaidrojumu nodrošina modelis.
Vienkāršs veids, kā vizualizēt šo koncepciju, ir izveidot diagrammu ar visiem datiem, kas saistīti ar konkrētu notikumu. Pusdienu telpā novietojiet trīs paplātes ar cepumiem, šokolādi, mandelēm un zemesriekstiem. Pavērojiet, kā cilvēki ienāk pusdienu telpā un pieraksta, cik cepumus viņi paņem, kādus un kādā secībā. Atzīmējiet šos datus grafikā.
Izveidojiet formulu ap paredzēto uzvedību. Piemērs varētu būt prognozēt, ka katrs cilvēks, kurš paņēma 1 šokolādes cepumu, paņēma arī 2 mandeles, bet ne zemesriekstu. Pamatojoties uz šo pieņēmumu, var uzrakstīt vienkāršu lineāru vienādojumu un attēlot to grafiku.
Uzzīmējiet līniju, kas attēlo šīs prognozes lineāro vienādojumu. Salīdziniet līniju ar faktisko datu apkopojumu savā novērojumā. Aprēķiniet determinācijas koeficientu, lai nodrošinātu prognozētās uzvedības precizitātes mērījumu, salīdzinot ar faktiskajiem datiem.
Determinācijas koeficients norāda datu izplatības apjomu pa līniju. Tas parāda, cik laba vai slikta bija prognoze, salīdzinot ar faktiskajām vērtībām. Determinācijas koeficients ļauj lietotājiem statistiskā modelī piedāvātajiem datiem piemērot “realitātes pārbaudi”. Ir divas vērtības, novērotās jeb faktiskās vērtības un modelētās vai prognozētās vērtības.
Šāda veida statistiskā analīze ir ļoti izplatīta zinātnē un biznesā. Daudzi biznesa lēmumi ir balstīti uz nākotnes uzvedības prognozēm. Ir svarīgi analizēt faktiskos rezultātus un salīdzināt tos ar prognozēm. Šis process uzlabo nākamo modeli un līdz ar to arī prognožu precizitāti.