Kas ir vienkārša lineārā regresija?

Vienkārša lineārā regresija attiecas uz statistiku un palīdz aprakstīt (x, y) datus, kuriem, šķiet, ir lineāra sakarība, ļaujot prognozēt y, ja x ir zināms. Šie dati bieži tiek attēloti uz izkliedes diagrammām, un lineārās regresijas formula izveido līniju, kas vislabāk atbilst visiem punktiem, ja tiem patiešām ir lineāra korelācija. Tas neatbilst precīzi visiem punktiem, bet tai jābūt līnijai, kurā faktisko datu un paredzamo datu (atlikuma) starpības kvadrātu summa rada mazāko skaitli, ko bieži sauc par mazāko kvadrātu līniju vai līniju vislabāk piemērots. Izlases datu un populācijas datu līnijas vienādojums ir šāds: y = b0 + b1x un Y = B0 + B1x.

Ikviens, kurš pārzina algebru, var atzīmēt šīs līnijas līdzību ar y = mx + b, un patiesībā abas ir relatīvi identiskas, izņemot divus vienādojuma labajā pusē esošus terminus pārslēgti tā, ka B1 ir vienāds ar slīpumu vai m. Šīs pārkārtošanas iemesls ir tas, ka pēc tam kļūst eleganti viegli pievienot papildu terminus ar tādiem līdzekļiem kā eksponenti, kas varētu aprakstīt dažādas nelineāras attiecību formas.

Formulas vienkāršas lineāras regresijas līnijas iegūšanai ir salīdzinoši sarežģītas un apgrūtinošas, un lielākā daļa cilvēku netērē daudz laika to pierakstīšanai, jo to aizpildīšana prasa daudz laika. Tā vietā dažādas programmas, piemēram, programmai Excel vai daudzu veidu zinātniskiem kalkulatoriem, var viegli aprēķināt mazāko kvadrātu līniju. Līnija ir piemērota prognozēšanai tikai tad, ja ir skaidri pierādījumi par spēcīgu korelāciju starp (x,y) datu kopām. Kalkulators ģenerēs līniju neatkarīgi no tā, vai ir jēga to izmantot.

Tajā pašā laikā tiek ģenerēts vienkāršs lineāras regresijas līnijas vienādojums, cilvēkiem ir jāaplūko korelācijas līmenis. Tas nozīmē, ka ir jānovērtē korelācijas koeficients, salīdzinot ar vērtību tabulu, lai noteiktu, vai pastāv lineāra korelācija. Turklāt datu novērtēšana, attēlojot tos kā izkliedes diagrammu, ir labs veids, kā saprast, vai datiem ir lineāra sakarība.

Ko tad var izdarīt ar vienkāršu lineāro regresijas līniju, ja tai ir lineāra korelācija, ir tas, ka vērtības var aizstāt ar x, lai iegūtu y prognozēto vērtību. Šai prognozei ir savas robežas. Esošajiem datiem, īpaši, ja tas ir tikai paraugs, var būt lineāra korelācija tagad, bet vēlāk, pievienojot papildu parauga materiālu, tā var nebūt.

Alternatīvi, visai izlasei var būt kopīga korelācija, bet visai populācijai nav. Tāpēc prognozēšana ir ierobežota, un, pārsniedzot pieejamās datu vērtības, to sauc par ekstrapolāciju, un tā nav ieteicama. Turklāt, vai cilvēkiem būtu jāzina, ka, ja nepastāv lineāra korelācija, vislabākais x novērtējums ir visu y datu vidējais lielums.

Būtībā vienkārša lineārā regresija ir noderīgs statistikas rīks, ko var izmantot, lai prognozētu y vērtības, pamatojoties uz asis vērtību. To gandrīz vienmēr māca ar lineārās korelācijas ideju, jo regresijas taisnes lietderības noteikšanai ir nepieciešama r analīze. Par laimi, izmantojot daudzas modernas tehniskās programmas, cilvēki var izveidot diagrammas izkliedes diagrammas, pievienot regresijas līnijas un noteikt korelācijas koeficientu r ar pāris ierakstiem.

SmartAsset.