Kas ir lielo skaitļu likums?

Lielo skaitļu likums ir statistikas teorēma, kas postulē, ka nejaušo lielumu izlases vidējais lielums tuvosies teorētiskajam vidējam, palielinoties nejaušo mainīgo skaitam. Citiem vārdiem sakot, jo lielāks ir statistiskais paraugs, jo lielāka iespēja iegūt rezultātus, kas ir precīzāki par kopējo attēlu. Mazāks paraugu skaits mēdz vieglāk sagrozīt rezultātu, lai gan tie var būt arī diezgan precīzi.

Monēta ir labs piemērs, ko var izmantot, lai parādītu lielu skaitļu likumu. Bieži vien to izmanto sākuma līmeņa statistikas kursos, lai parādītu, cik efektīvs var būt šis likums. Lielākajai daļai monētu ir divas puses, galviņas un astes. Ja monēta tiek apgāzta, loģika teiktu, ka pastāv vienādas iespējas, ka monēta nonāks galvas vai astes pusē. Protams, tas ir atkarīgs no monētas līdzsvara, tās magnētiskajām īpašībām un citiem faktoriem, bet kopumā tā ir taisnība.

Ja monēta tiek apmesta tikai dažas reizes, rezultāti var nenorādīt, ka pastāv vienādas iespējas, ka tā nokritīs uz galvas un astes. Piemēram, četras reizes apmetot monētu, var iegūt trīs galvas un vienu asti. Tas varētu dot pat četras galvas un bez astes. Tā ir statistiska anomālija.

Tomēr lielo skaitļu likums saka, ka, palielinoties izlasei, šie rezultāti, visticamāk, atbilstu patiesajam iespēju attēlojumam. Ja monētu apmet 200 reizes, pastāv liela iespējamība, ka tā uzkritīs uz galvām un astēm gandrīz 100 reizes. Tomēr likums vai lielie skaitļi neparedz, ka katrs tas būs precīzi 100, tikai tas, iespējams, vairāk atspoguļos patieso iespēju diapazonu nekā mazāks vidējais rādītājs.

Lielo skaitļu likums parāda, kāpēc ir nepieciešams atbilstošs paraugs. Statistika tiek izmantota, jo nav pietiekami daudz laika vai tas ir nepraktiski izmantot visu kopu kā izlasi. Tomēr populācijas izlase nozīmē, ka būs reprezentatīvi populācijas locekļi, kas netiks uzskaitīti. Lai pārliecinātos, ka izlase atspoguļo kopējo populāciju, ir nepieciešams atbilstošs nejaušo mainīgo skaits.

Nepieciešamā izlases lieluma noteikšana parasti ir atkarīga no vairākiem faktoriem, no kuriem galvenais ir ticamības intervāls. Piemēram, statistiskais ticamības intervāls ir noteiktības līmenis, ka populācija atbilst noteiktiem parametriem. 95 procentu ticamības intervāla iestatīšana nozīmētu, ka ir pamatota pārliecība, ka 95 procenti iedzīvotāju atbilst šiem parametriem. Noteiktiem ticamības intervāliem nepieciešamo izlasi nosaka pēc formulas, kurā ņemts vērā skaits populācijā, kā arī vēlamais ticamības intervāls.
Lai gan lielo skaitļu likums ir vienkāršs jēdziens, teorēmas un formulas, kas palīdz to pamatot, var būt diezgan sarežģītas. Vienkārši sakot, likums vai lieli skaitļi ir labākais izskaidrojums tam, kāpēc lielāki paraugi ir labāki par mazākiem. Neviens nevar garantēt, ka statistiskā izlase būs pilnīgi precīza, taču šis likums palīdz novērst daudzus neprecīzus rezultātus.