Kas ir pārliecības intervāli?

Statistikā ticamības intervālus izmanto kā intervālu aplēses populācijas parametriem. Tos bieži izmanto zinātnē un inženierzinātnēs hipotēžu pārbaudei, statistikas procesa kontrolei un datu analīzei. Lai gan ticamības intervālus ir iespējams aprēķināt ar roku, parasti ir vieglāk un daudz ātrāk izmantot specializētas statistikas programmas vai progresīvus grafiskos kalkulatorus.

Ja varbūtības apgalvojumu formā P(L≤θ≤U) = 1 – α var uzrakstīt tā, ka L un U ir tikai izlases datu funkcijas un θ ir parametrs, tad intervāls starp L un U ir ticamība. intervāls. Šo definīciju var formulēt intuitīvāk un praktiskāk, sakot, ka apgalvojums, ka parametrs θ atrodas ticamības intervālā, būs patiess 100(1 – α)% apgalvojuma izteikšanas reižu. Termins (1 – α) ir pazīstams kā ticamības koeficients.

Normāli sadalītas populācijas gadījumā ar zināmu vidējo μ un zināmu dispersiju σ2 100(1 – α) ticamības intervālu ap vidējo var aprēķināt ar vienādojumu x – zα/2σ/√n ≤ μ ≤ x + zα/ 2σ/√n, kurā zα/2 ir standarta normālā sadalījuma līknes augšējais 100α/2 procentu punkts. Šis ir vienkāršs gadījums, jo visas populācijas patiesais vidējais lielums un dispersija parasti nav zināmi.

Uzticamības intervāli visbiežāk tiek izmantoti, lai noteiktu, cik labi noteikts parametrs iekļaujas konkrētajā datu kopā. Piemēram, ja noteiktas datu kopas ticamības intervāls ir no 45 līdz 55 ar ticamības koeficientu 0.95, varētu apgalvot, ka jebkurš datu punkts, kas ietilpst šajā reģionā, ietilpst populācijā ar 95 procentu ticamību. Ticamības koeficienta palielināšana sašaurina intervālu, kas nozīmē, ka mazāku mainīgo lielumu diapazonu var izskaidrot ar lielāku pārliecību. Ticamības koeficienta samazināšana paplašina intervālu, bet samazina ticamību.

Dažiem lietojumiem, piemēram, normāli sadalītām populācijām ar zināmiem vidējiem un novirzēm, ticamības intervālu aprēķināšanai izmantotie vienādojumi ir viegli pieejami. Statistikas tabulas var izmantot, lai atrastu zα/2 vērtības. Citām lietojumprogrammām, piemēram, datu analīzei inženierzinātnēs, ir nepieciešamas sarežģītākas aprēķina metodes. Parasti ir praktiskāk izmantot statistikas programmu, lai noteiktu ticamības intervālus šiem gadījumiem. Statistikas programmas var būt īpaši noderīgas, ja datu kopas ir ārkārtīgi lielas un rezultāti ir jāuzrāda grafiski.