Kas ir šķībs sadalījums?

Šķībs sadalījums attiecas uz varbūtības sadalījumu, kas pēc būtības ir nevienmērīgs un asimetrisks. Atšķirībā no standarta normālā sadalījuma, kas pēc formas atgādina zvana līkni, šķībi sadalījumi tiek novirzīti uz vienu pusi, un tiem ir garāka aste vienā pusē attiecībā pret mediānas otru pusi. Līknes otrā pusē būs sagrupētas vērtību maksimums, kur atrodas lielākā daļa datu punktu. Šāda veida sadalījuma līkni parasti klasificē kā ar pozitīvu vai negatīvu novirzi atkarībā no līknes nobīdes virziena.

Parasti tiek uzskatīts, ka šķībam sadalījumam ir pozitīva novirze, ja līknes aste ir garāka labajā pusē, salīdzinot ar kreiso pusi. Šis šķībais sadalījums tiek saukts arī par šķību pa labi, jo labajā pusē ir plašāks datu punktu paplašinājums. Pozitīvām šķībām līknēm ir vislielākais vērtību skaits virzienā uz līknes kreiso pusi.

Turpretim negatīvi šķībiem sadalījumiem ir visvairāk datu punktu līknes labajā pusē. Šiem izliekumiem ir garākas astes kreisajā pusē, tāpēc tiek teikts, ka tie ir šķībi pa kreisi. Svarīgs noteikums, nosakot šķībuma virzienu, ir ņemt vērā astes garumu, nevis vidējā vai mediānas atrašanās vietu. Tas ir tāpēc, ka novirzi galu galā izraisa vistālāk esošās vērtības, kas izstiepj līkni uz šo diagrammas pusi.

Izpratne par šķībā sadalījuma īpašībām ir svarīga daudzos statistikas lietojumos. Daudzi cilvēki pieņem, ka dati seko zvana līknei jeb normālajam sadalījumam, tāpēc viņi arī pieņem, ka diagrammai nav nekādas novirzes. Tomēr šie pieņēmumi var likt viņiem nepareizi interpretēt informāciju par faktisko sadalījumu.

Šķībs sadalījums pēc būtības ir nevienmērīgs, tāpēc tas neatbilst standarta normāliem modeļiem, piemēram, standarta novirzei. Normālie sadalījumi ietver vienu standarta novirzi, kas attiecas uz abām līknes pusēm, bet šķībajiem sadalījumiem katrai līknes pusei būs atšķirīgas standarta novirzes vērtības. Tas ir tāpēc, ka abas puses nav viena otras spoguļattēli, tāpēc vienādojumus, kas apraksta vienu pusi, nevar attiecināt uz otru. Standarta novirzes vērtība parasti ir lielāka pusei ar garāko asti, jo šajā pusē ir plašāka datu izplatība, salīdzinot ar īsāku asti.