Kas ir histogrammas sadalījums?

Histogrammas sadalījums statistikā attiecas uz vienfaktoru datu joslu modeļiem, formām un atrašanās vietām histogrammā. To, kā un kur joslas tiek sadalītas, var izmantot, lai analizētu datus un izdarītu secinājumus par tiem. Histogrammas sadalījuma analīze ir svarīga, lai identificētu tādas pazīmes kā datu normalitāte, multimodāls sadalījums un šķībi dati.

Histogramma ir viendimensionāls datu displejs, kurā tiek izmantoti taisnstūri, kas proporcionāli laukumam ir klases vai tvertnes frekvencēm, lai vizuāli parādītu datu pazīmes. Datu punkti histogrammā ir sakārtoti tvertnēs, un pats histogrammas sadalījums ir vizuāls datu frekvences sadalījuma vai varbūtības blīvuma funkcijas tuvinājums. Sadalījuma forma var mainīties atkarībā no tvertņu skaita.

Histogrammas sadalījuma analīze bieži tiek izmantota kā kvalitatīva datu normalitātes pārbaude. Lai gan pastāv analītiskās metodes normalitātes noteikšanai, histogrammas var izmantot, lai nodrošinātu ātru, veselā saprāta pārbaudi, lai ietaupītu laiku. Ja histogrammas dati šķiet aptuveni vienmērīgi un centrēti uz vidējo, dati tiek uzskatīti par normāliem. Lai gan šāda veida kvalitatīvā pārbaude ir ātra un salīdzinoši vienkārša, tā ir subjektīva, un, ja nepieciešams augstāks precizitātes standarts, jāizmanto analītiskās metodes.

Vēl viens veids, kā var izmantot histogrammas sadalījuma analīzi, ir noteikt, vai datu kopai ir šķībums. Datu šķībums tiek definēts kā izteikta asimetrija datos. Negatīva novirze vai novirze pa kreisi ir redzama datu kopās ar ļoti mazām vērtībām. Pozitīva novirze vai šķībība pa labi notiek datu kopās ar dažām augstām vērtībām. Histogrammas sadalījuma novērošana var atklāt novirzes un novirzītus datus.

Papildus datu īpašību atklāšanai ar vienu režīmu histogrammas forma var atklāt arī multimodālu datu raksturlielumus. Multimodālās datu kopās ir vairāk nekā viens režīms, un to raksturo frekvenču sadalījums, kam ir vairāk nekā viens maksimums vai maksimums. Politiskā piederība pilsētā, sabiedriskās domas aptaujas un bišu ķermeņa izmēri ir datu kopu piemēri, kas var būt multimodāli. Histogrammas formas novērošana un dažādu pīķu atzīmēšana multimodālos datos bieži vien var sniegt pētniekam plašāku ieskatu nekā vienkārši viendimensiju statistikas aprēķini.

Histogrammu analīze un datu sadalījums ir ļoti atkarīgs no izvēlētā tvertnes izmēra. Praksē tvertņu skaitu var novērtēt, ņemot kvadrātsakni no novērojumu skaita, lai gan var izmantot arī citus tvertņu izmērus. Piemēram, skolotājs var izvēlēties analizēt pārbaudes atzīmes, izvēloties tvertnes izmērus, kas atspoguļo burtu atzīmes.