Kas ir histogrammu klases?

Histogrammu klases ir vērtību diapazoni, kas satur datu punktus biežuma sadalījumā vai neapstrādātu datu tabulā. Tos dēvē arī par intervāliem, tvertnēm vai tvertņu platumiem. Histogrammā, kas ir joslu diagrammas veids, šīs klases ir attēlotas kā vertikālas kolonnas, kur kolonnas augstums norāda datu punktu skaitu klases diapazonā. Parasti histogrammas klases izvēle tiek veikta, lai uzlabotu datu statistikas vai tendenču vizuālo attēlojumu.

Ja ir jāparāda liels datu apjoms, histogramma ir īpaši noderīga, lai attēlotu tās sadalījuma formu. Viss datu diapazons tiek sadalīts intervālos un tiek skaitīts datu punktu skaits, kas ietilpst katrā, lai iegūtu klases biežumu. Intervāla diapazons vai platums nosaka histogrammas klašu skaitu un ietekmē diagrammas formu.

Ja intervāls ir pārāk plašs, var tikt izlaista nozīmīga informācija, jo klases ir pārāk iekļaujošas. Ja intervāla platuma izvēle ir pārāk šaura, zemas klases frekvence var piešķirt pārmērīgu nozīmi tam, kas patiesībā ir nejauša variācija. Ir vairākas metodes, kā datu kopai iestatīt atbilstošu histogrammu klašu skaitu.

Atbilstoši Stērģa likumam klašu skaitam jābūt tuvu datu punktu skaita bāzes 2 log plus vienam. Izmantojot Raisa kārtulu, definēto klašu skaitam ir jābūt divreiz lielākam par datu punktu skaita kubsakni. Neatkarīgi no tā, kura metode tiek izmantota, izvēloties histogrammas klašu skaitu, ir jāizmēģina vairāki dažādi platumi, lai pārbaudītu histogrammas formas jutību pret klases lielumu. Pareizais klašu skaits ir tas, kas visprecīzāk attēlo datu sadalījumu.

Ja datu diapazonam ir piemērots histogrammu klašu skaits, jārada jēgpilns grafiskais attēlojums, kas nodrošina skaidru interpretāciju. Histogrammai ir jāparāda datu centrs un izplatība, jebkura novirze vai datu asimetrija, kā arī novirzes vai datu punkti, kas atrodas ārpus paredzamā vērtību diapazona. Režīmam vai visbiežāk sastopamajai vērtībai ir jābūt skaidrai, kā arī grupējumiem, kas varētu norādīt uz vairākām modalitātēm. Histogrammas analīze var arī norādīt uz kļūmēm datu vākšanas procesā.

Jau sen izmantotās finansēs un sociālajās zinātnēs, histogrammas kļūst arvien pazīstamākas plaša patēriņa elektronikas grafiskajos displejos. Digitālā fotogrāfija ir īpaši atvērta to izmantošanai, jo daudzās kamerās ir iekļauta krāsu histogramma, kas norāda baltā balansu un ekspozīciju. Digitālās fotogrāfijas histogrammā pikseļi var tikt parādīti arī kā histogrammas klases, kas attēlotas pret pelēkajiem toņiem.