Datu grafiskie attēli histogramma un poligons parāda datu sadalījumu visā datu kopā.
Sadalījums var būt dažāds. Salīdzini 1. un 2. attēlu!
 
4.svg
1. attēls. Histogramma I

 5.svg
2. attēls. Histogramma II

2. attēlā redzams, ka, atšķirībā no 1. attēla, dati izkārtojušies simetriski ap kopas vidējo vērtību, proti, dati vairāk koncentrējas sadalījuma vidū, turklāt histogrammas malējie stabiņi ir īsāki nekā tie, kas atrodas vidū.
Datus, kas histogrammā sakārtojas simetriski ap kopas vidējo vērtību, sauc par normāli sadalītiem datiem.
Normālsadalījums ir matemātisks jēdziens, kas raksturo nejaušībai pakļautu notikumu iestāšanās relatīvo biežumu.
 
Ja līknei, kuru iegūst, apvelkot histogrammu, ir zvanveida forma, to sauc par normālā sadalījuma jeb Gausa līkni. Citiem vārdiem - normālā sadalījuma poligons ir Gausa līkne.

6.svg
Gausa līknes forma ir atkarīga no diviem parametriem: vidējās vērtības x¯ un standartnovirzes s.
1. Vidējās vērtības izmaiņas Gausa līkni pārvieto Ox virzienā: ja x¯ pieaug, līkne pārvietojas pa labi, ja x¯ samazinās, - pa kreisi.
2. Standartnovirzes izmaiņas ietekmē līknes formu: standartnovirzes vērtībai pieaugot, līkne kļūst lēzenāka, bet, tai samazinoties, - stāvāka.       
                                                                    
12581png.png
Ja mēs aplūkotu piemēru, kurā pa dienām pētīti naudas ieņēmumi kādā veikalā, tad mazas standartnovirzes gadījumā varētu teikt, ka ieņēmumi katru dienu ir ļoti līdzīgi. Ja standartnovirze ir liela, tad ienākumi nav stabili, pa dienām tie ir ļoti atšķirīgi.
 
Normālā sadalījuma gadījumā ir zināmas likumsakarības, cik daudz procentu no visām variantēm atrodas intervālos x¯±s, x¯±2s, x¯±3s.
 
Normāli sadalītiem datiem ir spēkā normālsadalījuma \(1; 2\) un \(3\) standartnoviržu likums (empīriskais likums):
  • \(68,28\)% visu datu atrodas vienas standartnovirzes attālumā no vidējās vērtības: x¯±s.
  • \(95,45\)% visu datu atrodas divu standartnoviržu attālumā no vidējās vērtības: x¯±2s.
  • \(99,73\)% (gandrīz visi) datu kopas elementi atrodas trīs standartnoviržu attālumā no vidējās vērtības: x¯±3s.
Parasti šos procentus noapaļo līdz desmitdaļām.
 
1258_2.svg
  
Pareizi izvēloties izlasi (reprezentatīvu izlasi), aprēķinot standartnovirzi (s) un noskaidrojot izlases datu sadalījumu, var izdarīt secinājumus par pašu populāciju (ģenerālkopu).

Bet jāatceras, ka ar statistiskas metodēm iegūtiem pētījumu rezultātiem nekad nebūs \(100\)% ticamība.
Piemērs:
12.b klases skolēni eksāmenā vidēji ieguva \(80\) punktus un to standartnovirze bija \(3\) punkti. Izmantojot empīrisko likumu, novērtē eksāmena rezultātus, ja zināms, ka tiem ir normālais sadalījums.
 
Dots: x¯=80;s=3.
1) Pēc empīriskā likuma, \(68,3\)% visu datu atrodas vienas standartnovirzes attālumā no vidējā aritmētiskā
x¯s=803=77 punkti,
x¯+s=80+3=83 punkti.
Tātad \(68,3\)% skolēnu eksāmenā iegūto punktu skaits atrodas intervālā (\(77;83\)).
 
2) \(95,5\)% visu datu atrodas divu standartnoviržu attālumā no vidējās vērtības.
x¯2s=8023=74 punkti,
x¯+2s=80+6=86 punkti.
Tātad \(95,5\)% skolēnu eksāmenā iegūto punktu skaits atrodas intervālā (\(74;86\)).
 
3) \(99,7\)% visu datu atrodas divu standartnoviržu attālumā no vidējās vērtības.
x¯+3s=80+33=89 punkti,
x¯3s=809=71 punkts.
 
Tātad \(99,7\)% skolēnu eksāmenā iegūto punktu skaits atrodas intervālā (\(71;89\)).
Papildini zināšanas!
Mācību video, kurā vari uzzināt vairāk par normālsadalījumu un standartnovirzes pielietojumu (11 min).
 
Vingrinies šīs tēmas 9.-12. uzdevumu! Izpēti atbilžu soļus!
Atsauce:
 
Materiālu sagatavoja Mg. math. Laima Baltiņa
http://www.dzm.lu.lv/mat/IT/M_11/default.aspx@tabid=17&id=270.html
Mācību video