Kvantitatīviem un arī kategoriāliem (kvalitatīviem) datiem liels skaits nesakārtotu datu nedod priekšstatu par to sadalījumu. Lai datus varētu analizēt, tie jāsakārto. Ir racionāli lielu daudzumu kvantitatīvu datu attēlot biežuma tabulā. Arī kategoriālai pazīmei atbilstošus datus var atspoguļot biežumu tabulā.
Piemērs:
Piemēram, vērojot pretimbraucošo automašīnu krāsu, iegūstam datus - t.i. katrai automašīnai atbilstošo krāsu.
Atbilstošā biežumu tabula izskatīsies šādi:
Krāsa | Balta | Melna | Sarkana | Zila |
Absolūtais biežums |
\(9\)
|
\(5\)
|
\(4\)
|
\(2\)
|
Skaitļi šajā tabulā nav dati, bet gan novērojumu skaits jeb biežums. Biežums ļauj spriest par datu sadalījumu.
Kvantitatīvu datu biežuma grafiskai attēlošanai izmanto arī histogrammas un poligonus.
Kvantitatīvu datu biežuma grafiskai attēlošanai izmanto arī histogrammas un poligonus.
Par histogrammu sauc diagrammu, kuru veido taisnstūri, kuru pamati ir vienādi ar biežuma klašu garumu, bet augstumi - ar attiecīgā intervāla absolūto vai relatīvo biežumu.
Zīmējot histogrammu, taisnstūru pamati parasti tiek atlikti uz horizontālās (abscisu) ass, bet augstumi - uz vertikālās (ordinātu) ass.
Piemērs:
Tika veikta vidusskolēnu aptauja (aptaujāti 80 skolēni) par naudas summām, ko viens skolēns vidēji tērē ikdienas pusdienu iegādei.
Iegūtie dati ir attēloti histogrammā:
Histogrammas parasti izvēlas nepārtrauktu un grupētu datu attēlošanai.
Svarīgi!
Histogrammas pirmā un pēdējā stabiņa platumu izvēlas vienādu ar pārējo stabiņu platumu, ja arī intervāla garums ir atšķirīgs.
Poligons ir lauzta līnija, kuras virsotnes koordinātu plaknē ir punkti, kuru abscisa ( koordināta) atbilst pazīmes vērtībai, bet ordināta ( koordināta) - šīs pazīmes vērtības biežumam.
Poligonu zīmējot, pieņemts abos poligona galos pievienot punktu, kurā biežums ir .
Piemērs:
11. klases skolēni kārtoja eksāmenu angļu valodā. Rezultāti ir attēloti biežuma tabulā, un, vadoties pēc tabulas datiem, ir konstruēts poligons.
Poligons:
Poligonu var konstruēt, izmantojot gan absolūto, gan relatīvo biežumu.
Piemērs:
Poligons, kurā izmantots relatīvais biežums:
Ja ir uzzīmēta datu histogramma, poligonu var iegūt, savienojot stabiņu augšējo malu viduspunktus un pirmā un pēdējā stabiņa apakšējās malas ārējās virsotnes.
Datu grafiskie attēli histogramma un poligons parāda datu sadalījumu datu kopā.
Sadalījums var būt dažāds. Salīdzini 1. un 2. attēlu!
Sadalījums var būt dažāds. Salīdzini 1. un 2. attēlu!
1. attēls. Histogramma
2. attēls. Histogramma
2. attēlā redzams, ka, atšķirībā no 1. attēla, dati izkārtojušies simetriski ap kopas vidējo vērtību, proti, dati vairāk koncentrējas sadalījuma vidū, turklāt histogrammas malējie stabiņi ir īsāki nekā tie, kas atrodas vidū.
Datus, kas histogrammā izkārtojas simetriski ap kopas vidējo vērtību, sauc par normāli sadalītiem datiem.
Ja līknei, kuru iegūst, apvelkot histogrammu, ir zvanveida forma, to sauc par normālā sadalījuma jeb Gausa līkni.
Gausa līknes forma ir atkarīga no diviem parametriem: vidējās vērtības un standartnovirzes .
1. Vidējās vērtības izmaiņas Gausa līkni pārvieto virzienā: ja pieaug, līkne pārvietojas pa labi, ja samazinās, - pa kreisi.
2. Standartnovirzes izmaiņas ietekmē līknes formu: standartnovirzes vērtībai pieaugot, līkne kļūst lēzenāka, bet, tai samazinoties - stāvāka.
Ar sarežģītām matemātiskām metodēm ir pierādīts, ka normāli sadalītiem datiem:
- 68,2% visu datu atrodas vienas standartnovirzes attālumā no vidējās vērtības
-
95,4% visu datu atrodas divu standartnoviržu attālumā no vidējās vērtības
-
99,7% (gandrīz visi) datu kopas elementi atrodas trīs standartnoviržu attālumā no vidējās vērtības.
Tātad, pareizi izvēloties izlasi (reprezentatīvu izlasi), aprēķinot standartnovirzi () un noskaidrojot izlases datu sadalījumu, var izdarīt secinājumus par pašu ģenerālkopu.
Bet jāatceras, ka ar statistiskas metodēm iegūtiem pētījumu rezultātiem nekad nebūs 100% ticamība.
Atsauce:
http://www.dzm.lu.lv/mat/IT/M_11/default.aspx@tabid=17&id=270.html