Mācīties statistiku, sākot no prezentācijas līdz datu izplatīšanas pasākumiem

Statistika ir matemātikas zinātne, kas pēta datu vākšanu, apstrādi, analīzi un prezentāciju. Statistika tiek plaši izmantota apdrošināšanas sabiedrībās, viena no tām ir prēmijas apmēra noteikšana apdrošināšanas polisē. Katram apdrošināšanas īpašniekam ir jāmaksā iemaksa, ko sauc par prēmiju. Samaksātā prēmija ir saskaņā ar viņa saņemto apdrošināšanas segumu.

Šeit apdrošināšanas sabiedrība izmanto statistiku, lai prēmijas summa būtu saskaņā ar apdrošināšanas īpašniekam nodrošināmā seguma apjomu. Tādā veidā abas puses no tā gūst labumu.

Kā jau iepriekš minēts, statistika ir ne tikai datu vākšana un apstrāde, bet arī datu sniegšana. Statistika datu apstrādē izmanto arī vairākus datu izplatīšanas pasākumus. Šodien mēs apspriedīsim prezentācijas veidus, kā arī datu izplatības lielumu statistikā.

Datu prezentācijas veidi

Datu iesniegšanas veidi statistikā ietver frekvences sadalījuma tabulas, histogrammas, daudzstūrus un ogīvus.

Pirmā datu prezentācijas forma ir frekvences sadalījuma tabulas izmantošana. Kā norāda nosaukums, mēs izmantojam tabulas, lai parādītu iegūto datu veidu un daudzumu. Frekvences sadalījuma tabulai ir arī vairāki veidi, proti, atsevišķu datu un grupu datu biežuma sadalījuma tabula.

(Lasiet arī: Divi mērījumu dati statistikā)

Vienu datu biežuma sadalījuma tabulu izmanto, lai parādītu nelielu datu apjomu, vismaz mazāk nekā 30 datus. Datu iesniegšanas, izmantojot vienu datu biežuma sadalījuma tabulu, piemērs ir šāds.

Tālāk sniegtie dati ir 30 studentu ieskaites rezultāti. Pasniedz vienā datu biežuma sadalījuma tabulā!

4 8 7 9 10 3 4 6 7 6 5 7 7 8 9 6 6 8 7 9 4 5 6 7 8 10 4 5 6 7

Ja mēs pievēršam uzmanību, zemākais iegūtais testa rezultāts ir 3, bet augstākais - 10. Tad no šiem rādītājiem tiek aprēķināts to studentu skaits, kuri to saņem. 3. pakāpē, piemēram, tikai 1 skolēns. 4. klasei ir 4 skolēni utt. Pēc tam šis skaitlis ir parādīts tabulā, piemēram, šādi.

turbīnas uz jūras vēja parka zemes

Nākamais frekvences sadalījuma tabulas veids ir grupas datu biežuma sadalījuma tabula. Šī tabula tiek izmantota, lai parādītu daudz datu, kas pārsniedz 30 datus. Apskatīsim zemāk redzamo piemēru.

Šis ir čili augu augstums (milimetros) čili plantācijā. Uzrādiet datus grupas datu izplatīšanas tabulā!

123 131 120 128 126 124 125 122

121 126 124 123 122 120 125 126

123 123 134 125 125 126 128 135

120 126 124 133 126 127 123 126

122 125 123 132 124 132 128 124

Atšķirībā no atsevišķiem datiem, šeit mums jāaprēķina klases un klases garums, kas tiks parādīts tabulā. Izmantojot iepriekš minētos datus, šeit ir aprēķini.

Daudz datu (n) = 40

Maksimālais augstums (x max ) = 135

Minimālais augstums (x min ) = 120

Diapazons (J) = x max  - x min = 135 - 120 = 15

Nodarbību skaits (k) = 1 + 3,3logn = 1 + 3,3 log40 = 6,2868… ≈ k = 6

Klases garums (c) = J / k = 15/6 = 2,5 ≈ c = 3

No šiem rezultātiem grupas datu izplatīšanas tabulu varam parādīt šādi.

turbīnas uz jūras vēja parka zemes

Tālāk mēs apspriedīsim citus grupas datu prezentācijas veidus, proti, histogrammu, frekvences daudzstūru un ogivu veidā. Apskatiet zemāk redzamo biežuma tabulu, kurā ir informācija par svaru 80 sporta kluba dalībniekiem.

turbīnas uz jūras vēja parka zemes

Lai parādītu datus, izmantojot histogrammas grafiku, vispirms mēs izveidojam Dekarta diagrammu. X ass parāda katras klases augšējo un apakšējo robežu, bet y ass - frekvenci.

statistika4 (1)

Atšķirībā no histogrammas, frekvences daudzstūra grafiks ņem klases intervāla vidējo vērtību un parāda to ar līnijām atbilstoši frekvencei.

statistika5 (1)

Visbeidzot, datu prezentācijā tiek izmantota pozitīva kumulatīvā vai negatīvā frekvences līkne. Vispirms uz y ass atzīmējiet katras intervāla klases kumulatīvās frekvences vērtības. Pēc tam atzīmējiet punktu koordinātas atbilstoši intervālu klases un kumulatīvās frekvences augšējiem ierobežotajiem pāriem. Pievienojiet punktus gludai līknei.

Datu izplatības lielums

Statistikā ir divu veidu datu mērīšana, proti, datu koncentrācijas lielums un datu izplatīšanas lielums. Kāds ir izskaidrojums un atšķirība?

Datu centra lielums ir vērtība, kas attēlo datu atrašanās vietu. Datu centrētajā mērā ir vidējais, režīms un mediāna.

Vidējais vai vidējais ir koeficients starp visu novēroto datu un lielu datu summu. Vidējo mēs varam formulēt šādi.

Vidējais = (visu datu summa) / (daudz datu)

Lai labāk saprastu, strādāsim pie šī piemēra problēmas. Stundu skaits nedēļā, kas 5 cilvēkiem vajadzīgs sociālajām aktivitātēm savā vidē, ir 10, 7, 13, 20 un 15 stundas. Nosakiet vidējo stundu skaitu nedēļā, ko viņi pavada sabiedriskām aktivitātēm!

Pamatojoties uz iepriekšminētajām problēmām, skaitļus formulā varam ievadīt šādi.

Vidējais = (10 + 7 + 13 + 20 + 15) / 5 = 65/5 = 13

Tas nozīmē, ka vidējais stundu skaits, ko viņi pavada sabiedriskām aktivitātēm, ir 13 stundas.

Bez vidējā vai vidējā ir arī režīmi. Režīms ir vērtība, kas visbiežāk parādās datos. Apskatīsim šādas problēmas piemēru.

Zemāk ir norādīti dažu 7. klases skolēnu svara dati (kilogramos). Nosakiet datu režīmu!

32, 35, 33, 32, 34, 31, 35, 35, 31, 34, 35, 3

Pirmkārt, mums ir jāuzskaita, cik reižu katra vērtība parādās datos. Pamatojoties uz šiem datiem, mēs iegūstam 31 (x3), 32 (x2), 33 (x1), 34 (x2) un 35 (x4). Tā kā 35 notiek visbiežāk, iepriekš minēto datu režīms ir 35.

Pēdējais centrēšanas pasākuma veids ir mediāna. Mediāna datus sadala divās vienādās daļās, tāpēc mediāna ir sakārtoto datu vidējā vērtība.

Lai noteiktu mediānu, mums vispirms ir jāšķiro visi dati augošā vai dilstošā secībā. Otrkārt, definējiet daudz datu un simbolizējiet to kā "n". Ja n ir nepāra, mūsu izmantotā formula ir šāda.

Mediāna = datu numurs - ((n + 1) / 2)

Tikmēr, ja n ir pāra, mēs izmantosim zemāk esošo formulu.

Mediāna = (dati i ar (n / 2) + dati i ar (n / 2 + 1)) / 2

Otrais datu mērījums statistikā ir datu izplatības mērs. Datu izplatīšanās lielums ir vērtība, kas norāda, cik tālu ir dati no datu centra. Datu izplatīšanas lielumu veido diapazons, kvartilis un starpkvartiles diapazons.

Diapazons ir starpība starp lielāko datu vērtību un mazāko datu vērtību. Sasniedzamību mēs varam iegūt, no mazākajiem datiem atņemot lielākos datus. Piemēram, ja vienā klasē garākā skolēna augstums ir 160 cm, bet īsākā - 143 cm, mēs sasniegsim 23 cm.

Tikmēr kvartile ir statistikas datu grupēšana četrās vienādās daļās. Kvartiles lielums ir sadalīts 3, proti, apakšējā kvartile (Q 1 ), vidējā kvartile (Q 2 vai mediāna) un augšējā kvartile (Q 3 ). Lai noteiktu katru kvartili, mums jāveic vairākas darbības.

Vispirms kārtojiet datus augošā vai dilstošā secībā. Otrkārt, nosakiet datu vidējo vai vidējo vērtību. Treškārt, nosakiet apakšējo kvartili (Q 1 ), kas ir datu grupas vidējā vērtība zem mediānas (Q 2) . Visbeidzot, nosakiet augšējo kvartili (Q 3 ), kas ir datu kopas vidējā vērtība virs mediānas (Q 2) .

Pēdējais datu izplatīšanas mēru veids ir starpkvartilu diapazons. Starpkvartilu diapazons ir atšķirība starp augšējo un apakšējo kvartili. Formula ir šāda.

Q d = Q 3 - Q 1