CLOPOTUL

Sunt cei care citesc aceasta stire inaintea ta.
Abonați-vă pentru a primi cele mai recente articole.
E-mail
Nume
Nume de familie
Cum ți-ar plăcea să citești Clopoțelul
Fără spam

Un loc aparte în analiza statistică îl revine determinării nivelului mediu al trăsăturii sau fenomenului studiat. Nivel mediu trăsăturile sunt măsurate prin valori medii.

Valoarea medie caracterizează nivelul cantitativ general al trăsăturii studiate și este o proprietate de grup a populației statistice. Ea nivelează, slăbește abateri aleatorii observații individuale într-o direcție sau alta și evidențiază principala proprietate tipică a trăsăturii studiate.

Mediile sunt utilizate pe scară largă:

1. Pentru evaluarea stării de sănătate a populației: caracteristici ale dezvoltării fizice (înălțime, greutate, circumferință cufăr etc.), identificând prevalența și durata diferitelor boli, analizând indicatorii demografici (mișcarea naturală a populației, speranța medie de viață, reproducerea populației, populația medie etc.).

2. Să studieze activitățile instituțiilor medicale, ale personalului medical și să evalueze calitatea muncii acestora, planificarea și determinarea nevoilor populației din tipuri variateîngrijiri medicale (număr mediu de cereri sau vizite pe locuitor pe an, durata medie a șederii unui pacient într-un spital, durata medie a examinării unui pacient, asigurarea medie cu medici, paturi etc.).

3. Să se caracterizeze starea sanitară și epidemiologică (puritatea medie a aerului din atelier, suprafața medie per persoană, consumul mediu de proteine, grăsimi și carbohidrați etc.).

4. Să determine parametrii medicali și fiziologici în sănătate și boală, la prelucrarea datelor de laborator, pentru a stabili fiabilitatea rezultatelor studiu eșantionîn studii socio-igiene, clinice, experimentale.

Calculul valorilor medii se realizează pe baza seriilor de variații. Seria de variații- acesta este un set statistic omogen calitativ, ale cărui unități individuale caracterizează diferențele cantitative ale trăsăturii sau fenomenului studiat.

Variația cantitativă poate fi de două tipuri: discontinuă (discretă) și continuă.

Un semn discontinuu (discret) este exprimat doar ca un număr întreg și nu poate avea valori intermediare (de exemplu, numărul de vizite, populația site-ului, numărul de copii din familie, severitatea bolii în puncte). , etc.).

Un semn continuu poate lua orice valoare în anumite limite, inclusiv cele fracționale, și este exprimat doar aproximativ (de exemplu, greutatea - pentru adulți poate fi limitată la kilograme, iar pentru nou-născuți - grame; înălțime, tensiune arterială, timp cheltuită pentru a vedea un pacient etc.).



Valoarea digitală a fiecărei caracteristici sau fenomene individuale incluse în seria de variații se numește variantă și este indicată prin litera V . Există și alte notații în literatura matematică, de exemplu X sau y.

O serie variațională, în care fiecare opțiune este indicată o dată, se numește simplă. Astfel de serii sunt folosite în majoritatea problemelor statistice în cazul prelucrării informatice a datelor.

Cu o creștere a numărului de observații, de regulă, există valori repetate ale variantei. În acest caz, se creează serie de variații grupate, unde este indicat numărul de repetări (frecvența, notat cu litera " R »).

Serii de variații clasificate constă din opțiuni dispuse în ordine crescătoare sau descrescătoare. Atât seriale simple, cât și cele grupate pot fi compuse cu clasament.

Seria de variație de interval sunt realizate în scopul simplificării calculelor ulterioare efectuate fără utilizarea calculatorului, cu un număr foarte mare de unități de observație (mai mult de 1000).

Serii cu variații continue include valorile variante, care pot fi orice valoare.

Dacă în seria de variații valorile atributului (opțiunilor) sunt date sub formă de numere specifice separate, atunci o astfel de serie se numește discret.

Caracteristici generale valorile trăsăturii reflectate în seria de variații sunt valori medii. Dintre acestea, cele mai utilizate sunt: ​​media aritmetică M, Modă lu si mediana pe mine. Fiecare dintre aceste caracteristici este unică. Ele nu se pot înlocui unul pe altul și numai în ansamblu, destul de complet și într-o formă concisă, sunt caracteristicile serie de variații.

Modă (lu) numiți valoarea opțiunilor care apar cel mai frecvent.

Median (pe mine) este valoarea variantei care împarte seria variațională în intervale la jumătate (pe fiecare parte a medianei există o jumătate din variantă). În cazuri rare, când există o serie de variații simetrice, modul și mediana sunt egale între ele și coincid cu valoarea mediei aritmetice.

Cea mai tipică caracteristică a valorilor variantelor este medie aritmetică valoare( M ). În literatura de matematică, se notează .

Media aritmetică (M, ) este o caracteristică cantitativă generală a unei anumite trăsături a fenomenelor studiate, care alcătuiesc un agregat statistic omogen calitativ. Distinge între media aritmetică simplă și media ponderată. Media aritmetică simplă se calculează pentru o serie variațională simplă prin însumarea tuturor opțiunilor și împărțirea acestei sume la numărul total de opțiuni incluse în această serie variațională. Calculele se efectuează după formula:

Unde: M - medie aritmetică simplă;

Σ V - optiunea de suma;

n- numărul de observații.

În seria de variații grupate, se determină o medie aritmetică ponderată. Formula de calcul a acestuia:

Unde: M - medie ponderată aritmetică;

Σ vp - suma produselor unei variante pe frecvenţele acestora;

n- numărul de observații.

Cu un număr mare de observații în cazul calculelor manuale se poate folosi metoda momentelor.

Media aritmetică are următoarele proprietăți:

suma abaterilor variantei de la medie ( Σ d ) este egal cu zero (vezi Tabelul 15);

La înmulțirea (împarte) toate opțiunile cu același factor (divizor), media aritmetică este înmulțită (împărțită) cu același factor (divizor);

Dacă adăugați (scădeți) același număr la toate opțiunile, media aritmetică crește (descrește) cu același număr.

Mediile aritmetice, luate singure, fără a ține cont de variabilitatea seriei din care sunt calculate, pot să nu reflecte pe deplin proprietățile seriei de variații, mai ales atunci când este necesară compararea cu alte medii. Valorile medii apropiate ca valoare pot fi obținute din serii cu diferite grade de împrăștiere. Cu cât sunt mai aproape unele de altele opțiunile individuale din lor caracteristică cantitativă, mai putin împrăștiere (fluctuație, variabilitate) serie, cu atât media este mai tipică.

Principalii parametri care permit evaluarea variabilității unei trăsături sunt:

· domeniul de aplicare;

Amplitudine;

· Deviație standard;

· Coeficientul de variație.

Aproximativ, fluctuația unei trăsături poate fi judecată după sfera și amplitudinea seriei de variații. Intervalul indică opțiunile maxime (V max) și minime (V min) din serie. Amplitudinea (A m) este diferența dintre aceste opțiuni: A m = V max - V min .

Principala măsură, general acceptată, a fluctuației seriei variaționale sunt dispersie (D ). Dar cel mai des este folosit parametrul mai convenabil, calculat pe baza varianței - abaterea standard ( σ ). Se ține cont de valoarea abaterii ( d ) a fiecărei variante a seriei de variații din media ei aritmetică ( d=V - M ).

Deoarece abaterile variantei de la medie pot fi pozitive și negative, atunci când sunt însumate, dau valoarea „0” (S d=0). Pentru a evita acest lucru, valorile abaterii ( d) sunt ridicate la a doua putere și mediate. Astfel, varianța seriei variaționale este pătratul mediu al abaterilor variantei de la media aritmetică și se calculează prin formula:

Este cea mai importantă caracteristică a variabilității și este folosită pentru a calcula multe teste statistice.

Deoarece varianța este exprimată ca pătratul abaterilor, valoarea ei nu poate fi utilizată în comparație cu media aritmetică. În aceste scopuri, este utilizat deviație standard, care este notat cu semnul „Sigma” ( σ ). Caracterizează abaterea medie a tuturor variantelor seriei de variații de la media aritmetică în aceleași unități ca și media în sine, astfel încât acestea pot fi utilizate împreună.

Abaterea standard este determinată de formula:

Această formulă se aplică pentru numărul de observații ( n ) este mai mare decât 30. Cu un număr mai mic n valoarea deviației standard va avea o eroare asociată cu părtinirea matematică ( n - unu). În acest sens, un rezultat mai precis poate fi obținut luând în considerare o astfel de părtinire în formula de calcul a abaterii standard:

deviație standard (s ) este o estimare a abaterii standard a variabilei aleatoare X cu privire la ea așteptări matematice bazată pe o estimare imparțială a varianței sale.

Pentru valori n > 30 deviație standard ( σ ) și abaterea standard ( s ) va fi la fel ( σ=s ). Prin urmare, în majoritatea ajutoare practice aceste criterii sunt considerate a fi diferite.În Excel, calculul abaterii standard se poate face cu funcția =STDEV(interval). Și pentru a calcula abaterea standard, trebuie să creați o formulă adecvată.

Rădăcina pătrată medie sau abaterea standard vă permite să determinați cât de mult pot diferi valorile unei caracteristici de valoarea medie. Să presupunem că există două orașe cu aceeași temperatură medie zilnică vara. Unul dintre aceste orașe este situat pe coastă, iar celălalt pe continent. Se știe că în orașele situate pe coastă, diferențele de temperaturi în timpul zilei sunt mai mici decât în ​​orașele situate în interior. Prin urmare, abaterea standard a temperaturilor diurne din apropierea orașului de coastă va fi mai mică decât cea a celui de-al doilea oraș. În practică, aceasta înseamnă că temperatura medie a aerului pentru fiecare zi particulară într-un oraș situat pe continent va diferi mai mult de valoarea medie decât într-un oraș de pe coastă. În plus, abaterea standard face posibilă estimarea posibilelor abateri de temperatură de la medie cu nivelul necesar de probabilitate.

Conform teoriei probabilității, în fenomenele care se supun legii distribuției normale, există o relație strictă între valorile mediei aritmetice, abaterea standard și opțiuni ( regula trei sigma). De exemplu, 68,3% din valorile unui atribut variabil sunt în M ± 1 σ , 95,5% - în M ± 2 σ și 99,7% - în M ± 3 σ .

Valoarea abaterii standard face posibilă aprecierea naturii omogenității seriei de variații și a grupului studiat. Dacă valoarea abaterii standard este mică, atunci aceasta indică o omogenitate suficient de mare a fenomenului studiat. Media aritmetică în acest caz ar trebui recunoscută ca fiind destul de caracteristică acestei serii variaționale. Totuși, de asemenea valoare mică sigma face să se gândească la selecția artificială a observațiilor. Cu o sigma foarte mare, media aritmetică caracterizează seria de variații într-o măsură mai mică, ceea ce indică o variabilitate semnificativă a trăsăturii sau fenomenului studiat sau eterogenitatea grupului de studiu. Cu toate acestea, compararea valorii abaterii standard este posibilă numai pentru semne de aceeași dimensiune. Într-adevăr, dacă comparăm diversitatea de greutate a nou-născuților și a adulților, vom obține întotdeauna valori sigma mai mari la adulți.

Compararea variabilității caracteristicilor de diferite dimensiuni poate fi efectuată folosind coeficient de variație. Exprimă diversitatea ca procent din medie, ceea ce permite compararea diferitelor trăsături. Coeficientul de variație în literatura medicală este indicat de semnul " DIN ", iar în matematică" v» și calculat prin formula:

Valorile coeficientului de variație mai mici de 10% indică o împrăștiere mică, de la 10 la 20% - aproximativ în medie, mai mult de 20% - aproximativ o împrăștiere puternică în jurul mediei aritmetice.

Media aritmetică este de obicei calculată din date cadru de prelevare. Cu studii repetate sub influența unor fenomene aleatorii, media aritmetică se poate modifica. Acest lucru se datorează faptului că, de regulă, doar o parte din posibilele unități de observație, adică o populație eșantion, este investigată. Informații despre toate unitățile posibile reprezentând fenomenul studiat pot fi obținute prin studierea întregii populații generale, ceea ce nu este întotdeauna posibil. Totodată, pentru generalizarea datelor experimentale prezintă interes valoarea mediei în populaţia generală. Așadar, pentru a formula o concluzie generală despre fenomenul studiat, rezultatele obținute pe baza unui eșantion de populație trebuie transferate populației generale prin metode statistice.

Pentru a determina gradul de coincidență dintre studiul eșantionului și populația generală, este necesar să se estimeze cantitatea de eroare care apare inevitabil în timpul observării eșantionului. O astfel de eroare se numește eroare de reprezentativitate” sau „Eroarea medie a mediei aritmetice”. Este de fapt diferența dintre mediile obținute din eșantion observatie statistica, și valori similare care s-ar obține într-un studiu continuu al aceluiași obiect, i.e. la studierea populaţiei generale. Deoarece media eșantionului este o variabilă aleatorie, o astfel de prognoză se face cu un nivel acceptabil de probabilitate pentru cercetător. În cercetarea medicală, este de cel puțin 95%.

Eroarea de reprezentativitate nu trebuie confundată cu erorile de înregistrare sau erorile de atenție (greșeli de tipărire, calcule greșite, greșeli de tipărire etc.), care trebuie reduse la minimum printr-o metodologie și instrumente adecvate utilizate în experiment.

Mărimea erorii de reprezentativitate depinde atât de mărimea eșantionului, cât și de variabilitatea trăsăturii. Cu cât numărul de observații este mai mare, cu atât eșantionul este mai aproape de populația generală și cu atât eroarea este mai mică. Cu cât caracteristica este mai variabilă, cu atât eroarea statistică este mai mare.

În practică, următoarea formulă este utilizată pentru a determina eroarea de reprezentativitate în seriile variaționale:

Unde: m – eroare de reprezentativitate;

σ - deviație standard;

n este numărul de observații din eșantion.

Din formula se vede că mărimea eroare medie este direct proporțională cu abaterea standard, adică cu variabilitatea trăsăturii studiate, și invers proporțională cu rădăcina pătrată a numărului de observații.

În timp ce face analize statistice bazat pe calcul valori relative construirea unei serii variaţionale este opţională. În acest caz, determinarea erorii medii pentru indicatorii relativi poate fi efectuată folosind o formulă simplificată:

Unde: R- valoarea indicatorului relativ, exprimată în procente, ppm etc.;

q- reciproca lui P și exprimată ca (1-P), (100-P), (1000-P), etc., în funcție de baza pentru care se calculează indicatorul;

n este numărul de observații din eșantion.

Cu toate acestea, formula indicată pentru calcularea erorii de reprezentativitate pentru valori relative poate fi aplicată numai atunci când valoarea indicatorului este mai mică decât baza acestuia. Într-un număr de cazuri de calculare a indicatorilor intensivi, această condiție nu este îndeplinită, iar indicatorul poate fi exprimat ca un număr mai mare de 100% sau 1000%o. Într-o astfel de situație, se construiește o serie de variații și se calculează eroarea de reprezentativitate folosind formula valorilor medii bazată pe abaterea standard.

Prognoza valorii mediei aritmetice în populația generală se realizează cu indicarea a două valori - minim și maxim. Aceste valori extreme ale posibilelor abateri, în cadrul cărora poate fluctua valoarea medie dorită a populației generale, se numesc „ Granițele de încredere».

Postulatele teoriei probabilității au demonstrat că, cu o distribuție normală a unei trăsături cu o probabilitate de 99,7%, valorile extreme ale abaterilor mediei nu vor depăși valoarea triplei erori de reprezentativitate ( M ± 3 m ); în 95,5% - nu mai mult decât valoarea erorii medii dublate a valorii medii ( M ±2 m ); în 68,3% - nu mai mult decât valoarea unei erori medii ( M ± 1 m ) (Fig. 9).

P%

Orez. 9. Densitatea de probabilitate distributie normala.

Rețineți că afirmația de mai sus este adevărată numai pentru o caracteristică care respectă legea distribuției gaussiene normale.

Majoritate studii experimentale, inclusiv în domeniul medicinei, este asociat cu măsurători, ale căror rezultate pot lua aproape orice valoare într-un interval dat, prin urmare, de regulă, acestea sunt descrise de un model de variabile aleatoare continue. În acest sens, majoritatea metodelor statistice iau în considerare distribuțiile continue. Una dintre aceste distribuții, care joacă un rol fundamental în statistica matematică, este distribuție normală sau gaussiană.

Acest lucru se datorează mai multor motive.

1. În primul rând, multe observații experimentale pot fi descrise cu succes folosind o distribuție normală. Trebuie remarcat imediat că nu există distribuții de date empirice care ar fi exact normale, deoarece o distribuție normală valoare aleatorie este în intervalul de la până la , ceea ce nu apare niciodată în practică. Cu toate acestea, distribuția normală este foarte adesea o bună aproximare.

Indiferent dacă se efectuează măsurători ale greutății, înălțimii și alți parametri fiziologici ai corpului uman - peste tot un număr foarte mare de factori aleatori (cauze naturale și erori de măsurare) influențează rezultatele. Și, de regulă, efectul fiecăruia dintre acești factori este nesemnificativ. Experiența arată că rezultatele în astfel de cazuri vor fi distribuite aproximativ normal.

2. Multe distribuții asociate unui eșantion aleatoriu, cu o creștere a volumului acestuia din urmă, devin normale.

3. Distribuția normală este potrivită ca descriere aproximativă a altora distribuții continue(de exemplu, asimetric).

4. Distribuția normală are o serie de proprietăți matematice favorabile, care au asigurat în mare măsură utilizarea sa pe scară largă în statistică.

În același timp, trebuie menționat că în datele medicale există multe distribuții experimentale care nu pot fi descrise de modelul de distribuție normală. Pentru a face acest lucru, statisticile au dezvoltat metode care sunt denumite în mod obișnuit „Nonparametric”.

Alegerea unei metode statistice care este potrivită pentru prelucrarea datelor unui anumit experiment ar trebui făcută în funcție de faptul dacă datele obținute aparțin legii distribuției normale. Testarea ipotezelor pentru subordonarea unui semn la legea distribuției normale se realizează folosind o histogramă a distribuției de frecvență (grafic), precum și o serie de criterii statistice. Printre ei:

Criteriul de asimetrie ( b );

Criterii de verificare a curtozei ( g );

criteriul Shapiro–Wilks ( W ) .

Pentru fiecare parametru se efectuează o analiză a naturii distribuției datelor (se mai numește și test pentru normalitatea distribuției). Pentru a aprecia cu încredere conformitatea distribuției parametrilor cu legea normală, este necesar un număr suficient de mare de unități de observație (cel puțin 30 de valori).

Pentru o distribuție normală, criteriile de asimetrie și curtoză iau valoarea 0. Dacă distribuția este deplasată la dreapta b > 0 (asimetrie pozitivă), cu b < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае legea normală g =0. La g > 0 curba de distribuţie este mai clară dacă g < 0 пик более сглаженный, чем функция нормального распределения.

Pentru a testa normalitatea folosind testul Shapiro-Wilks, este necesar să se găsească valoarea acestui criteriu folosind tabele statistice la nivelul de semnificație cerut și în funcție de numărul de unități de observație (grade de libertate). Anexa 1. Ipoteza normalității este respinsă pentru valori mici ale acestui criteriu, de regulă, pentru w <0,8.

Un set de obiecte sau fenomene unite printr-o trăsătură sau proprietate comună de natură calitativă sau cantitativă se numește obiect de observatie .

Orice obiect de observație statistică este format din elemente separate - unități de observație .

Rezultatele observației statistice sunt informații numerice - date . Date statistice - acestea sunt informații despre ce valori a luat trăsătura de interes pentru cercetător în populația statistică.

Dacă valorile unei caracteristici sunt exprimate ca numere, atunci caracteristica este apelată cantitativ .

Dacă o trăsătură caracterizează o proprietate sau o stare a elementelor populației, atunci trăsătura este numită calitate .

Dacă toate elementele populației sunt supuse studiului (observare continuă), atunci se numește populația statistică general.

Dacă o parte din elementele populației generale este supusă cercetării, atunci se numește populația statistică selectiv (selectiv) . Un eșantion din populație este extras aleatoriu, astfel încât fiecare dintre cei n membri ai eșantionului să aibă șanse egale de a fi selectat.

Valorile atributului se modifică (variază) la trecerea de la un element al populației la altul, prin urmare, în statistică, diferite valori ale atributului sunt numite și Opțiuni . Opțiunile sunt de obicei notate cu litere mici latine x, y, z.

Se numește numărul ordinal al variantei (valoarea caracteristică). rang . x 1 - prima opțiune (prima valoare a caracteristicii), x 2 - a doua opțiune (a doua valoare a caracteristicii), x i - i-a opțiune (i-a valoare a caracteristicii).

O serie de valori de atribut (opțiuni) ordonate în ordine crescătoare sau descrescătoare cu ponderile lor corespunzătoare se numesc serie de variații (serie de distribuție).

La fel de cântare apar frecvente sau frecvente.

Frecvență(m i) arată de câte ori apare cutare sau cutare variantă (valoarea caracteristicii) în populația statistică.

Frecvența sau frecvența relativă(w i) arată ce proporție din unitățile populației au una sau alta variantă. Frecvența este calculată ca raport dintre frecvența uneia sau alteia variante și suma tuturor frecvențelor din serie.

. (6.1)

Suma tuturor frecvențelor este 1.

. (6.2)

Serii variaționale sunt discrete și interval.

Serii de variații discrete ele sunt de obicei construite în cazul în care valorile caracteristicii studiate pot diferi unele de altele prin cel puțin o valoare finită.

În serii variaționale discrete, sunt specificate valorile punctuale ale unei caracteristici.

Vederea generală a seriei de variații discrete este prezentată în Tabelul 6.1.

Tabelul 6.1

unde i = 1, 2, … , l.

În seriile de variație de interval în fiecare interval, se disting limitele superioare și inferioare ale intervalului.

Se numește diferența dintre limitele superioare și inferioare ale intervalului diferență de interval sau lungimea (mărimea) intervalului .

Valoarea primului interval k 1 este determinată de formula:

k 1 = a 2 - a 1;

a doua: k 2 = a 3 - a 2; …

ultimul: k l = a l - a l -1 .

În general diferență de interval k i se calculează prin formula:

k i \u003d x i (max) - x i (min) . (6,3)

Dacă un interval are ambele limite, atunci se numește închis .

Primul și ultimul interval pot fi deschis , adică au doar o chenar.

De exemplu, primul interval poate fi specificat ca „până la 100”, al doilea - „100-110”, ... , penultimul - „190-200”, ultimul - „200 și mai mult”. Este evident că primul interval nu are limită inferioară, iar ultimul nu are limită superioară, ambele sunt deschise.

Adesea, intervalele deschise trebuie să fie închise condiționat. Pentru a face acest lucru, de obicei valoarea primului interval este luată egală cu valoarea celui de-al doilea, iar valoarea ultimului - valoarea penultimului. În exemplul nostru, valoarea celui de-al doilea interval este 110-100=10, prin urmare, limita inferioară a primului interval va fi condiționat 100-10=90; valoarea penultimului interval este 200-190=10, prin urmare, limita superioară a ultimului interval va fi convențional 200+10=210.

În plus, intervale de lungimi diferite pot apărea în seria de variație a intervalului. Dacă intervalele din seria de variații au aceeași lungime (diferență de interval), se numesc egale ca mărime , in caz contrar - inegal.

Când se construiește o serie de variații de interval, se pune adesea problema alegerii mărimii intervalelor (diferența de interval).

Pentru a determina dimensiunea optimă a intervalelor (în cazul în care o serie este construită cu intervale egale), aplicați Formula Sturgess:

, (6.4)

unde n este numărul de unități de populație,

x (max) și x (min) - cele mai mari și cele mai mici valori ale variantelor seriei.

Pentru a caracteriza seria variațională, împreună cu frecvențele și frecvențele, se folosesc frecvențele și frecvențele acumulate.

Frecvențe cumulate (Frecvențe) arătați câte unități ale populației (ce parte din ele) nu depășesc o valoare dată (opțiune) x.

Frecvențele acumulate ( v i) conform seriei discrete, datele pot fi calculate folosind următoarea formulă:

. (6.5)

Pentru o serie de variații de interval, aceasta este suma frecvențelor (frecvențelor) tuturor intervalelor care nu îl depășesc pe acesta.

O serie variațională discretă poate fi reprezentată grafic folosind distribuţia poligonală a frecvenţelor sau a frecvenţelor.

Când se construiește un poligon de distribuție, valorile atributului (opțiuni) sunt reprezentate de-a lungul axei absciselor, iar frecvențele sau frecvențele sunt reprezentate de-a lungul axei ordonatelor. La intersecția valorilor caracteristice și frecvențele lor corespunzătoare (frecvențele), sunt trasate puncte, care, la rândul lor, sunt conectate prin segmente. Linia întreruptă astfel obținută se numește poligonul distribuției de frecvențe (frecvențe).

x k
x2
x 1 x i


Orez. 6.1.

Serii variaționale de intervale pot fi reprezentate grafic folosind histogramelor, adică diagramă cu bare.

Când se construiește o histogramă de-a lungul abscisei, sunt reprezentate grafic valorile caracteristicii studiate (limitele intervalului).

În cazul în care intervalele sunt de aceeași dimensiune, frecvențele sau frecvențele pot fi reprezentate de-a lungul axei y.

Dacă intervalele au valori diferite, este necesar să se grafice valorile densității distribuției absolute sau relative de-a lungul axei y.

Densitate absolută- raportul dintre frecvența intervalului și dimensiunea intervalului:

; (6.6)

unde: f(a) i - densitatea absolută a intervalului i-lea;

m i - frecvenţa intervalului i-lea;

k i - valoarea intervalului i (diferența de interval).

Densitatea absolută arată câte unități de populație sunt pe interval de unitate.

Densitate relativa- raportul dintre frecvența intervalului și dimensiunea intervalului:

; (6.7)

unde: f(o) i - densitatea relativă a intervalului i-lea;

w i - frecvența intervalului i-lea.

Densitatea relativă arată ce parte din unitățile populației se încadrează pe unitatea de interval.

a l
a 1 x i
a 2

Atât seriile de variații discrete, cât și cele de intervale pot fi reprezentate grafic ca cumulate și ogive.

La construirea se cumulează Conform datelor seriei discrete, abscisa arată valorile atributului (opțiuni), iar ordonata arată frecvențele sau frecvențele acumulate. La intersecția valorilor caracteristicii (opțiuni) și a frecvențelor acumulate (frecvențe) corespunzătoare acestora, se construiesc puncte, care, la rândul lor, sunt conectate prin segmente sau o curbă. Linia întreruptă (curba) astfel obținută se numește cumulativ (curba cumulativă).

Când se construiește cumulul în funcție de datele seriei de intervale, limitele intervalelor sunt trasate de-a lungul abscisei. Abcisele punctelor sunt limitele superioare ale intervalelor. Ordonatele formează frecvențele (frecvențele) acumulate ale intervalelor corespunzătoare. Adesea se mai adaugă un punct, a cărui abscisă este limita inferioară a primului interval, iar ordonata este zero. Conectând punctele cu segmente sau cu o curbă, obținem cumul.

Ogiva este construit similar cu cumulul, singura diferență fiind că punctele corespunzătoare frecvențelor (frecvențelor) acumulate sunt reprezentate pe axa absciselor, iar valorile caracteristice (opțiuni) sunt reprezentate de-a lungul axei ordonatelor.

Se numește un grup de numere unite de un anumit atribut agregat.

După cum sa menționat mai sus, materialul sportiv statistic primar este un grup de numere disparate care nu oferă antrenorului o idee despre esența fenomenului sau a procesului. Provocarea este de a transforma această populație într-un sistem și de a folosi indicatorii săi pentru a obține informațiile necesare.

Alcătuirea unei serii variaționale este tocmai formarea unui anumit matematic

Exemplul 2. 34 de schiori au înregistrat următorul timp de recuperare a ritmului cardiac după depășirea distanței (în secunde):

81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

După cum puteți vedea, acest grup de numere nu conține nicio informație.

Pentru a compila o serie variațională, mai întâi efectuăm operația clasament - aranjarea numerelor în ordine crescătoare sau descrescătoare. De exemplu, în ordine crescătoare, clasarea rezultă în următoarele;

78; 78; 78; 78; 78; 78;

81; 81; 81; 81; 81; 81; 81; 81; 81;

84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

În ordine descrescătoare, clasarea rezultă în acest grup de numere:

84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

81; 81; 81; 81; 8!; 81: 81; 81; 81;

78; 78; 78; 78; 78; 78;

După clasament, forma irațională de scriere a acestui grup de numere devine evidentă - aceleași numere se repetă de multe ori. Prin urmare, apare un gând firesc pentru a transforma înregistrarea în așa fel încât să indice ce număr se repetă de câte ori. De exemplu, având în vedere clasarea în ordine crescătoare:

Aici în stânga este un număr care indică timpul de recuperare a pulsului sportivului, în dreapta este numărul de repetări ale acestei citiri la acest grup de 34 de sportivi.

În conformitate cu conceptele de mai sus de simboluri matematice, grupul de măsurători considerat va fi notat cu o literă, de exemplu x. Având în vedere ordinea crescătoare a numerelor din această grupă: x 1 -74 s; x 2 - 78 s; x 3 - 81 s; x 4 - 84 s; x 5 - 85 s; x 6 -x n - 90 s, fiecare număr considerat poate fi notat cu simbolul X i .

Să notăm numărul de repetări ale măsurătorilor considerate cu litera n. Apoi:

n1 =4; n2 =6; n3 =9; n4=11; n 5 =3;n 6 =n n =1, iar fiecare număr de repetări poate fi notat ca n i .

Numărul total de măsurători efectuate, după cum rezultă din condiția exemplului, este 34. Aceasta înseamnă că suma tuturor n este 34. Sau în expresie simbolică:

Să notăm această sumă cu o literă - n. Apoi datele inițiale ale exemplului considerat pot fi scrise în această formă (Tabelul 1).

Grupul de numere rezultat este o serie transformată de citiri împrăștiate haotic primite de formator la începutul lucrării.

tabelul 1

x i n i
n=34

Un astfel de grup este un anumit sistem, ai cărui parametri caracterizează măsurătorile. Se numesc numerele reprezentând rezultatele măsurătorilor (x i). Opțiuni; n i - numărul repetărilor lor - sunt numite frecvențe; n - suma tuturor frecvențelor - da volumul agregatului.

Sistemul rezultat este numit serie de variații. Uneori, aceste serii sunt numite empirice sau statistice.

Este ușor de observat că este posibil un caz special de serie variațională, când toate frecvențele sunt egale cu unu n i ==1, adică fiecare măsurătoare dintr-un grup dat de numere a avut loc o singură dată.

Seria variațională rezultată, ca oricare alta, poate fi reprezentată grafic. Pentru a trasa seria rezultată, trebuie mai întâi să ajungeți la scară pe axele orizontale și verticale.

În această problemă, pe axa orizontală vom reprezenta grafic valorile timpului de recuperare a pulsului (x 1) în așa fel încât unitatea de lungime, aleasă în mod arbitrar, să corespundă valorii unei secunde. Vom începe să amânăm aceste valori de la 70 de secunde, retrăgându-ne condiționat de la intersecția celor două axe 0.

Pe axa verticală, trasăm valorile frecvențelor seriei noastre (n i), luând scara: o unitate de lungime este egală cu o unitate de frecvență.

După ce am pregătit astfel condițiile pentru trasarea unui grafic, trecem la lucrul cu seria variațională rezultată.

Prima pereche de numere x 1 \u003d 74, n 1 \u003d 4 este reprezentată pe grafic după cum urmează: pe axa x; găsiți x 1 =74 si refacem perpendiculara din acest punct, pe axa n gasim n 1 =4 si tragem o linie orizontala din ea pana se intersecteaza cu perpendiculara restaurata anterior. Ambele linii - verticale și orizontale - sunt linii auxiliare și, prin urmare, sunt aplicate desenului cu o linie punctată. Punctul de intersecție a acestora este în scara acestui grafic raportul dintre X 1 =74 și n 1 =4.

Toate celelalte puncte de pe grafic sunt reprezentate în același mod. Apoi sunt conectate prin segmente de linie. Pentru ca graficul să aibă o formă închisă, conectăm punctele extreme cu segmente cu puncte învecinate ale axei orizontale.

Figura rezultată este un grafic al seriei noastre de variații (Fig. 1).

Este destul de clar că fiecare serie variațională este reprezentată de propriul grafic.

Orez. 1. Reprezentarea grafică a seriei de variații.

Pe fig. 1 este vizibil:

1) dintre toți cei examinați, cel mai mare grup a fost format din sportivi, al căror timp de recuperare a pulsului a fost de 84 s;

2) pentru mulți acest timp este de 81 s;

3) cel mai mic grup a fost format din sportivi cu un timp scurt de recuperare a pulsului - 74 s și unul lung - 90 s.

Astfel, după finalizarea unei serii de teste, ar trebui să se ierarhească numerele obținute și să alcătuiască o serie variațională, care este un anumit sistem matematic. Pentru claritate, seria de variații poate fi ilustrată cu un grafic.

Seria de variații de mai sus este numită și discret următorul - unul în care fiecare opțiune este exprimată printr-un număr.

Să mai dăm câteva exemple despre compilarea serii variaționale.

Exemplul 3 12 trăgători care efectuează un exercițiu înclinat de 10 lovituri au arătat următoarele rezultate (în puncte):

94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

Pentru a forma o serie variațională, vom clasa aceste numere;

94; 94; 94; 94; 94;

După clasare, compunem o serie de variații (Tabelul 3).

Serii de distribuție statistică- aceasta este o distribuție ordonată a unităților de populație în grupuri în funcție de un anumit atribut variabil.
În funcție de trăsătura care stă la baza formării unei serii de distribuție, există serie de distribuție de atribute și variații.

Prezența unei trăsături comune stă la baza formării unei populații statistice, care este rezultatul unei descrieri sau măsurători a trăsăturilor comune ale obiectelor de studiu.

Subiectul de studiu în statistică sunt caracteristici în schimbare (variabile) sau caracteristici statistice.

Tipuri de caracteristici statistice.

Seriile de distribuție sunt numite serii de atribute. construit pe temeiuri de calitate. Atributiv- acesta este un semn care are un nume (de exemplu, o profesie: croitoreasă, profesor etc.).
Se obișnuiește să se aranjeze seria de distribuție sub formă de tabele. În tabel. 2.8 prezintă o serie de atribute de distribuție.
Tabelul 2.8 - Distribuția tipurilor de asistență juridică oferite de avocați cetățenilor uneia dintre regiunile Federației Ruse.

Seria de variații sunt valori caracteristice (sau intervale de valori) și frecvențele acestora.
Serii de variații sunt serii de distribuție construit pe o bază cantitativă. Orice serie variațională constă din două elemente: variante și frecvențe.
Variantele sunt valori individuale ale unei caracteristici pe care aceasta le ia într-o serie de variații.
Frecvențele sunt numerele de variante individuale sau fiecare grup al seriei de variații, adică. acestea sunt numere care arată cât de des apar anumite opțiuni într-o serie de distribuție. Suma tuturor frecvențelor determină dimensiunea întregii populații, volumul acesteia.
Frecvențele se numesc frecvențe, exprimate în fracții de unitate sau ca procent din total. În consecință, suma frecvențelor este egală cu 1 sau 100%. Seria variațională ne permite să evaluăm forma legii de distribuție pe baza datelor reale.

În funcție de natura variației trăsăturii, există serie de variații discrete și interval.
Un exemplu de serie variațională discretă este dat în tabel. 2.9.
Tabelul 2.9 - Distribuția familiilor după numărul de camere ocupate în apartamente individuale în 1989 în Federația Rusă.

Prima coloană a tabelului prezintă variante ale unei serii variaționale discrete, a doua coloană conține frecvențele seriei variaționale, iar a treia coloană conține indicatorii de frecvență.

Seria de variații

În populația generală, o anumită trăsătură cantitativă este investigată. Din el se extrage aleatoriu o mostră de volum n, adică numărul de elemente din eșantion este n. În prima etapă a procesării statistice, variind mostre, adică ordonarea numerelor x 1 , x 2 , …, x n Ascendent. Fiecare valoare observată x i numit opțiune. Frecvență m i este numărul de observații ale valorii x iîn probă. Frecvența relativă (frecvența) w i este raportul de frecvență m i la dimensiunea eșantionului n: .
Când se studiază o serie variațională, se folosesc și conceptele de frecvență cumulativă și frecvență cumulativă. Lăsa X oarecare număr. Apoi numărul de opțiuni , ale căror valori sunt mai mici X, se numește frecvență acumulată: pentru x i n se numeste frecventa acumulata w i max .
Un atribut se numește variabil discret dacă valorile sale individuale (variantele) diferă unele de altele printr-o cantitate finită (de obicei un număr întreg). O serie variațională a unei astfel de caracteristici se numește serie variațională discretă.

Tabelul 1. Vedere generală a seriei variaționale discrete de frecvențe

Valori caracteristicex i x 1 x2 x n
Frecvențelem i m 1 m2 m n

Un atribut se numește variabil continuu dacă valorile sale diferă unele de altele printr-o cantitate arbitrar mică, adică semnul poate lua orice valoare într-un anumit interval. O serie de variații continue pentru o astfel de trăsătură se numește serie de intervale.

Tabelul 2. Vedere generală a seriei de variație a intervalului de frecvențe

Tabelul 3. Imagini grafice ale seriei de variații

RândPoligon sau histogramăFuncția de distribuție empirică
Discret
interval
Privind rezultatele observațiilor, se determină câte valori ale variantelor au căzut în fiecare interval specific. Se presupune că fiecare interval aparține unuia dintre capetele sale: fie în toate cazurile stânga (mai des), fie în toate cazurile dreptului, iar frecvențele sau frecvențele arată numărul de opțiuni conținute în limitele indicate. Diferențele a i – a i +1 se numesc intervale parțiale. Pentru a simplifica calculele ulterioare, seria de variații de interval poate fi înlocuită cu una condițional discretă. În acest caz, valoarea medie i-al-lea interval este luat ca opțiune x i, și frecvența intervalului corespunzătoare m i- pentru frecventa acestui interval.
Pentru reprezentarea grafică a seriilor variaționale, cel mai des sunt utilizate poligonul, histograma, curba cumulativă și funcția de distribuție empirică.

În tabel. 2.3 (Gruparea populației Rusiei în funcție de mărimea venitului mediu pe cap de locuitor în aprilie 1994) este prezentată serie de variații de interval.
Este convenabil să se analizeze seria de distribuție folosind o reprezentare grafică, care face, de asemenea, posibilă aprecierea formei distribuției. O reprezentare vizuală a naturii modificării frecvențelor seriei variaționale este dată de poligon și histogramă.
Poligonul este utilizat la afișarea unor serii variaționale discrete.
Să descriem, de exemplu, grafic distribuția fondului de locuințe pe tipuri de apartamente (Tabelul 2.10).
Tabel 2.10 - Distribuția fondului de locuințe din mediul urban pe tipuri de apartamente (cifre condiționate).


Orez. Poligon de distribuție a locuințelor


Pe axa y, pot fi reprezentate nu numai valorile frecvențelor, ci și frecvențele seriei de variații.
Histograma este luată pentru a afișa seria de variații de interval. La construirea unei histograme, valorile intervalelor sunt reprezentate pe axa absciselor, iar frecvențele sunt reprezentate prin dreptunghiuri construite pe intervalele corespunzătoare. Înălțimea coloanelor în cazul intervalelor egale ar trebui să fie proporțională cu frecvențele. O histogramă este un grafic în care o serie este afișată ca bare adiacente una cu cealaltă.
Să descriem grafic seria de distribuție a intervalelor prezentată în tabel. 2.11.
Tabelul 2.11 - Distribuția familiilor după mărimea spațiului de locuit per persoană (cifre condiționate).
N p / p Grupuri de familii după mărimea spațiului de locuit per persoană Numărul de familii cu o anumită dimensiune a spațiului de locuit Numărul de familii acumulat
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Orez. 2.2. Histograma distribuției familiilor după mărimea spațiului de locuit per persoană


Folosind datele seriei acumulate (Tabelul 2.11), construim distribuție cumulativă.


Orez. 2.3. Distribuția cumulativă a familiilor în funcție de dimensiunea spațiului de locuit per persoană


Reprezentarea unei serii variaționale sub formă de cumulat este eficientă în special pentru seriile variaționale ale căror frecvențe sunt exprimate ca fracții sau procente din suma frecvențelor seriei.
Dacă schimbăm axele în reprezentarea grafică a seriei variaționale sub formă de cumulat, atunci obținem ogivu. Pe fig. 2.4 prezintă o ogivă construită pe baza datelor din tabel. 2.11.
O histogramă poate fi convertită într-un poligon de distribuție prin găsirea punctelor medii ale laturilor dreptunghiurilor și apoi conectând aceste puncte cu linii drepte. Poligonul de distribuție rezultat este prezentat în fig. 2,2 linie punctată.
Când se construiește o histogramă a distribuției unei serii variaționale cu intervale inegale, de-a lungul axei ordonatelor, nu sunt reprezentate frecvențele, ci densitatea de distribuție a caracteristicii în intervalele corespunzătoare.
Densitatea de distribuție este frecvența calculată pe unitatea de lățime a intervalului, adică câte unități din fiecare grup sunt pe unitatea de valoare a intervalului. Un exemplu de calcul al densității de distribuție este prezentat în tabel. 2.12.
Tabel 2.12 - Distribuția întreprinderilor după numărul de angajați (cifrele sunt condiționate)
N p / p Grupuri de întreprinderi după numărul de angajați, pers. Numărul de întreprinderi Dimensiunea intervalului, pers. Densitatea de distribuție
DAR 1 2 3=1/2
1 până la 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Pentru o reprezentare grafică a variației pot fi folosite și serii curba cumulativa. Cu ajutorul cumulatului (curba sumelor) se afișează o serie de frecvențe acumulate. Frecvențele cumulate sunt determinate prin însumarea succesivă a frecvențelor pe grupuri și arată câte unități ale populației au valori caracteristice nu mai mari decât valoarea considerată.


Orez. 2.4. Ogiva repartizarea familiilor în funcție de mărimea spațiului de locuit per persoană

Când se construiește cumulul unei serii de variații de interval, variantele seriei sunt reprezentate de-a lungul axei absciselor, iar frecvențele acumulate de-a lungul axei ordonatelor.

Serii cu variații continue

O serie variațională continuă este o serie construită pe baza unui semn statistic cantitativ. Exemplu. Durata medie a bolilor condamnaților (zile per persoană) în perioada toamnă-iarnă în anul curent a fost:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5
gruparea- aceasta este împărțirea populației în grupuri omogene într-un fel.

Atribuirea serviciului. Cu calculatorul online puteți:

  • construiți o serie de variații, construiți o histogramă și un poligon;
  • găsiți indicatori de variație (medie, mod (inclusiv grafic), mediană, interval de variație, quartile, decile, coeficient de diferențiere cuartile, coeficient de variație și alți indicatori);

Instruire. Pentru a grupa o serie, trebuie să selectați tipul seriei de variații rezultate (discretă sau interval) și să specificați cantitatea de date (numărul de rânduri). Soluția rezultată este salvată într-un fișier Word (vezi exemplul de grupare a datelor statistice).

Dacă gruparea a fost deja făcută și serie de variații discrete sau serie de intervale, atunci trebuie să utilizați calculatorul online Indicatori de variație. Testarea ipotezei despre tipul de distribuție produs folosind serviciul Studiul formei de distributie.

Tipuri de grupări statistice

Seria de variații. În cazul observațiilor unei variabile aleatoare discrete, aceeași valoare poate fi întâlnită de mai multe ori. Astfel de valori ale unei variabile aleatoare x i sunt înregistrate indicând n i de câte ori apare în n observații, aceasta este frecvența acestei valori.
În cazul unei variabile aleatoare continue, gruparea este utilizată în practică.
  1. Gruparea tipologică- este împărțirea populației eterogene calitativ studiate în clase, tipuri socio-economice, grupuri omogene de unități. Pentru a construi această grupare, utilizați parametrul Serie variațională discretă.
  2. Se numește grupare structurală, în care o populație omogenă este împărțită în grupuri care îi caracterizează structura în funcție de unele caracteristici diferite. Pentru a construi această grupare, utilizați parametrul Interval series.
  3. Se numește o grupare care relevă relația dintre fenomenele studiate și trăsăturile lor grup analitic(vezi gruparea analitică a serii).

Exemplul #1. Conform tabelului 2, construiți seria de distribuție pentru 40 de bănci comerciale ale Federației Ruse. În funcție de seria de distribuție obținută, determinați: profitul mediu pe o bancă comercială, investițiile în credit în medie pe o bancă comercială, valoarea modală și mediană a profitului; quartile, decile, intervalul de variație, abaterea liniară medie, abaterea standard, coeficientul de variație.

Soluţie:
În capitolul „Tipul seriei statistice” alege Discrete Series. Faceți clic pe Lipire din Excel. Număr de grupe: conform formulei Sturgess

Principii de construire a grupărilor statistice

O serie de observații ordonate în ordine crescătoare se numește serie de variații. semn de grupare este semnul prin care populația este împărțită în grupuri separate. Se numește baza grupului. Gruparea se poate baza atât pe caracteristici cantitative, cât și calitative.
După stabilirea bazei grupării, trebuie decisă problema numărului de grupuri în care ar trebui să fie împărțită populația studiată.

Atunci când se utilizează computere personale pentru prelucrarea datelor statistice, gruparea unităților unui obiect se realizează folosind proceduri standard.
O astfel de procedură se bazează pe utilizarea formulei Sturgess pentru a determina numărul optim de grupuri:

k = 1+3,322*lg(N)

Unde k este numărul de grupuri, N este numărul de unități de populație.

Lungimea intervalelor parțiale se calculează ca h=(x max -x min)/k

Apoi numărați numărul de accesări ale observațiilor din aceste intervale, care sunt luate ca frecvențe n i . Puține frecvențe, ale căror valori sunt mai mici de 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Punctele medii ale intervalelor x i =(c i-1 +c i)/2 sunt luate ca valori noi.

Exemplul #3. Ca rezultat al unui eșantion auto-aleatoriu de 5%, s-a obținut următoarea distribuție a produselor după conținutul de umiditate. Calculați: 1) procentul mediu de umiditate; 2) indicatori care caracterizează variaţia umidităţii.
Soluția a fost obținută cu ajutorul unui calculator: Exemplul nr. 1

Construiți o serie de variații. Pe baza seriei găsite, construiți un poligon de distribuție, o histogramă și un cumulat. Determinați modul și mediana.
Descărcați soluția

Exemplu. Conform rezultatelor observației selective (anexa eșantionului A):
a) face o serie de variatii;
b) calculați frecvențele relative și frecvențele relative acumulate;
c) construiți un poligon;
d) alcătuiește o funcție de distribuție empirică;
e) reprezentaţi grafic funcţia de distribuţie empirică;
f) calculați caracteristicile numerice: medie aritmetică, varianță, abatere standard. Soluţie

Pe baza datelor prezentate în Tabelul 4 (Anexa 1) și corespunzătoare opțiunii dvs., efectuați:

  1. Pe baza grupării structurale, construiți o serie de frecvență variațională și distribuție cumulativă folosind intervale închise egale, presupunând că numărul de grupuri este 6. Prezentați rezultatele într-un tabel și grafic.
  2. Analizați seria de distribuție variațională calculând:
    • valoarea medie aritmetică a caracteristicii;
    • mod, mediană, 1-a quartila, 1-a și 9-a decilă;
    • deviație standard;
    • coeficientul de variație.
  3. A concluziona.

Necesar: pentru a clasifica seria, pentru a construi o serie de distribuție pe intervale, pentru a calcula valoarea medie, varianța valorii medii, modul și mediana pentru seria interval și interval.

Pe baza datelor inițiale, construiți o serie variațională discretă; prezentați-l sub forma unui tabel statistic și grafice statistice. 2). Pe baza datelor inițiale, construiți o serie de variații de interval cu intervale egale. Alegeți singur numărul de intervale și explicați această alegere. Prezentați seria de variații rezultată sub forma unui tabel statistic și grafice statistice. Indicați tipurile de tabele și grafice utilizate.

Pentru a determina durata medie a serviciului clienți într-un fond de pensii, al cărui număr de clienți este foarte mare, a fost efectuat un sondaj pe 100 de clienți conform schemei de eșantionare auto-aleatorie nerepetitivă. Rezultatele sondajului sunt prezentate în tabel. Găsi:
a) limitele în care, cu o probabilitate de 0,9946, se încheie timpul mediu de serviciu pentru toți clienții fondului de pensii;
b) probabilitatea ca ponderea tuturor clienților fondului cu o durată de serviciu mai mică de 6 minute să difere de ponderea acestor clienți în eșantion cu cel mult 10% (în valoare absolută);
c) volumul de reeșantionare, la care cu o probabilitate de 0,9907 se poate argumenta că ponderea tuturor clienților fondului cu o durată de serviciu mai mică de 6 minute diferă de ponderea acestor clienți în eșantion cu cel mult 10% (în valoare absolută).
2. Conform sarcinii 1, folosind testul Pearson X 2, la nivelul de semnificație α = 0,05, se testează ipoteza că variabila aleatoare X - timpul de servire a clienților - este distribuită conform legii normale. Construiți pe un desen o histogramă a distribuției empirice și a curbei normale corespunzătoare.
Descărcați soluția

Dat un eșantion de 100 de articole. Necesar:

  1. Construiți o serie variațională clasificată;
  2. Găsiți termenii maximi și minimi ai seriei;
  3. Găsiți intervalul de variație și numărul de intervale optime pentru construirea unei serii de intervale. Aflați lungimea intervalului seriei de intervale;
  4. Construiți o serie de intervale. Aflați frecvențele elementelor eșantionului care se încadrează în intervalele compuse. Găsiți punctele de mijloc ale fiecărui interval;
  5. Construiți o histogramă și un poligon de frecvențe. Comparați cu distribuția normală (analitic și grafic);
  6. Reprezentați grafic funcția de distribuție empirică;
  7. Calculați caracteristicile numerice ale eșantionului: media eșantionului și momentul central al eșantionului;
  8. Calculați valorile aproximative ale abaterii standard, asimetriei și curtozei (folosind pachetul de analiză MS Excel). Comparați valorile calculate aproximative cu cele exacte (calculate folosind formule MS Excel);
  9. Comparați caracteristicile grafice selectate cu cele teoretice corespunzătoare.
Descărcați soluția

Avem următoarele date eșantion (eșantion de 10%, mecanic) privind producția și valoarea profitului, milioane de ruble. Conform datelor originale:
Sarcina 13.1.
13.1.1. Construiți o serie statistică de distribuție a întreprinderilor după valoarea profitului, formând cinci grupuri la intervale egale. Serii de distribuție a parcelelor.
13.1.2. Calculați caracteristicile numerice ale unei serii de distribuție a întreprinderilor după valoarea profitului: medie aritmetică, abatere standard, varianță, coeficient de variație V. Trageți concluzii.
Sarcina 13.2.
13.2.1. Determinați limitele în care, cu o probabilitate de 0,997, se încheie valoarea profitului unei întreprinderi din populația generală.
13.2.2. Folosind criteriul x2 al lui Pearson, la un nivel de semnificație α, testați ipoteza că variabila aleatoare X - valoarea profitului - este distribuită conform legii normale.
Sarcina 13.3.
13.3.1. Determinați coeficienții ecuației de regresie a probei.
13.3.2. Stabiliți prezența și natura corelației dintre costul produselor fabricate (X) și valoarea profitului pe întreprindere (Y). Trasează un grafic de dispersie și o dreaptă de regresie.
13.3.3. Calculați coeficientul de corelație liniară. Utilizând testul t al lui Student, verificați semnificația coeficientului de corelație. Trageți o concluzie despre apropierea relației dintre factorii X și Y folosind scala Chaddock.
Instrucțiuni. Sarcina 13.3 este efectuată utilizând acest serviciu.
Descărcați soluția

O sarcină. Următoarele date reprezintă timpul petrecut de clienți în încheierea contractelor. Construiți o serie de variații de interval a datelor prezentate, o histogramă, găsiți o estimare imparțială a așteptărilor matematice, o estimare părtinitoare și nepărtinitoare a varianței.

Exemplu. Conform tabelului 2:
1) Construiți serii de distribuție pentru 40 de bănci comerciale din Federația Rusă:
a) cu valoarea profitului;
B) prin valoarea investiţiilor creditare.
2) În funcție de seria de distribuție obținută, determinați:
A) profitul mediu pe bancă comercială;
B) investiții creditare în medie pe bancă comercială;
C) valoarea modală și mediană a profitului; quartile, decile;
D) valoarea modală și mediană a investițiilor creditare.
3) După seria de distribuție obținută la paragraful 1, se calculează:
a) intervalul de variație;
b) abaterea liniară medie;
c) abaterea standard;
d) coeficientul de variaţie.
Înregistrați calculele necesare în formă tabelară. Analizați rezultatele. Trageți propriile concluzii.
Trasează seria de distribuție rezultată. Determinați grafic modul și mediana.

Soluţie:
Pentru a construi o grupare cu intervale egale, vom folosi serviciul Grupare de date statistice.

Figura 1 - Introducerea parametrilor

Descrierea parametrilor
Numărul de linii: cantitatea de date brute. Dacă dimensiunea seriei este mică, indicați numărul acesteia. Dacă selecția este suficient de mare, faceți clic pe butonul Lipire din Excel.
Numărul de grupuri: 0 - numărul de grupe va fi determinat de formula Sturgess.
Dacă este specificat un anumit număr de grupuri, introduceți-l (de exemplu, 5).
Tipul de rând: Serii discrete.
Nivel de semnificație: de exemplu, 0,954 . Acest parametru este setat pentru a defini intervalul de încredere pentru medie.
Probă: De exemplu, se face eșantionare mecanică de 10%. Specificați numărul 10. Pentru datele noastre, specificam 100 .

CLOPOTUL

Sunt cei care citesc aceasta stire inaintea ta.
Abonați-vă pentru a primi cele mai recente articole.
E-mail
Nume
Nume de familie
Cum ți-ar plăcea să citești Clopoțelul
Fără spam