ΤΟ ΚΟΥΔΟΥΝΙ

Υπάρχουν εκείνοι που διαβάζουν αυτές τις ειδήσεις πριν από εσάς.
Εγγραφείτε για να λαμβάνετε τα πιο πρόσφατα άρθρα.
ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ
Ονομα
Επώνυμο
Πώς θα θέλατε να διαβάσετε το The Bell
Χωρίς ανεπιθύμητο περιεχόμενο

Ιδιαίτερη θέση στη στατιστική ανάλυση κατέχει ο προσδιορισμός του μέσου επιπέδου του υπό μελέτη χαρακτηριστικού ή φαινομένου. Μέσο επίπεδοΤα χαρακτηριστικά μετρώνται με μέσες τιμές.

Η μέση τιμή χαρακτηρίζει το γενικό ποσοτικό επίπεδο του υπό μελέτη χαρακτηριστικού και αποτελεί ομαδική ιδιότητα του στατιστικού πληθυσμού. Ισοπεδώνεται, αποδυναμώνεται τυχαίες αποκλίσειςμεμονωμένες παρατηρήσεις προς τη μία ή την άλλη κατεύθυνση και αναδεικνύει την κύρια, τυπική ιδιότητα του υπό μελέτη χαρακτηριστικού.

Οι μέσοι όροι χρησιμοποιούνται ευρέως:

1. Εκτίμηση της κατάστασης υγείας του πληθυσμού: χαρακτηριστικά φυσικής ανάπτυξης (ύψος, βάρος, περιφέρεια στήθοςκ.λπ.), προσδιορίζοντας τον επιπολασμό και τη διάρκεια διαφόρων ασθενειών, αναλύοντας δημογραφικούς δείκτες (φυσική μετακίνηση πληθυσμού, μέσο προσδόκιμο ζωής, αναπαραγωγή πληθυσμού, μέσο μέγεθος πληθυσμού κ.λπ.).

2. Να μελετά τις δραστηριότητες των ιατρικών ιδρυμάτων, του ιατρικού προσωπικού και να αξιολογεί την ποιότητα της εργασίας τους, να σχεδιάζει και να καθορίζει τις ανάγκες του πληθυσμού στο διάφοροι τύποιιατρική περίθαλψη (μέσος αριθμός αιτήσεων ή επισκέψεων ανά κάτοικο ανά έτος, μέση διάρκεια παραμονής ασθενούς σε νοσοκομείο, μέση διάρκεια εξέτασης ασθενούς, μέση παροχή γιατρών, κρεβάτια κ.λπ.).

3. Να χαρακτηριστεί η υγειονομική και επιδημιολογική κατάσταση (μέση σκόνη του αέρα στο εργαστήριο, μέση επιφάνεια ανά άτομο, μέση κατανάλωση πρωτεϊνών, λιπών και υδατανθράκων κ.λπ.).

4. Να προσδιορίσει τις ιατρικές και φυσιολογικές παραμέτρους στην υγεία και τις ασθένειες, κατά την επεξεργασία εργαστηριακών δεδομένων, για να διαπιστωθεί η αξιοπιστία των αποτελεσμάτων δείγμα μελέτηςσε κοινωνικο-υγιεινές, κλινικές, πειραματικές μελέτες.

Ο υπολογισμός των μέσων τιμών πραγματοποιείται με βάση τις σειρές διακύμανσης. Σειρά παραλλαγής- πρόκειται για ένα ποιοτικά ομοιογενές στατιστικό σύνολο, οι επιμέρους μονάδες του οποίου χαρακτηρίζουν τις ποσοτικές διαφορές του υπό μελέτη χαρακτηριστικού ή φαινομένου.

Η ποσοτική διακύμανση μπορεί να είναι δύο τύπων: ασυνεχής (διακριτή) και συνεχής.

Ένα ασυνεχές (διακεκριμένο) σημάδι εκφράζεται μόνο ως ακέραιος και δεν μπορεί να έχει ενδιάμεσες τιμές (για παράδειγμα, τον αριθμό των επισκέψεων, τον πληθυσμό της τοποθεσίας, τον αριθμό των παιδιών στην οικογένεια, τη σοβαρότητα της νόσου σε σημεία , και τα λοιπά.).

Ένα συνεχές σημάδι μπορεί να λάβει οποιεσδήποτε τιμές εντός ορισμένων ορίων, συμπεριλαμβανομένων των κλασματικών, και εκφράζεται μόνο κατά προσέγγιση (για παράδειγμα, βάρος - για ενήλικες μπορείτε να περιοριστείτε σε κιλά και για νεογέννητα - γραμμάρια, ύψος, αρτηριακή πίεση, χρόνος δαπανώνται για την επίσκεψη ενός ασθενούς κ.λπ.).



Η ψηφιακή τιμή κάθε μεμονωμένου χαρακτηριστικού ή φαινομένου που περιλαμβάνεται στη σειρά παραλλαγής ονομάζεται παραλλαγή και υποδεικνύεται με το γράμμα V . Υπάρχουν και άλλες σημειώσεις στη μαθηματική βιβλιογραφία, για παράδειγμα Χ ή y.

Μια μεταβλητή σειρά, όπου κάθε επιλογή υποδεικνύεται μία φορά, ονομάζεται απλή.Τέτοιες σειρές χρησιμοποιούνται στα περισσότερα στατιστικά προβλήματα στην περίπτωση της επεξεργασίας δεδομένων υπολογιστή.

Με αύξηση του αριθμού των παρατηρήσεων, κατά κανόνα, υπάρχουν επαναλαμβανόμενες τιμές της παραλλαγής. Σε αυτή την περίπτωση δημιουργεί ομαδοποιημένες σειρές παραλλαγών, όπου υποδεικνύεται ο αριθμός των επαναλήψεων (συχνότητα, που συμβολίζεται με το γράμμα " R »).

Σειρές παραλλαγών κατάταξηςαποτελείται από επιλογές διατεταγμένες σε αύξουσα ή φθίνουσα σειρά. Τόσο οι απλές όσο και οι ομαδοποιημένες σειρές μπορούν να συντίθενται με κατάταξη.

Σειρά παραλλαγής διαστήματοςαποτελούνται για να απλοποιηθούν οι μετέπειτα υπολογισμοί που πραγματοποιήθηκαν χωρίς τη χρήση υπολογιστή, με πολύ μεγάλο αριθμό μονάδων παρατήρησης (περισσότερες από 1000).

Σειρά συνεχούς παραλλαγήςπεριλαμβάνει τιμές παραλλαγής, οι οποίες μπορεί να είναι οποιαδήποτε τιμή.

Εάν στη σειρά παραλλαγής οι τιμές του χαρακτηριστικού (επιλογές) δίνονται με τη μορφή ξεχωριστών συγκεκριμένων αριθμών, τότε μια τέτοια σειρά ονομάζεται διακεκριμένος.

Γενικά χαρακτηριστικάΟι τιμές του χαρακτηριστικού που αντικατοπτρίζονται στη σειρά παραλλαγών είναι μέσες τιμές. Μεταξύ αυτών, οι πιο χρησιμοποιούμενες είναι: ο αριθμητικός μέσος όρος Μ,μόδα Μοκαι διάμεσος Μου.Κάθε ένα από αυτά τα χαρακτηριστικά είναι μοναδικό. Δεν μπορούν να αντικαταστήσουν το ένα το άλλο, και μόνο συνολικά, πλήρως και σε συνοπτική μορφή, είναι τα χαρακτηριστικά σειρά παραλλαγής.

Μόδα (Μο) ονομάστε την τιμή των επιλογών που εμφανίζονται πιο συχνά.

Διάμεσος (μου) είναι η τιμή της παραλλαγής που διαιρεί την κυμαινόμενη μεταβλητή σειρά στο μισό (σε κάθε πλευρά της διάμεσης τιμής υπάρχει το μισό της παραλλαγής). Σε σπάνιες περιπτώσεις, όταν υπάρχει μια συμμετρική σειρά παραλλαγής, ο τρόπος και η διάμεσος είναι ίσες μεταξύ τους και συμπίπτουν με την τιμή του αριθμητικού μέσου όρου.

Το πιο τυπικό χαρακτηριστικό των τιμών παραλλαγής είναι αριθμητικός μέσος όροςαξία( Μ ). Στη μαθηματική βιβλιογραφία, δηλώνεται .

Αριθμητικός μέσος όρος (Μ, ) είναι ένα γενικό ποσοτικό χαρακτηριστικό ενός συγκεκριμένου χαρακτηριστικού των μελετώμενων φαινομένων, που συνθέτουν ένα ποιοτικά ομοιογενές στατιστικό σύνολο. Διάκριση μεταξύ απλού αριθμητικού μέσου και σταθμισμένου μέσου όρου. Ο απλός αριθμητικός μέσος όρος υπολογίζεται για μια απλή μεταβλητή σειρά αθροίζοντας όλες τις επιλογές και διαιρώντας αυτό το άθροισμα με τον συνολικό αριθμό των επιλογών που περιλαμβάνονται σε αυτήν τη μεταβλητή σειρά. Οι υπολογισμοί γίνονται σύμφωνα με τον τύπο:

όπου: Μ - απλός αριθμητικός μέσος όρος.

Σ V - επιλογή ποσού

n- αριθμός παρατηρήσεων.

Στην ομαδοποιημένη σειρά παραλλαγών, προσδιορίζεται ένας σταθμισμένος αριθμητικός μέσος όρος. Ο τύπος για τον υπολογισμό του:

όπου: Μ - αριθμητικός σταθμισμένος μέσος όρος.

Σ vp - το άθροισμα των προϊόντων μιας παραλλαγής στις συχνότητές τους.

n- αριθμός παρατηρήσεων.

Με μεγάλο αριθμό παρατηρήσεων στην περίπτωση χειροκίνητων υπολογισμών, μπορεί να χρησιμοποιηθεί η μέθοδος των ροπών.

Ο αριθμητικός μέσος όρος έχει τις ακόλουθες ιδιότητες:

το άθροισμα των αποκλίσεων της παραλλαγής από το μέσο όρο ( Σ ρε ) ισούται με μηδέν (βλ. Πίνακα 15).

Κατά τον πολλαπλασιασμό (διαίρεση) όλων των επιλογών με τον ίδιο παράγοντα (διαιρέτης), ο αριθμητικός μέσος όρος πολλαπλασιάζεται (διαιρείται) με τον ίδιο παράγοντα (διαιρέτης).

Εάν προσθέσετε (αφαιρέσετε) τον ίδιο αριθμό σε όλες τις επιλογές, ο αριθμητικός μέσος όρος αυξάνεται (μειώνεται) κατά τον ίδιο αριθμό.

Οι αριθμητικοί μέσοι όροι, που λαμβάνονται από μόνοι τους, χωρίς να λαμβάνεται υπόψη η μεταβλητότητα της σειράς από την οποία υπολογίζονται, ενδέχεται να μην αντικατοπτρίζουν πλήρως τις ιδιότητες της σειράς διακύμανσης, ειδικά όταν απαιτείται σύγκριση με άλλους μέσους όρους. Οι μέσες τιμές κοντά στην τιμή μπορούν να ληφθούν από σειρές με διαφορετικούς βαθμούς διασποράς. Όσο πιο κοντά η μία στην άλλη είναι οι επιμέρους επιλογές στο δικό τους ποσοτικό χαρακτηριστικό, το λιγότερο σκέδαση (διακύμανση, μεταβλητότητα)σειρά, τόσο πιο τυπικός είναι ο μέσος όρος της.

Οι κύριες παράμετροι που επιτρέπουν την αξιολόγηση της μεταβλητότητας ενός χαρακτηριστικού είναι:

· πεδίο εφαρμογής;

Εύρος;

· Τυπική απόκλιση;

· Ο συντελεστής διακύμανσης.

Κατά προσέγγιση, η διακύμανση ενός χαρακτηριστικού μπορεί να κριθεί από το εύρος και το πλάτος της σειράς παραλλαγής. Το εύρος υποδεικνύει τις μέγιστες (V max) και τις ελάχιστες (V min) επιλογές στη σειρά. Το πλάτος (A m) είναι η διαφορά μεταξύ αυτών των επιλογών: A m = V max - V min .

Το κύριο, γενικά αποδεκτό μέτρο της διακύμανσης της μεταβλητής σειράς είναι διασπορά (ρε ). Αλλά η πιο βολική παράμετρος χρησιμοποιείται συχνότερα, που υπολογίζεται με βάση τη διακύμανση - την τυπική απόκλιση ( σ ). Λαμβάνει υπόψη την τιμή απόκλισης ( ρε ) κάθε παραλλαγής της σειράς παραλλαγής από τον αριθμητικό της μέσο όρο ( d=V - M ).

Δεδομένου ότι οι αποκλίσεις της παραλλαγής από τον μέσο όρο μπορεί να είναι θετικές και αρνητικές, όταν αθροίζονται δίνουν την τιμή "0" (S d=0). Για να αποφευχθεί αυτό, οι τιμές απόκλισης ( ρε) ανεβαίνουν στη δεύτερη ισχύ και υπολογίζονται κατά μέσο όρο. Έτσι, η διακύμανση της μεταβλητής σειράς είναι το μέσο τετράγωνο των αποκλίσεων της παραλλαγής από τον αριθμητικό μέσο όρο και υπολογίζεται από τον τύπο:

Είναι το πιο σημαντικό χαρακτηριστικό της μεταβλητότητας και χρησιμοποιείται για τον υπολογισμό πολλών στατιστικών δοκιμών.

Επειδή η διακύμανση εκφράζεται ως το τετράγωνο των αποκλίσεων, η τιμή της δεν μπορεί να χρησιμοποιηθεί σε σύγκριση με τον αριθμητικό μέσο όρο. Για τους σκοπούς αυτούς, χρησιμοποιείται τυπική απόκλιση, το οποίο συμβολίζεται με το σύμβολο "Sigma" ( σ ). Χαρακτηρίζει τη μέση απόκλιση όλων των παραλλαγών της σειράς παραλλαγών από τον αριθμητικό μέσο όρο στις ίδιες μονάδες με τον ίδιο τον μέσο όρο, ώστε να μπορούν να χρησιμοποιηθούν μαζί.

Η τυπική απόκλιση καθορίζεται από τον τύπο:

Αυτός ο τύπος εφαρμόζεται για τον αριθμό των παρατηρήσεων ( n ) είναι μεγαλύτερο από 30. Με μικρότερο αριθμό n η τιμή της τυπικής απόκλισης θα έχει ένα σφάλμα που σχετίζεται με τη μαθηματική προκατάληψη ( n - ένας). Από αυτή την άποψη, ένα πιο ακριβές αποτέλεσμα μπορεί να ληφθεί λαμβάνοντας υπόψη μια τέτοια μεροληψία στον τύπο για τον υπολογισμό της τυπικής απόκλισης:

τυπική απόκλιση (μικρό ) είναι μια εκτίμηση της τυπικής απόκλισης της τυχαίας μεταβλητής Χσχετικά με αυτήν μαθηματική προσδοκίαμε βάση μια αμερόληπτη εκτίμηση της διακύμανσής του.

Για αξίες n > 30 τυπική απόκλιση ( σ ) και τυπική απόκλιση ( μικρό ) θα είναι το ίδιο ( σ=s ). Ως εκ τούτου, στα περισσότερα πρακτικά βοηθήματααυτά τα κριτήρια θεωρούνται διαφορετικά.Στο Excel, ο υπολογισμός της τυπικής απόκλισης μπορεί να γίνει με τη συνάρτηση =STDEV(εύρος). Και για να υπολογίσετε την τυπική απόκλιση, πρέπει να δημιουργήσετε έναν κατάλληλο τύπο.

Το μέσο τετράγωνο της ρίζας ή η τυπική απόκλιση σάς επιτρέπει να προσδιορίσετε πόσο μπορεί να διαφέρουν οι τιμές ενός χαρακτηριστικού από τη μέση τιμή. Ας υποθέσουμε ότι υπάρχουν δύο πόλεις με την ίδια μέση ημερήσια θερμοκρασία το καλοκαίρι. Μία από αυτές τις πόλεις βρίσκεται στην ακτή και η άλλη στην ήπειρο. Είναι γνωστό ότι στις πόλεις που βρίσκονται στην ακτή, οι διαφορές στις θερμοκρασίες κατά τη διάρκεια της ημέρας είναι μικρότερες από τις πόλεις που βρίσκονται στην ενδοχώρα. Επομένως, η τυπική απόκλιση των θερμοκρασιών κατά τη διάρκεια της ημέρας κοντά στην παράκτια πόλη θα είναι μικρότερη από αυτή της δεύτερης πόλης. Στην πράξη, αυτό σημαίνει ότι η μέση θερμοκρασία του αέρα κάθε συγκεκριμένης ημέρας σε μια πόλη που βρίσκεται στην ήπειρο θα διαφέρει περισσότερο από τη μέση θερμοκρασία από ό,τι σε μια πόλη στην ακτή. Επιπλέον, η τυπική απόκλιση καθιστά δυνατή την εκτίμηση πιθανών αποκλίσεων θερμοκρασίας από τον μέσο όρο με το απαιτούμενο επίπεδο πιθανότητας.

Σύμφωνα με τη θεωρία των πιθανοτήτων, σε φαινόμενα που υπακούουν στον νόμο της κανονικής κατανομής, υπάρχει μια αυστηρή σχέση μεταξύ των τιμών του αριθμητικού μέσου όρου, της τυπικής απόκλισης και των επιλογών ( κανόνας τριών σίγμα). Για παράδειγμα, το 68,3% των τιμών μιας μεταβλητής ιδιότητας είναι εντός M ± 1 σ , 95,5% - εντός M ± 2 σ και 99,7% - εντός M ± 3 σ .

Η τιμή της τυπικής απόκλισης καθιστά δυνατό να κριθεί η φύση της ομοιογένειας της σειράς παραλλαγών και της υπό μελέτη ομάδας. Εάν η τιμή της τυπικής απόκλισης είναι μικρή, τότε αυτό υποδηλώνει επαρκώς υψηλή ομοιογένεια του υπό μελέτη φαινομένου. Ο αριθμητικός μέσος όρος σε αυτή την περίπτωση θα πρέπει να αναγνωριστεί ως αρκετά χαρακτηριστικός αυτής της μεταβλητής σειράς. Ωστόσο, επίσης μικρή αξίαΤο sigma κάνει κάποιον να σκεφτεί την τεχνητή επιλογή των παρατηρήσεων. Με πολύ μεγάλο σίγμα, ο αριθμητικός μέσος όρος χαρακτηρίζει τη σειρά διακύμανσης σε μικρότερο βαθμό, γεγονός που υποδηλώνει σημαντική μεταβλητότητα του υπό μελέτη γνώρισμα ή φαινομένου ή την ετερογένεια της ομάδας μελέτης. Ωστόσο, η σύγκριση της τιμής της τυπικής απόκλισης είναι δυνατή μόνο για σημεία της ίδιας διάστασης. Πράγματι, αν συγκρίνουμε την ποικιλομορφία βάρους νεογνών και ενηλίκων, θα έχουμε πάντα υψηλότερες τιμές σίγμα στους ενήλικες.

Η σύγκριση της μεταβλητότητας των χαρακτηριστικών διαφορετικών διαστάσεων μπορεί να πραγματοποιηθεί χρησιμοποιώντας συντελεστής διακύμανσης. Εκφράζει την ποικιλομορφία ως ποσοστό του μέσου όρου, που επιτρέπει τη σύγκριση διαφορετικών χαρακτηριστικών. Ο συντελεστής διακύμανσης στην ιατρική βιβλιογραφία υποδεικνύεται με το σύμβολο " ΑΠΟ "και στα μαθηματικά" v» και υπολογίζεται με τον τύπο:

Οι τιμές του συντελεστή διακύμανσης μικρότερη από 10% υποδεικνύουν μια μικρή διασπορά, από 10 έως 20% - περίπου ο μέσος όρος, περισσότερο από 20% - σχετικά με μια ισχυρή διασπορά γύρω από τον αριθμητικό μέσο όρο.

Ο αριθμητικός μέσος όρος υπολογίζεται συνήθως από τα δεδομένα πλαίσιο δειγματοληψίας. Με επαναλαμβανόμενες μελέτες υπό την επίδραση τυχαίων φαινομένων, ο αριθμητικός μέσος όρος μπορεί να αλλάξει. Αυτό οφείλεται στο γεγονός ότι, κατά κανόνα, διερευνάται μόνο ένα μέρος των πιθανών μονάδων παρατήρησης, δηλαδή ένας πληθυσμός δείγματος. Πληροφορίες για όλες τις πιθανές μονάδες που αντιπροσωπεύουν το υπό μελέτη φαινόμενο μπορούν να ληφθούν μελετώντας ολόκληρο τον γενικό πληθυσμό, κάτι που δεν είναι πάντα δυνατό. Παράλληλα, για τη γενίκευση των πειραματικών δεδομένων, ενδιαφέρει η τιμή του μέσου όρου στο γενικό πληθυσμό. Επομένως, για να διατυπωθεί ένα γενικό συμπέρασμα για το υπό μελέτη φαινόμενο, τα αποτελέσματα που προκύπτουν με βάση τον πληθυσμό του δείγματος πρέπει να μεταφερθούν στον γενικό πληθυσμό με στατιστικές μεθόδους.

Προκειμένου να προσδιοριστεί ο βαθμός συμφωνίας μεταξύ της δειγματοληπτικής μελέτης και του γενικού πληθυσμού, είναι απαραίτητο να εκτιμηθεί το μέγεθος του σφάλματος που αναπόφευκτα προκύπτει κατά την παρατήρηση του δείγματος. Ένα τέτοιο σφάλμα ονομάζεται σφάλμα αντιπροσωπευτικότητας» ή «Μέσο σφάλμα του αριθμητικού μέσου όρου». Είναι στην πραγματικότητα η διαφορά μεταξύ των μέσων όρων που λαμβάνονται από το δείγμα στατιστική παρατήρηση, και παρόμοιες τιμές που θα λαμβάνονταν σε συνεχή μελέτη του ίδιου αντικειμένου, δηλ. κατά τη μελέτη του γενικού πληθυσμού. Δεδομένου ότι ο μέσος όρος του δείγματος είναι μια τυχαία μεταβλητή, μια τέτοια πρόβλεψη γίνεται με ένα αποδεκτό επίπεδο πιθανότητας για τον ερευνητή. Στην ιατρική έρευνα, είναι τουλάχιστον 95%.

Το σφάλμα αντιπροσωπευτικότητας δεν πρέπει να συγχέεται με σφάλματα εγγραφής ή σφάλματα προσοχής (λάθος εκτυπώσεων, λανθασμένοι υπολογισμοί, λανθασμένες εκτυπώσεις κ.λπ.), τα οποία θα πρέπει να ελαχιστοποιούνται με μια κατάλληλη μεθοδολογία και εργαλεία που χρησιμοποιούνται στο πείραμα.

Το μέγεθος του σφάλματος αντιπροσωπευτικότητας εξαρτάται τόσο από το μέγεθος του δείγματος όσο και από τη μεταβλητότητα του χαρακτηριστικού. Όσο μεγαλύτερος είναι ο αριθμός των παρατηρήσεων, τόσο πιο κοντά είναι το δείγμα στον γενικό πληθυσμό και τόσο μικρότερο είναι το σφάλμα. Όσο πιο μεταβλητό είναι το χαρακτηριστικό, τόσο μεγαλύτερο είναι το στατιστικό σφάλμα.

Στην πράξη, ο ακόλουθος τύπος χρησιμοποιείται για τον προσδιορισμό του σφάλματος αντιπροσωπευτικότητας σε μεταβλητές σειρές:

όπου: Μ – σφάλμα αντιπροσωπευτικότητας·

σ - τυπική απόκλιση;

nείναι ο αριθμός των παρατηρήσεων στο δείγμα.

Από τον τύπο φαίνεται ότι το μέγεθος μέσο σφάλμαείναι ευθέως ανάλογη με την τυπική απόκλιση, δηλαδή τη μεταβλητότητα του υπό μελέτη χαρακτηριστικού, και αντιστρόφως ανάλογη με την τετραγωνική ρίζα του αριθμού των παρατηρήσεων.

Ενώ κάνετε Στατιστική ανάλυσημε βάση τον υπολογισμό σχετικές τιμέςη κατασκευή μιας μεταβλητής σειράς είναι προαιρετική. Σε αυτήν την περίπτωση, ο προσδιορισμός του μέσου σφάλματος για σχετικούς δείκτες μπορεί να πραγματοποιηθεί χρησιμοποιώντας έναν απλοποιημένο τύπο:

όπου: R- την τιμή του σχετικού δείκτη, εκφρασμένη ως ποσοστό, ppm, κ.λπ.

q- το αντίστροφο του P και εκφράζεται ως (1-P), (100-P), (1000-P), κ.λπ., ανάλογα με τη βάση για την οποία υπολογίζεται ο δείκτης·

nείναι ο αριθμός των παρατηρήσεων στο δείγμα.

Ωστόσο, ο υποδεικνυόμενος τύπος για τον υπολογισμό του σφάλματος αντιπροσωπευτικότητας για τις σχετικές τιμές μπορεί να εφαρμοστεί μόνο όταν η τιμή του δείκτη είναι μικρότερη από τη βάση του. Σε ορισμένες περιπτώσεις υπολογισμού εντατικών δεικτών, αυτή η προϋπόθεση δεν πληρούται και ο δείκτης μπορεί να εκφραστεί ως αριθμός μεγαλύτερος από 100% ή 1000%ο. Σε μια τέτοια περίπτωση, δημιουργείται μια σειρά παραλλαγής και το σφάλμα αντιπροσωπευτικότητας υπολογίζεται χρησιμοποιώντας τον τύπο για μέσες τιμές με βάση την τυπική απόκλιση.

Η πρόβλεψη της τιμής του αριθμητικού μέσου όρου στον γενικό πληθυσμό πραγματοποιείται με την ένδειξη δύο τιμών - την ελάχιστη και τη μέγιστη. Αυτές οι ακραίες τιμές των πιθανών αποκλίσεων, εντός των οποίων μπορεί να κυμαίνεται η επιθυμητή μέση τιμή του γενικού πληθυσμού, ονομάζονται " Όρια εμπιστοσύνης».

Τα αξιώματα της θεωρίας πιθανοτήτων απέδειξαν ότι με μια κανονική κατανομή ενός χαρακτηριστικού με πιθανότητα 99,7%, οι ακραίες τιμές των αποκλίσεων του μέσου όρου δεν θα υπερβαίνουν την τιμή του τριπλού σφάλματος αντιπροσωπευτικότητας ( Μ ± 3 Μ ) σε 95,5% - όχι περισσότερο από την τιμή του διπλασιασμένου μέσου σφάλματος της μέσης τιμής ( Μ ±2 Μ ) σε 68,3% - όχι περισσότερο από την τιμή ενός μέσου σφάλματος ( Μ ± 1 Μ ) (Εικ. 9).

Π%

Ρύζι. 9. Πυκνότητα πιθανότητας κανονική κατανομή.

Σημειώστε ότι η παραπάνω δήλωση ισχύει μόνο για ένα χαρακτηριστικό που υπακούει στον κανονικό νόμο κατανομής Gauss.

Η πλειοψηφία πειραματικές μελέτες, συμπεριλαμβανομένου του τομέα της ιατρικής, σχετίζεται με μετρήσεις, τα αποτελέσματα των οποίων μπορούν να λάβουν σχεδόν οποιαδήποτε τιμή σε ένα δεδομένο διάστημα, επομένως, κατά κανόνα, περιγράφονται από ένα μοντέλο συνεχών τυχαίων μεταβλητών. Από αυτή την άποψη, οι περισσότερες στατιστικές μέθοδοι λαμβάνουν υπόψη τις συνεχείς κατανομές. Μία από αυτές τις κατανομές, που παίζει θεμελιώδη ρόλο στη μαθηματική στατιστική, είναι κανονική ή Gaussian κατανομή.

Αυτό οφείλεται σε διάφορους λόγους.

1. Πρώτα απ 'όλα, πολλές πειραματικές παρατηρήσεις μπορούν να περιγραφούν με επιτυχία χρησιμοποιώντας μια κανονική κατανομή. Θα πρέπει να σημειωθεί αμέσως ότι δεν υπάρχουν κατανομές εμπειρικών δεδομένων που θα ήταν ακριβώς φυσιολογικές, καθώς μια κανονικά κατανεμημένη τυχαία τιμήείναι στην περιοχή από έως , κάτι που δεν συμβαίνει ποτέ στην πράξη. Ωστόσο, η κανονική κατανομή είναι πολύ συχνά μια καλή προσέγγιση.

Είτε πραγματοποιούνται μετρήσεις βάρους, ύψους και άλλων φυσιολογικών παραμέτρων του ανθρώπινου σώματος - παντού ένας πολύ μεγάλος αριθμός τυχαίων παραγόντων (φυσικές αιτίες και σφάλματα μέτρησης) επηρεάζουν τα αποτελέσματα. Και, κατά κανόνα, η επίδραση καθενός από αυτούς τους παράγοντες είναι ασήμαντη. Η πείρα δείχνει ότι τα αποτελέσματα σε τέτοιες περιπτώσεις θα διανέμονται περίπου κανονικά.

2. Πολλές κατανομές που σχετίζονται με ένα τυχαίο δείγμα, με αύξηση του όγκου του τελευταίου, γίνονται κανονικές.

3. Η κανονική κατανομή ταιριάζει πολύ ως μια κατά προσέγγιση περιγραφή άλλων συνεχείς διανομές(για παράδειγμα, ασύμμετρη).

4. Η κανονική κατανομή έχει μια σειρά από ευνοϊκές μαθηματικές ιδιότητες, οι οποίες εξασφάλισαν σε μεγάλο βαθμό την ευρεία χρήση της στις στατιστικές.

Παράλληλα, πρέπει να σημειωθεί ότι στα ιατρικά δεδομένα υπάρχουν πολλές πειραματικές κατανομές που δεν μπορούν να περιγραφούν από το μοντέλο κανονικής κατανομής. Για να γίνει αυτό, οι στατιστικές έχουν αναπτύξει μεθόδους που συνήθως ονομάζονται "Μη παραμετρικές".

Η επιλογή μιας στατιστικής μεθόδου που είναι κατάλληλη για την επεξεργασία των δεδομένων ενός συγκεκριμένου πειράματος θα πρέπει να γίνεται ανάλογα με το αν τα δεδομένα που λαμβάνονται ανήκουν στον κανονικό νόμο κατανομής. Ο έλεγχος υποθέσεων για την υποταγή ενός σημείου στον νόμο της κανονικής κατανομής πραγματοποιείται χρησιμοποιώντας ένα ιστόγραμμα της κατανομής συχνότητας (γραφική παράσταση), καθώς και μια σειρά στατιστικών κριτηρίων. Ανάμεσα τους:

Κριτήριο ασυμμετρίας ( σι );

Κριτήρια ελέγχου για κύρτωση ( σολ );

Κριτήριο Shapiro–Wilks ( W ) .

Για κάθε παράμετρο πραγματοποιείται ανάλυση της φύσης της κατανομής των δεδομένων (ονομάζεται επίσης δοκιμή για την κανονικότητα της κατανομής). Για να κριθεί με σιγουριά η συμμόρφωση της κατανομής παραμέτρων με τον κανονικό νόμο, απαιτείται ένας αρκετά μεγάλος αριθμός μονάδων παρατήρησης (τουλάχιστον 30 τιμές).

Για μια κανονική κατανομή, τα κριτήρια λοξότητας και κύρτωσης λαμβάνουν την τιμή 0. Εάν η κατανομή μετατοπιστεί προς τα δεξιά σι > 0 (θετική ασυμμετρία), με σι < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае κανονικός νόμος σολ =0. Στο σολ > 0 η καμπύλη κατανομής είναι πιο έντονη αν σολ < 0 пик более сглаженный, чем функция нормального распределения.

Για τον έλεγχο της κανονικότητας χρησιμοποιώντας τη δοκιμή Shapiro-Wilks, απαιτείται να βρεθεί η τιμή αυτού του κριτηρίου χρησιμοποιώντας στατιστικούς πίνακες στο απαιτούμενο επίπεδο σημαντικότητας και ανάλογα με τον αριθμό των μονάδων παρατήρησης (βαθμοί ελευθερίας). Παράρτημα 1. Η υπόθεση της κανονικότητας απορρίπτεται για μικρές τιμές αυτού του κριτηρίου, κατά κανόνα, για w <0,8.

Ένα σύνολο αντικειμένων ή φαινομένων που ενώνονται με κάποιο κοινό χαρακτηριστικό ή ιδιότητα ποιοτικής ή ποσοτικής φύσης ονομάζεται αντικείμενο παρατήρησης .

Κάθε αντικείμενο στατιστικής παρατήρησης αποτελείται από ξεχωριστά στοιχεία - μονάδες παρατήρησης .

Τα αποτελέσματα της στατιστικής παρατήρησης είναι αριθμητικές πληροφορίες - δεδομένα . ΣΤΑΤΙΣΤΙΚΑ ΔΕΔΟΜΕΝΑ - πρόκειται για πληροφορίες σχετικά με τις αξίες που έχει λάβει το χαρακτηριστικό που ενδιαφέρει τον ερευνητή στον στατιστικό πληθυσμό.

Εάν οι τιμές ενός χαρακτηριστικού εκφράζονται ως αριθμοί, τότε το χαρακτηριστικό καλείται ποσοτικός .

Εάν ένα χαρακτηριστικό χαρακτηρίζει κάποια ιδιότητα ή κατάσταση των στοιχείων του πληθυσμού, τότε το χαρακτηριστικό καλείται ποιότητα .

Εάν όλα τα στοιχεία του πληθυσμού υπόκεινται σε μελέτη (συνεχής παρατήρηση), τότε ο στατιστικός πληθυσμός ονομάζεται γενικός.

Εάν ένα μέρος των στοιχείων του γενικού πληθυσμού υπόκειται σε έρευνα, τότε ονομάζεται στατιστικός πληθυσμός επιλεκτικός (επιλεκτικός) . Ένα δείγμα από τον πληθυσμό λαμβάνεται τυχαία, έτσι ώστε καθένα από τα n μέλη του δείγματος να έχει ίσες πιθανότητες να επιλεγεί.

Οι τιμές του χαρακτηριστικού αλλάζουν (μεταβλητές) όταν μετακινούνται από ένα στοιχείο του πληθυσμού σε άλλο, επομένως, στις στατιστικές, ονομάζονται επίσης διαφορετικές τιμές του χαρακτηριστικού επιλογές . Οι επιλογές συνήθως υποδηλώνονται με μικρά λατινικά γράμματα x, y, z.

Ο τακτικός αριθμός της παραλλαγής (χαρακτηριστική τιμή) ονομάζεται τάξη . x 1 - 1η επιλογή (1η τιμή του χαρακτηριστικού), x 2 - 2η επιλογή (2η τιμή του χαρακτηριστικού), x i - i-η επιλογή (i-η τιμή του χαρακτηριστικού).

Μια σειρά από τιμές χαρακτηριστικών (επιλογές) ταξινομημένες σε αύξουσα ή φθίνουσα σειρά με τα αντίστοιχα βάρη τους ονομάζεται σειρά παραλλαγής (σειρά διανομής).

Οπως και Ζυγός εμφανίζονται συχνότητες ή συχνότητες.

Συχνότητα(m i) δείχνει πόσες φορές εμφανίζεται αυτή ή εκείνη η παραλλαγή (τιμή χαρακτηριστικού) στον στατιστικό πληθυσμό.

Συχνότητα ή σχετική συχνότητα(w i) δείχνει ποια αναλογία των μονάδων πληθυσμού έχουν τη μία ή την άλλη παραλλαγή. Η συχνότητα υπολογίζεται ως ο λόγος της συχνότητας μιας ή άλλης παραλλαγής προς το άθροισμα όλων των συχνοτήτων της σειράς.

. (6.1)

Το άθροισμα όλων των συχνοτήτων είναι 1.

. (6.2)

Οι μεταβλητές σειρές είναι διακριτές και ενδιάμεσες.

Σειρά διακριτών παραλλαγώνσυνήθως κατασκευάζονται στην περίπτωση που οι τιμές του υπό μελέτη χαρακτηριστικού μπορεί να διαφέρουν μεταξύ τους κατά τουλάχιστον κάποια πεπερασμένη τιμή.

Σε διακριτές μεταβλητές σειρές, καθορίζονται οι σημειακές τιμές ενός χαρακτηριστικού.

Η γενική άποψη της σειράς διακριτών παραλλαγών φαίνεται στον Πίνακα 6.1.

Πίνακας 6.1

όπου i = 1, 2, ..., μεγάλο.

Σε σειρές μεταβολών διαστήματος σε κάθε διάστημα, διακρίνονται τα άνω και κάτω όρια του διαστήματος.

Η διαφορά μεταξύ των άνω και κάτω ορίων του διαστήματος ονομάζεται διαφορά διαστήματος ή το μήκος (μέγεθος) του διαστήματος .

Η τιμή του πρώτου διαστήματος k 1 καθορίζεται από τον τύπο:

k 1 = α 2 - α 1;

δεύτερο: k 2 = α 3 - α 2; …

τελευταία: k l = α λ - α λ -1 .

Γενικά διαφορά διαστήματοςΤο k i υπολογίζεται με τον τύπο:

k i \u003d x i (μέγ.) - x i (ελάχ.) . (6.3)

Αν ένα διάστημα έχει και τα δύο όρια, τότε καλείται κλειστό .

Το πρώτο και το τελευταίο διαστήματα μπορεί να είναι Άνοιξε , δηλ. έχουν μόνο ένα σύνορο.

Για παράδειγμα, το πρώτο διάστημα μπορεί να οριστεί ως "έως 100", το δεύτερο - "100-110", ... , το προτελευταίο - "190-200", το τελευταίο - "200 και περισσότερα". Είναι προφανές ότι το πρώτο διάστημα δεν έχει κάτω όριο και το τελευταίο δεν έχει άνω όριο, και τα δύο είναι ανοιχτά.

Συχνά τα ανοιχτά διαστήματα πρέπει να κλείνουν υπό όρους. Για να γίνει αυτό, συνήθως η τιμή του πρώτου διαστήματος λαμβάνεται ίση με την τιμή του δεύτερου και η τιμή του τελευταίου - η τιμή του προτελευταίου. Στο παράδειγμά μας, η τιμή του δεύτερου διαστήματος είναι 110-100=10, επομένως, το κατώτερο όριο του πρώτου διαστήματος υπό όρους θα είναι 100-10=90. η τιμή του προτελευταίου διαστήματος είναι 200-190=10, επομένως, το ανώτερο όριο του τελευταίου διαστήματος θα είναι συμβατικά 200+10=210.

Επιπλέον, μπορεί να προκύψουν διαστήματα διαφορετικού μήκους στη σειρά μεταβολών διαστήματος. Εάν τα διαστήματα στη σειρά παραλλαγών έχουν το ίδιο μήκος (διαφορά διαστήματος), καλούνται ίσο σε μέγεθος , σε διαφορετική περίπτωση - άνισος.

Κατά την κατασκευή μιας σειράς παραλλαγής διαστήματος, συχνά προκύπτει το πρόβλημα της επιλογής του μεγέθους των διαστημάτων (διαφορά διαστήματος).

Για να προσδιορίσετε το βέλτιστο μέγεθος των διαστημάτων (σε περίπτωση που μια σειρά κατασκευάζεται με ίσα διαστήματα), εφαρμόστε Φόρμουλα Sturges:

, (6.4)

όπου n είναι ο αριθμός των πληθυσμιακών μονάδων,

x (max) και x (min) - οι μεγαλύτερες και μικρότερες τιμές των παραλλαγών της σειράς.

Για τον χαρακτηρισμό των μεταβλητών σειρών, μαζί με τις συχνότητες και τις συχνότητες, χρησιμοποιούνται οι συσσωρευμένες συχνότητες και συχνότητες.

Αθροιστικές συχνότητες (Συχνότητες)Δείξτε πόσες μονάδες του πληθυσμού (ποιο μέρος τους) δεν υπερβαίνουν μια δεδομένη τιμή (επιλογή) x.

Συσσωρευμένες συχνότητες ( v i) σύμφωνα με τα δεδομένα διακριτής σειράς μπορούν να υπολογιστούν χρησιμοποιώντας τον ακόλουθο τύπο:

. (6.5)

Για μια σειρά μεταβολών διαστήματος, αυτό είναι το άθροισμα των συχνοτήτων (συχνοτήτων) όλων των διαστημάτων που δεν υπερβαίνουν αυτό.

Μια διακριτή μεταβλητή σειρά μπορεί να αναπαρασταθεί γραφικά χρησιμοποιώντας πολυγωνική κατανομή συχνοτήτων ή συχνοτήτων.

Κατά την κατασκευή ενός πολυγώνου διανομής, οι τιμές του χαρακτηριστικού (επιλογές) σχεδιάζονται κατά μήκος του άξονα της τετμημένης και οι συχνότητες ή οι συχνότητες σχεδιάζονται κατά μήκος του άξονα τεταγμένων. Στη διασταύρωση των χαρακτηριστικών τιμών και των αντίστοιχων συχνοτήτων τους (συχνότητες), σχεδιάζονται σημεία, τα οποία, με τη σειρά τους, συνδέονται με τμήματα. Η διακεκομμένη γραμμή που προκύπτει έτσι ονομάζεται πολύγωνο της κατανομής των συχνοτήτων (συχνότητες).

x k
x2
x 1 x i


Ρύζι. 6.1.

Οι σειρές μεταβλητών διαστήματος μπορούν να αναπαρασταθούν γραφικά χρησιμοποιώντας ιστογράμματα, δηλ. ραβδόγραμμα.

Κατά την κατασκευή ενός ιστογράμματος κατά μήκος της τετμημένης, σχεδιάζονται οι τιμές του υπό μελέτη χαρακτηριστικού (όρια διαστημάτων).

Σε περίπτωση που τα διαστήματα είναι του ίδιου μεγέθους, οι συχνότητες ή οι συχνότητες μπορούν να απεικονιστούν κατά μήκος του άξονα y.

Εάν τα διαστήματα έχουν διαφορετικές τιμές, είναι απαραίτητο να σχεδιάσετε τις τιμές της απόλυτης ή σχετικής πυκνότητας κατανομής κατά μήκος του άξονα y.

Απόλυτη πυκνότητα- ο λόγος της συχνότητας του διαστήματος προς το μέγεθος του διαστήματος:

; (6.6)

όπου: f(a) i - απόλυτη πυκνότητα του διαστήματος i-ου.

m i - συχνότητα του διαστήματος i-ου.

k i - η τιμή του διαστήματος i-ου (διαφορά διαστήματος).

Η απόλυτη πυκνότητα δείχνει πόσες μονάδες πληθυσμού είναι ανά μοναδιαίο διάστημα.

Σχετική πυκνότητα- ο λόγος της συχνότητας του διαστήματος προς το μέγεθος του διαστήματος:

; (6.7)

όπου: f(o) i - σχετική πυκνότητα του διαστήματος i-ου.

w i - συχνότητα του διαστήματος i-ου.

Η σχετική πυκνότητα δείχνει ποιο μέρος των μονάδων πληθυσμού εμπίπτει στη μονάδα διαστήματος.

α λ
ένα 1 x i
Α2

Τόσο οι διακριτές όσο και οι σειρές διαστήματος παραλλαγής μπορούν να αναπαρασταθούν γραφικά ως αθροιστικές και ενδεικτικές.

Κατά την κατασκευή σωρεύεταιΣύμφωνα με τα δεδομένα διακριτής σειράς, η τετμημένη δείχνει τις τιμές του χαρακτηριστικού (επιλογές) και η τεταγμένη δείχνει τις συσσωρευμένες συχνότητες ή συχνότητες. Στη διασταύρωση των τιμών του χαρακτηριστικού (επιλογές) και των συσσωρευμένων συχνοτήτων (συχνοτήτων) που αντιστοιχούν σε αυτά, κατασκευάζονται σημεία, τα οποία, με τη σειρά τους, συνδέονται με τμήματα ή μια καμπύλη. Η διακεκομμένη γραμμή (καμπύλη) που προκύπτει έτσι ονομάζεται αθροιστική (αθροιστική καμπύλη).

Κατά την κατασκευή του αθροίσματος σύμφωνα με τα δεδομένα της σειράς διαστημάτων, τα όρια των διαστημάτων σχεδιάζονται κατά μήκος της τετμημένης. Τα τετμημένα των σημείων είναι τα ανώτερα όρια των διαστημάτων. Οι τεταγμένες σχηματίζουν τις συσσωρευμένες συχνότητες (συχνότητες) των αντίστοιχων διαστημάτων. Συχνά προστίθεται ένα ακόμη σημείο, η τετμημένη του οποίου είναι το κατώτερο όριο του πρώτου διαστήματος και η τεταγμένη είναι μηδέν. Συνδέοντας τα σημεία με τμήματα ή μια καμπύλη, παίρνουμε τη σώρευση.

Ογκίβακατασκευάζεται παρόμοια με τη συσσώρευση με τη μόνη διαφορά ότι τα σημεία που αντιστοιχούν στις συσσωρευμένες συχνότητες (συχνότητες) σχεδιάζονται στον άξονα της τετμημένης και οι χαρακτηριστικές τιμές (επιλογές) σχεδιάζονται κατά μήκος του άξονα τεταγμένων.

Καλείται μια ομάδα αριθμών που ενώνονται με κάποιο χαρακτηριστικό σύνολο.

Όπως σημειώθηκε παραπάνω, το κύριο στατιστικό αθλητικό υλικό είναι μια ομάδα διαφορετικών αριθμών που δεν δίνουν στον προπονητή μια ιδέα για την ουσία του φαινομένου ή της διαδικασίας. Η πρόκληση είναι να μετατρέψουμε αυτόν τον πληθυσμό σε σύστημα και να χρησιμοποιήσουμε τους δείκτες του για να αποκτήσουμε τις απαιτούμενες πληροφορίες.

Η σύνταξη μιας μεταβλητής σειράς είναι ακριβώς ο σχηματισμός ενός συγκεκριμένου μαθηματικού

Παράδειγμα 2. 34 σκιέρ κατέγραψαν τον ακόλουθο χρόνο ανάκτησης του καρδιακού ρυθμού αφού πέρασαν την απόσταση (σε δευτερόλεπτα):

81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

Όπως μπορείτε να δείτε, αυτή η ομάδα αριθμών δεν φέρει καμία πληροφορία.

Για να συντάξουμε μια σειρά παραλλαγών, εκτελούμε πρώτα τη λειτουργία σειρά κατάταξης -διάταξη αριθμών σε αύξουσα ή φθίνουσα σειρά. Για παράδειγμα, με αύξουσα σειρά, η κατάταξη έχει ως αποτέλεσμα τα εξής.

78; 78; 78; 78; 78; 78;

81; 81; 81; 81; 81; 81; 81; 81; 81;

84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

Με φθίνουσα σειρά, η κατάταξη καταλήγει σε αυτήν την ομάδα αριθμών:

84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

81; 81; 81; 81; 8!; 81: 81; 81; 81;

78; 78; 78; 78; 78; 78;

Μετά την κατάταξη, η παράλογη μορφή γραφής αυτής της ομάδας αριθμών γίνεται προφανής - οι ίδιοι αριθμοί επαναλαμβάνονται πολλές φορές. Επομένως, προκύπτει μια φυσική σκέψη για να μεταμορφώσει την εγγραφή με τέτοιο τρόπο ώστε να υποδείξει ποιος αριθμός επαναλαμβάνεται πόσες φορές. Για παράδειγμα, λαμβάνοντας υπόψη την κατάταξη με αύξουσα σειρά:

Εδώ στα αριστερά υπάρχει ένας αριθμός που υποδεικνύει το χρόνο ανάκτησης του σφυγμού του αθλητή, στα δεξιά είναι ο αριθμός των επαναλήψεων αυτής της ανάγνωσης σε αυτήν την ομάδα των 34 αθλητών.

Σύμφωνα με τις παραπάνω έννοιες των μαθηματικών συμβόλων, η εξεταζόμενη ομάδα μετρήσεων θα συμβολίζεται με κάποιο γράμμα, για παράδειγμα x. Δεδομένης της αύξουσας σειράς των αριθμών σε αυτήν την ομάδα: x 1 -74 s; x 2 - 78 s; x 3 - 81 s; x 4 - 84 s; x 5 - 85 s; x 6 -x n - 90 s, κάθε θεωρούμενος αριθμός μπορεί να συμβολιστεί με το σύμβολο X i .

Ας υποδηλώσουμε τον αριθμό των επαναλήψεων των εξεταζόμενων μετρήσεων με το γράμμα n. Επειτα:

n 1 =4; n 2 =6; n 3 =9; n4=11; n 5 =3;n 6 =n n =1, και κάθε αριθμός επαναλήψεων μπορεί να συμβολιστεί ως n i.

Ο συνολικός αριθμός των μετρήσεων που λαμβάνονται, όπως προκύπτει από τη συνθήκη του παραδείγματος, είναι 34. Αυτό σημαίνει ότι το άθροισμα όλων των n είναι 34. Ή σε συμβολική έκφραση:

Ας υποδηλώσουμε αυτό το άθροισμα με ένα γράμμα - n. Στη συνέχεια, τα αρχικά δεδομένα του εξεταζόμενου παραδείγματος μπορούν να γραφούν σε αυτή τη μορφή (Πίνακας 1).

Η προκύπτουσα ομάδα αριθμών είναι μια μετασχηματισμένη σειρά χαοτικά διάσπαρτων αναγνώσεων που λαμβάνονται από τον εκπαιδευτή στην αρχή της εργασίας.

Τραπέζι 1

x i n i
n=34

Μια τέτοια ομάδα είναι ένα συγκεκριμένο σύστημα, οι παράμετροι του οποίου χαρακτηρίζουν τις μετρήσεις. Καλούνται οι αριθμοί που αντιπροσωπεύουν τα αποτελέσματα των μετρήσεων (x i). επιλογές? n i - ο αριθμός των επαναλήψεών τους - καλούνται συχνότητες? n - άθροισμα όλων των συχνοτήτων - ναι ο όγκος του αδρανούς.

Το σύστημα που προκύπτει ονομάζεται σειρά παραλλαγής.Μερικές φορές αυτές οι σειρές ονομάζονται εμπειρικές ή στατιστικές.

Είναι εύκολο να δούμε ότι μια ειδική περίπτωση μιας μεταβλητής σειράς είναι δυνατή, όταν όλες οι συχνότητες είναι ίσες με ένα n i ==1, δηλαδή, κάθε μέτρηση σε μια δεδομένη ομάδα αριθμών έγινε μόνο μία φορά.

Η προκύπτουσα μεταβλητή σειρά, όπως κάθε άλλη, μπορεί να αναπαρασταθεί γραφικά. Για να σχεδιάσετε τη σειρά που προκύπτει, πρέπει πρώτα να συμφωνήσετε σχετικά με την κλίμακα στον οριζόντιο και τον κάθετο άξονα.

Σε αυτό το πρόβλημα, στον οριζόντιο άξονα θα σχεδιάσουμε τις τιμές του χρόνου ανάκτησης του παλμού (x 1) με τέτοιο τρόπο ώστε η μονάδα μήκους, που επιλέγεται αυθαίρετα, να αντιστοιχεί στην τιμή του ενός δευτερολέπτου. Θα αρχίσουμε να αναβάλλουμε αυτές τις τιμές από 70 δευτερόλεπτα, υποχωρώντας υπό όρους από τη διασταύρωση των δύο αξόνων 0.

Στον κατακόρυφο άξονα, σχεδιάζουμε τις τιμές των συχνοτήτων της σειράς μας (n i), λαμβάνοντας την κλίμακα: μια μονάδα μήκους είναι ίση με μια μονάδα συχνότητας.

Έχοντας προετοιμάσει έτσι τις συνθήκες για τη χάραξη ενός γραφήματος, προχωράμε στην εργασία με την προκύπτουσα μεταβλητή σειρά.

Το πρώτο ζεύγος αριθμών x 1 \u003d 74, n 1 \u003d 4 απεικονίζεται στο γράφημα ως εξής: στον άξονα x. βρείτε το x 1 =74 και επαναφέρουμε την κάθετο από αυτό το σημείο, στον άξονα n βρίσκουμε n 1 =4 και χαράσσουμε μια οριζόντια ευθεία από αυτήν μέχρι να διασταυρωθεί με την προηγουμένως αποκατεστημένη κάθετο. Και οι δύο γραμμές - κάθετες και οριζόντιες - είναι βοηθητικές γραμμές και επομένως εφαρμόζονται στο σχέδιο με μια διακεκομμένη γραμμή. Το σημείο τομής τους είναι στην κλίμακα αυτού του γραφήματος ο λόγος X 1 =74 και n 1 =4.

Όλα τα άλλα σημεία του γραφήματος απεικονίζονται με τον ίδιο τρόπο. Στη συνέχεια συνδέονται με τμήματα γραμμής. Για να έχει η γραφική παράσταση κλειστή μορφή, συνδέουμε τα ακραία σημεία με τμήματα με γειτονικά σημεία του οριζόντιου άξονα.

Το σχήμα που προκύπτει είναι ένα γράφημα της σειράς παραλλαγών μας (Εικ. 1).

Είναι αρκετά σαφές ότι κάθε σειρά παραλλαγών αντιπροσωπεύεται από το δικό της γράφημα.

Ρύζι. 1. Γραφική αναπαράσταση της σειράς παραλλαγής.

Στο σχ. 1 είναι ορατό:

1) από όλους τους εξετασθέντες, η μεγαλύτερη ομάδα αποτελούνταν από αθλητές, των οποίων ο χρόνος ανάκτησης σφυγμού ήταν 84 δευτερόλεπτα.

2) για πολλούς αυτός ο χρόνος είναι 81 s.

3) η μικρότερη ομάδα αποτελούνταν από αθλητές με σύντομο χρόνο ανάκτησης σφυγμού - 74 δευτερόλεπτα και μεγάλο - 90 δευτερόλεπτα.

Έτσι, μετά την ολοκλήρωση μιας σειράς δοκιμών, θα πρέπει κανείς να ταξινομήσει τους ληφθέντες αριθμούς και να συντάξει μια μεταβλητή σειρά, η οποία είναι ένα συγκεκριμένο μαθηματικό σύστημα. Για λόγους σαφήνειας, η σειρά παραλλαγών μπορεί να απεικονιστεί με ένα γράφημα.

Η παραπάνω σειρά παραλλαγών ονομάζεται επίσης διακεκριμένοςεπόμενο - ένα στο οποίο κάθε επιλογή εκφράζεται με έναν αριθμό.

Ας δώσουμε μερικά ακόμη παραδείγματα σχετικά με τη σύνταξη παραλλαγών σειρών.

Παράδειγμα 3 12 σκοπευτές που εκτέλεσαν μια επιρρεπή άσκηση 10 βολών έδειξαν τα ακόλουθα αποτελέσματα (σε πόντους):

94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

Για να σχηματίσουμε μια μεταβλητή σειρά, θα ταξινομήσουμε αυτούς τους αριθμούς.

94; 94; 94; 94; 94;

Μετά την κατάταξη, συνθέτουμε μια σειρά παραλλαγών (Πίνακας 3).

Σειρά στατιστικής κατανομής- αυτή είναι μια διατεταγμένη κατανομή πληθυσμιακών μονάδων σε ομάδες σύμφωνα με ένα συγκεκριμένο διαφορετικό χαρακτηριστικό.
Ανάλογα με το χαρακτηριστικό στο οποίο βασίζεται ο σχηματισμός μιας σειράς διανομής, υπάρχουν σειρές διανομής χαρακτηριστικών και παραλλαγών.

Η παρουσία ενός κοινού χαρακτηριστικού αποτελεί τη βάση για το σχηματισμό ενός στατιστικού πληθυσμού, ο οποίος είναι τα αποτελέσματα μιας περιγραφής ή μέτρησης κοινών χαρακτηριστικών των αντικειμένων μελέτης.

Αντικείμενο μελέτης στη στατιστική είναι μεταβαλλόμενα (μεταβλητά) χαρακτηριστικά ή στατιστικά χαρακτηριστικά.

Τύποι στατιστικών χαρακτηριστικών.

Οι σειρές διανομής ονομάζονται σειρές χαρακτηριστικών.χτισμένο σε ποιοτικούς λόγους. Προσδιοριστικό- αυτό είναι ένα σημάδι που έχει όνομα (για παράδειγμα, επάγγελμα: μοδίστρα, δάσκαλος κ.λπ.).
Είναι σύνηθες να οργανώνετε τη σειρά διανομής με τη μορφή πινάκων. Στον πίνακα. Το 2.8 δείχνει μια σειρά ιδιοτήτων κατανομής.
Πίνακας 2.8 - Κατανομή τύπων νομικής συνδρομής που παρέχεται από δικηγόρους σε πολίτες μιας από τις περιοχές της Ρωσικής Ομοσπονδίας.

Σειρά παραλλαγήςείναι οι τιμές χαρακτηριστικών (ή εύρη τιμών) και οι συχνότητές τους.
Οι σειρές παραλλαγής είναι σειρές διανομήςχτισμένο σε ποσοτική βάση. Οποιαδήποτε μεταβλητή σειρά αποτελείται από δύο στοιχεία: παραλλαγές και συχνότητες.
Οι παραλλαγές είναι μεμονωμένες τιμές ενός χαρακτηριστικού που λαμβάνει σε μια σειρά παραλλαγών.
Οι συχνότητες είναι οι αριθμοί μεμονωμένων παραλλαγών ή κάθε ομάδα της σειράς παραλλαγών, δηλ. Αυτοί είναι αριθμοί που δείχνουν πόσο συχνά εμφανίζονται ορισμένες επιλογές σε μια σειρά διανομής. Το άθροισμα όλων των συχνοτήτων καθορίζει το μέγεθος ολόκληρου του πληθυσμού, τον όγκο του.
Οι συχνότητες ονομάζονται συχνότητες, εκφρασμένες σε κλάσματα μονάδας ή ως ποσοστό του συνόλου. Αντίστοιχα, το άθροισμα των συχνοτήτων είναι ίσο με 1 ή 100%. Η μεταβλητή σειρά μας επιτρέπει να αξιολογήσουμε τη μορφή του νόμου κατανομής με βάση τα πραγματικά δεδομένα.

Ανάλογα με τη φύση της παραλλαγής του χαρακτηριστικού, υπάρχουν σειρές διακριτών και διαστημάτων μεταβολής.
Ένα παράδειγμα μιας διακριτής μεταβλητής σειράς δίνεται στον Πίνακα. 2.9.
Πίνακας 2.9 - Κατανομή οικογενειών με βάση τον αριθμό των δωματίων που καταλαμβάνονταν σε μεμονωμένα διαμερίσματα το 1989 στη Ρωσική Ομοσπονδία.

Η πρώτη στήλη του πίνακα παρουσιάζει παραλλαγές μιας διακριτής μεταβλητής σειράς, η δεύτερη στήλη περιέχει τις συχνότητες της μεταβλητής σειράς και η τρίτη στήλη περιέχει τους δείκτες συχνότητας.

Σειρά παραλλαγής

Στον γενικό πληθυσμό, διερευνάται ένα συγκεκριμένο ποσοτικό χαρακτηριστικό. Ένα δείγμα όγκου εξάγεται τυχαία από αυτό n, δηλαδή, ο αριθμός των στοιχείων στο δείγμα είναι n. Στο πρώτο στάδιο της στατιστικής επεξεργασίας, κυμαίνεταιδείγματα, δηλ. παραγγελία αριθμού x 1 , x 2 , …, x nΑύξουσα. Κάθε παρατηρούμενη τιμή x iπου ονομάζεται επιλογή. Συχνότητα m iείναι ο αριθμός των παρατηρήσεων της τιμής x iστο δείγμα. Σχετική συχνότητα (συχνότητα) w iείναι ο λόγος συχνότητας m iστο μέγεθος του δείγματος n: .
Κατά τη μελέτη μιας μεταβλητής σειράς, χρησιμοποιούνται επίσης οι έννοιες της αθροιστικής συχνότητας και της αθροιστικής συχνότητας. Αφήνω Χκάποιο νούμερο. Στη συνέχεια, ο αριθμός των επιλογών , των οποίων οι τιμές είναι μικρότερες Χ, ονομάζεται συσσωρευμένη συχνότητα: για x i nονομάζεται συσσωρευμένη συχνότητα w i max .
Ένα χαρακτηριστικό ονομάζεται διακριτά μεταβλητό εάν οι επιμέρους τιμές του (παραλλαγές) διαφέρουν μεταξύ τους κατά κάποιο πεπερασμένο ποσό (συνήθως ακέραιος). Μια μεταβλητή σειρά ενός τέτοιου χαρακτηριστικού ονομάζεται διακριτή μεταβλητή σειρά.

Πίνακας 1. Γενική άποψη της διακριτής μεταβλητής σειράς συχνοτήτων

Τιμές χαρακτηριστικώνx i x 1 x2 x n
Συχνότητεςm i m 1 m2 m n

Ένα χαρακτηριστικό ονομάζεται συνεχώς μεταβαλλόμενο εάν οι τιμές του διαφέρουν μεταξύ τους κατά ένα αυθαίρετα μικρό ποσό, δηλ. το πρόσημο μπορεί να πάρει οποιαδήποτε τιμή σε ένα ορισμένο διάστημα. Μια σειρά συνεχούς μεταβολής για ένα τέτοιο χαρακτηριστικό ονομάζεται σειρά διαστήματος.

Πίνακας 2. Γενική άποψη της σειράς συχνοτήτων μεταβολής διαστήματος

Πίνακας 3. Γραφικές εικόνες της σειράς παραλλαγής

ΣειράΠολύγωνο ή ιστόγραμμαΕμπειρική συνάρτηση κατανομής
Διακεκριμένος
διάστημα
Εξετάζοντας τα αποτελέσματα των παρατηρήσεων, καθορίζεται πόσες τιμές των παραλλαγών έπεσαν σε κάθε συγκεκριμένο διάστημα. Υποτίθεται ότι κάθε διάστημα ανήκει σε ένα από τα άκρα του: είτε σε όλες τις περιπτώσεις το αριστερό (πιο συχνά), είτε σε όλες τις περιπτώσεις το δεξί, και οι συχνότητες ή οι συχνότητες δείχνουν τον αριθμό των επιλογών που περιέχονται στα υποδεικνυόμενα όρια. Διαφορές a i – a i +1ονομάζονται επιμέρους διαστήματα. Για να απλοποιηθούν οι επόμενοι υπολογισμοί, η σειρά μεταβολών διαστήματος μπορεί να αντικατασταθεί από μια υπό όρους διακριτή. Σε αυτή την περίπτωση, η μέση τιμή ΕγώΤο -ο διάστημα λαμβάνεται ως επιλογή x iκαι την αντίστοιχη συχνότητα διαστήματος m i- για τη συχνότητα αυτού του διαστήματος.
Για τη γραφική αναπαράσταση μεταβλητών σειρών, το πολύγωνο, το ιστόγραμμα, η αθροιστική καμπύλη και η συνάρτηση εμπειρικής κατανομής χρησιμοποιούνται συχνότερα.

Στον πίνακα. 2.3 (Ομαδοποίηση του πληθυσμού της Ρωσίας σύμφωνα με το μέγεθος του μέσου κατά κεφαλήν εισοδήματος τον Απρίλιο 1994) παρουσιάζεται σειρές παραλλαγής διαστήματος.
Είναι βολικό να αναλύεται η σειρά διανομής χρησιμοποιώντας μια γραφική αναπαράσταση, η οποία καθιστά επίσης δυνατή την κρίση του σχήματος της διανομής. Μια οπτική αναπαράσταση της φύσης της αλλαγής στις συχνότητες της μεταβλητής σειράς δίνεται από πολύγωνο και ιστόγραμμα.
Το πολύγωνο χρησιμοποιείται κατά την εμφάνιση διακριτών μεταβλητών σειρών.
Ας απεικονίσουμε, για παράδειγμα, γραφικά την κατανομή του αποθέματος κατοικιών ανά τύπο διαμερισμάτων (Πίνακας 2.10).
Πίνακας 2.10 - Κατανομή του οικιστικού αποθέματος της αστικής περιοχής ανά τύπο διαμερισμάτων (στοιχεία υπό όρους).


Ρύζι. Πολύγωνο διανομής κατοικιών


Στον άξονα y, μπορούν να απεικονιστούν όχι μόνο οι τιμές των συχνοτήτων, αλλά και οι συχνότητες της σειράς διακύμανσης.
Το ιστόγραμμα λαμβάνεται για να εμφανίσει τη σειρά μεταβολών διαστήματος. Κατά την κατασκευή ενός ιστογράμματος, οι τιμές των διαστημάτων σχεδιάζονται στον άξονα της τετμημένης και οι συχνότητες απεικονίζονται με ορθογώνια χτισμένα στα αντίστοιχα διαστήματα. Το ύψος των στηλών στην περίπτωση ίσων διαστημάτων πρέπει να είναι ανάλογο με τις συχνότητες. Το ιστόγραμμα είναι ένα γράφημα στο οποίο μια σειρά εμφανίζεται ως ράβδοι η μία δίπλα στην άλλη.
Ας απεικονίσουμε γραφικά τη σειρά κατανομής διαστήματος που δίνεται στον Πίνακα. 2.11.
Πίνακας 2.11 - Κατανομή οικογενειών με βάση το μέγεθος του ζωτικού χώρου ανά άτομο (στοιχεία υπό όρους).
N p / p Ομάδες οικογενειών με βάση το μέγεθος του ζωτικού χώρου ανά άτομο Αριθμός οικογενειών με δεδομένο μέγεθος χώρου διαβίωσης Συσσωρευμένος αριθμός οικογενειών
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ΣΥΝΟΛΟ 115 ----


Ρύζι. 2.2. Ιστόγραμμα της κατανομής των οικογενειών κατά το μέγεθος του ζωτικού χώρου ανά άτομο


Χρησιμοποιώντας τα δεδομένα της συσσωρευμένης σειράς (Πίνακας 2.11), κατασκευάζουμε σωρευτική διανομή.


Ρύζι. 2.3. Η σωρευτική κατανομή των οικογενειών κατά το μέγεθος του ζωτικού χώρου ανά άτομο


Η αναπαράσταση μιας μεταβλητής σειράς με τη μορφή αθροίσματος είναι ιδιαίτερα αποτελεσματική για μεταβλητές σειρές, οι συχνότητες των οποίων εκφράζονται ως κλάσματα ή ποσοστά του αθροίσματος των συχνοτήτων της σειράς.
Αν αλλάξουμε τους άξονες στη γραφική παράσταση της μεταβλητής σειράς με τη μορφή αθροίσματος, τότε παίρνουμε ogivu. Στο σχ. Το 2.4 δείχνει μια ένδειξη που δημιουργήθηκε με βάση τα δεδομένα του Πίνακα. 2.11.
Ένα ιστόγραμμα μπορεί να μετατραπεί σε πολύγωνο κατανομής βρίσκοντας τα μέσα των πλευρών των ορθογωνίων και στη συνέχεια συνδέοντας αυτά τα σημεία με ευθείες γραμμές. Το προκύπτον πολύγωνο κατανομής φαίνεται στο σχ. 2.2 διακεκομμένη γραμμή.
Κατά την κατασκευή ενός ιστογράμματος της κατανομής μιας μεταβλητής σειράς με άνισα διαστήματα, κατά μήκος του άξονα τεταγμένων, δεν εφαρμόζονται συχνότητες, αλλά η πυκνότητα κατανομής του χαρακτηριστικού στα αντίστοιχα διαστήματα.
Η πυκνότητα κατανομής είναι η συχνότητα που υπολογίζεται ανά μονάδα πλάτους διαστήματος, δηλ. πόσες μονάδες σε κάθε ομάδα είναι ανά τιμή διαστήματος μονάδας. Ένα παράδειγμα υπολογισμού της πυκνότητας κατανομής παρουσιάζεται στον Πίνακα. 2.12.
Πίνακας 2.12 - Κατανομή επιχειρήσεων κατά αριθμό εργαζομένων (τα στοιχεία είναι υπό όρους)
N p / p Ομάδες επιχειρήσεων κατά αριθμό εργαζομένων, ανά άτομο. Αριθμός επιχειρήσεων Μέγεθος διαστήματος, pers. Πυκνότητα κατανομής
ΑΛΛΑ 1 2 3=1/2
1 Μέχρι 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ΣΥΝΟΛΟ 147 ---- ----

Για μια γραφική αναπαράσταση της σειράς παραλλαγής μπορεί επίσης να χρησιμοποιηθεί αθροιστική καμπύλη. Με τη βοήθεια του αθροίσματος (η καμπύλη των αθροισμάτων), εμφανίζεται μια σειρά συσσωρευμένων συχνοτήτων. Οι συσσωρευμένες συχνότητες προσδιορίζονται αθροίζοντας διαδοχικά τις συχνότητες ανά ομάδες και δείχνουν πόσες μονάδες του πληθυσμού έχουν τιμές χαρακτηριστικών όχι μεγαλύτερες από την εξεταζόμενη τιμή.


Ρύζι. 2.4. Ogiva κατανομή των οικογενειών ανάλογα με το μέγεθος του ζωτικού χώρου ανά άτομο

Κατά την κατασκευή του αθροίσματος μιας σειράς μεταβολών διαστήματος, οι παραλλαγές της σειράς σχεδιάζονται κατά μήκος του άξονα της τετμημένης και οι συσσωρευμένες συχνότητες κατά μήκος του άξονα τεταγμένων.

Σειρά συνεχούς παραλλαγής

Μια συνεχής μεταβλητή σειρά είναι μια σειρά που βασίζεται σε ένα ποσοτικό στατιστικό πρόσημο. Παράδειγμα. Η μέση διάρκεια των ασθενειών των καταδίκων (ημέρες ανά άτομο) την περίοδο φθινοπώρου-χειμώνα το τρέχον έτος ήταν:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5
ομαδοποίηση- αυτή είναι η διαίρεση του πληθυσμού σε ομάδες που είναι κατά κάποιο τρόπο ομοιογενείς.

Ανάθεση υπηρεσίας. Με την ηλεκτρονική αριθμομηχανή μπορείτε:

  • δημιουργήστε μια σειρά παραλλαγών, να δημιουργήσετε ένα ιστόγραμμα και ένα πολύγωνο.
  • βρείτε δείκτες διακύμανσης (μέσος όρος, τρόπος λειτουργίας (συμπεριλαμβανομένων γραφικών), διάμεσος, εύρος διακύμανσης, τεταρτημόρια, δεκαδικά, τεταρτημόριο συντελεστής διαφοροποίησης, συντελεστής διακύμανσης και άλλοι δείκτες).

Εντολή. Για να ομαδοποιήσετε μια σειρά, πρέπει να επιλέξετε τον τύπο της προκύπτουσας σειράς παραλλαγής (διακεκριμένη ή μεσοδιάστημα) και να καθορίσετε την ποσότητα δεδομένων (αριθμός σειρών). Η λύση που προκύπτει αποθηκεύεται σε ένα αρχείο Word (δείτε το παράδειγμα ομαδοποίησης στατιστικών δεδομένων).

Εάν η ομαδοποίηση έχει ήδη γίνει και το σειρά διακριτών παραλλαγώνή σειρές μεσοδιαστημάτων, τότε πρέπει να χρησιμοποιήσετε την ηλεκτρονική αριθμομηχανή Ενδείξεις παραλλαγής. Έλεγχος της υπόθεσης για το είδος της κατανομήςπαράγονται με χρήση της υπηρεσίας Μελέτη της μορφής διανομής.

Τύποι στατιστικών ομαδοποιήσεων

Σειρά παραλλαγής. Στην περίπτωση των παρατηρήσεων μιας διακριτής τυχαίας μεταβλητής, η ίδια τιμή μπορεί να συναντηθεί πολλές φορές. Τέτοιες τιμές μιας τυχαίας μεταβλητής x i καταγράφονται υποδεικνύοντας n i τον αριθμό των φορών που εμφανίζεται σε n παρατηρήσεις, αυτή είναι η συχνότητα αυτής της τιμής.
Στην περίπτωση μιας συνεχούς τυχαίας μεταβλητής, η ομαδοποίηση χρησιμοποιείται στην πράξη.
  1. Τυπολογική ομαδοποίηση- αυτή είναι η διαίρεση του μελετώμενου ποιοτικά ετερογενούς πληθυσμού σε τάξεις, κοινωνικοοικονομικούς τύπους, ομοιογενείς ομάδες μονάδων. Για να δημιουργήσετε αυτήν την ομαδοποίηση, χρησιμοποιήστε την παράμετρο Discrete variational series.
  2. Η δομική ομαδοποίηση ονομάζεται, στην οποία ένας ομοιογενής πληθυσμός χωρίζεται σε ομάδες που χαρακτηρίζουν τη δομή του σύμφωνα με κάποιο διαφορετικό χαρακτηριστικό. Για να δημιουργήσετε αυτήν την ομαδοποίηση, χρησιμοποιήστε την παράμετρο Interval series.
  3. Μια ομαδοποίηση που αποκαλύπτει τη σχέση μεταξύ των φαινομένων που μελετήθηκαν και των χαρακτηριστικών τους ονομάζεται αναλυτική ομάδα(βλ. αναλυτική ομαδοποίηση σειρών).

Παράδειγμα #1. Σύμφωνα με τον πίνακα 2, δημιουργήστε τη σειρά διανομής για 40 εμπορικές τράπεζες της Ρωσικής Ομοσπονδίας. Σύμφωνα με τη σειρά διανομής που προέκυψε, προσδιορίστε: το μέσο κέρδος ανά μία εμπορική τράπεζα, τις πιστωτικές επενδύσεις κατά μέσο όρο ανά μία εμπορική τράπεζα, τη μέση τιμή και τη μέση τιμή κέρδους. τεταρτημόρια, δεκαδικά, εύρος διακύμανσης, μέση γραμμική απόκλιση, τυπική απόκλιση, συντελεστής διακύμανσης.

Λύση:
Στο κεφάλαιο "Είδος στατιστικής σειράς"επιλέξτε Διακριτή σειρά. Κάντε κλικ στην Επικόλληση από το Excel. Αριθμός ομάδων: σύμφωνα με τον τύπο Sturgess

Αρχές δημιουργίας στατιστικών ομαδοποιήσεων

Μια σειρά από παρατηρήσεις που ταξινομούνται σε αύξουσα σειρά ονομάζεται σειρά παραλλαγών. σημάδι ομαδοποίησηςείναι το ζώδιο με το οποίο ο πληθυσμός χωρίζεται σε ξεχωριστές ομάδες. Λέγεται η βάση της ομάδας. Η ομαδοποίηση μπορεί να βασίζεται τόσο σε ποσοτικά όσο και σε ποιοτικά χαρακτηριστικά.
Μετά τον καθορισμό της βάσης της ομαδοποίησης, θα πρέπει να αποφασιστεί το ζήτημα του αριθμού των ομάδων στις οποίες πρέπει να χωριστεί ο πληθυσμός της μελέτης.

Κατά τη χρήση προσωπικών υπολογιστών για την επεξεργασία στατιστικών δεδομένων, η ομαδοποίηση των μονάδων ενός αντικειμένου πραγματοποιείται χρησιμοποιώντας τυπικές διαδικασίες.
Μια τέτοια διαδικασία βασίζεται στη χρήση του τύπου Sturgess για τον προσδιορισμό του βέλτιστου αριθμού ομάδων:

k = 1+3,322*lg(N)

Όπου k είναι ο αριθμός των ομάδων, N είναι ο αριθμός των πληθυσμιακών μονάδων.

Το μήκος των μερικών διαστημάτων υπολογίζεται ως h=(x max -x min)/k

Στη συνέχεια, μετρήστε τον αριθμό των χτυπημάτων των παρατηρήσεων σε αυτά τα διαστήματα, τα οποία λαμβάνονται ως συχνότητες n i . Λίγες συχνότητες, οι τιμές των οποίων είναι μικρότερες από 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Τα μέσα των διαστημάτων x i =(c i-1 +c i)/2 λαμβάνονται ως νέες τιμές.

Παράδειγμα #3. Ως αποτέλεσμα ενός αυτο-τυχαίου δείγματος 5%, ελήφθη η ακόλουθη κατανομή των προϊόντων κατά περιεκτικότητα σε υγρασία. Υπολογίστε: 1) το μέσο ποσοστό υγρασίας. 2) δείκτες που χαρακτηρίζουν τη διακύμανση της υγρασίας.
Το διάλυμα ελήφθη χρησιμοποιώντας έναν υπολογιστή: Παράδειγμα Νο. 1

Δημιουργήστε μια σειρά παραλλαγών. Με βάση τη σειρά που βρέθηκε, κατασκευάστε ένα πολύγωνο κατανομής, ένα ιστόγραμμα και μια σώρευση. Προσδιορίστε τη λειτουργία και τη διάμεσο.
Λήψη Λύσης

Παράδειγμα. Σύμφωνα με τα αποτελέσματα της επιλεκτικής παρατήρησης (δείγμα Α παράρτημα):
α) κάντε μια σειρά παραλλαγών.
β) υπολογίζει τις σχετικές συχνότητες και τις συσσωρευμένες σχετικές συχνότητες.
γ) να φτιάξετε ένα πολύγωνο.
δ) συνθέτουν μια εμπειρική συνάρτηση κατανομής.
ε) σχεδιάστε την εμπειρική συνάρτηση κατανομής.
στ) να υπολογίσετε αριθμητικά χαρακτηριστικά: αριθμητικός μέσος όρος, διακύμανση, τυπική απόκλιση. Λύση

Με βάση τα δεδομένα που δίνονται στον Πίνακα 4 (Παράρτημα 1) και που αντιστοιχούν στην επιλογή σας, εκτελέστε:

  1. Με βάση τη δομική ομαδοποίηση, κατασκευάστε μια σειρά μεταβλητής συχνότητας και αθροιστικής κατανομής χρησιμοποιώντας ίσα κλειστά διαστήματα, υποθέτοντας ότι ο αριθμός των ομάδων είναι 6. Παρουσιάστε τα αποτελέσματα σε πίνακα και γραφικά.
  2. Αναλύστε τη σειρά μεταβλητής κατανομής υπολογίζοντας:
    • αριθμητική μέση τιμή του χαρακτηριστικού.
    • κατάσταση λειτουργίας, διάμεσος, 1ο τεταρτημόριο, 1ο και 9ο δεκαδικό.
    • τυπική απόκλιση;
    • ο συντελεστής διακύμανσης.
  3. Να συμπεράνω.

Απαιτείται: για να ταξινομήσετε τη σειρά, να δημιουργήσετε μια σειρά κατανομής διαστήματος, να υπολογίσετε τη μέση, τη μέση διακύμανση, τον τρόπο λειτουργίας και τη διάμεσο για τις σειρές εμβέλειας και διαστήματος.

Με βάση τα αρχικά δεδομένα, κατασκευάστε μια διακριτή μεταβλητή σειρά. να το παρουσιάσετε με τη μορφή στατιστικού πίνακα και στατιστικών γραφημάτων. 2). Με βάση τα αρχικά δεδομένα, κατασκευάστε μια σειρά μεταβολών διαστήματος με ίσα διαστήματα. Επιλέξτε μόνοι σας τον αριθμό των διαστημάτων και εξηγήστε αυτήν την επιλογή. Παρουσιάστε τη σειρά παραλλαγών που προκύπτει με τη μορφή στατιστικού πίνακα και στατιστικών γραφημάτων. Αναφέρετε τους τύπους των πινάκων και των γραφημάτων που χρησιμοποιούνται.

Προκειμένου να προσδιοριστεί η μέση διάρκεια εξυπηρέτησης πελατών σε ένα συνταξιοδοτικό ταμείο, ο αριθμός των πελατών του οποίου είναι πολύ μεγάλος, διεξήχθη έρευνα σε 100 πελάτες σύμφωνα με το σχήμα της αυτοτυχαίας μη επαναλαμβανόμενης δειγματοληψίας. Τα αποτελέσματα της έρευνας παρουσιάζονται στον πίνακα. Εύρημα:
α) τα όρια εντός των οποίων ολοκληρώνεται, με πιθανότητα 0,9946, ο μέσος χρόνος υπηρεσίας για όλους τους πελάτες του συνταξιοδοτικού ταμείου·
β) την πιθανότητα το μερίδιο όλων των πελατών κεφαλαίων με διάρκεια υπηρεσίας μικρότερη από 6 λεπτά να διαφέρει από το μερίδιο αυτών των πελατών στο δείγμα κατά όχι περισσότερο από 10% (σε απόλυτη τιμή).
γ) όγκος επαναδειγματοληψίας, στον οποίο με πιθανότητα 0,9907 μπορεί να υποστηριχθεί ότι το μερίδιο όλων των πελατών αμοιβαίων κεφαλαίων με διάρκεια υπηρεσίας μικρότερη από 6 λεπτά διαφέρει από το μερίδιο αυτών των πελατών στο δείγμα κατά όχι περισσότερο από 10% (σε απόλυτη τιμή).
2. Σύμφωνα με την εργασία 1, χρησιμοποιώντας τη δοκιμή Pearson X 2, στο επίπεδο σημαντικότητας α = 0,05, ελέγξτε την υπόθεση ότι η τυχαία μεταβλητή Χ - χρόνος εξυπηρέτησης πελατών - κατανέμεται σύμφωνα με τον κανονικό νόμο. Κατασκευάστε σε ένα σχέδιο ένα ιστόγραμμα της εμπειρικής κατανομής και της αντίστοιχης κανονικής καμπύλης.
Λήψη Λύσης

Δίνεται ένα δείγμα 100 ειδών. Απαραίτητη:

  1. Δημιουργήστε μια ταξινομημένη σειρά παραλλαγών.
  2. Βρείτε τους μέγιστους και ελάχιστους όρους της σειράς.
  3. Βρείτε το εύρος διακύμανσης και τον αριθμό των βέλτιστων διαστημάτων για την κατασκευή μιας σειράς διαστημάτων. Βρείτε το μήκος του διαστήματος της σειράς διαστημάτων.
  4. Δημιουργήστε μια σειρά διαστημάτων. Βρείτε τις συχνότητες των στοιχείων του δείγματος που εμπίπτουν στα συντιθέμενα κενά. Βρείτε τα μεσαία σημεία κάθε διαστήματος.
  5. Κατασκευάστε ένα ιστόγραμμα και ένα πολύγωνο συχνοτήτων. Συγκρίνετε με την κανονική κατανομή (αναλυτικά και γραφικά).
  6. Σχεδιάστε τη συνάρτηση εμπειρικής κατανομής.
  7. Υπολογίστε τα αριθμητικά χαρακτηριστικά του δείγματος: μέση τιμή δείγματος και κεντρική ροπή δείγματος.
  8. Υπολογίστε κατά προσέγγιση τιμές τυπικής απόκλισης, λοξότητας και κύρτωσης (χρησιμοποιώντας το πακέτο ανάλυσης MS Excel). Συγκρίνετε τις κατά προσέγγιση υπολογισμένες τιμές με τις ακριβείς (υπολογισμένες χρησιμοποιώντας τύπους MS Excel).
  9. Συγκρίνετε επιλεγμένα γραφικά χαρακτηριστικά με τα αντίστοιχα θεωρητικά.
Λήψη Λύσης

Έχουμε τα ακόλουθα δείγματα δεδομένων (10% δείγμα, μηχανικά) σχετικά με την παραγωγή και το ποσό του κέρδους, εκατομμύρια ρούβλια. Σύμφωνα με τα αρχικά στοιχεία:
Εργασία 13.1.
13.1.1. Δημιουργήστε μια στατιστική σειρά κατανομής των επιχειρήσεων κατά το ποσό του κέρδους, σχηματίζοντας πέντε ομάδες σε ίσα διαστήματα. Οικόπεδα σειρών διανομής οικοπέδου.
13.1.2. Υπολογίστε τα αριθμητικά χαρακτηριστικά μιας σειράς κατανομής επιχειρήσεων με το ύψος του κέρδους: αριθμητικός μέσος όρος, τυπική απόκλιση, διακύμανση, συντελεστής διακύμανσης V. Εξάγετε συμπεράσματα.
Εργασία 13.2.
13.2.1. Προσδιορίστε τα όρια εντός των οποίων, με πιθανότητα 0,997, συμπεραίνεται το ύψος του κέρδους μιας επιχείρησης στο γενικό πληθυσμό.
13.2.2. Χρησιμοποιώντας το κριτήριο x2 του Pearson, σε επίπεδο σημαντικότητας α, ελέγξτε την υπόθεση ότι η τυχαία μεταβλητή Χ - το ποσό του κέρδους - κατανέμεται σύμφωνα με τον κανονικό νόμο.
Εργασία 13.3.
13.3.1. Προσδιορίστε τους συντελεστές της εξίσωσης παλινδρόμησης του δείγματος.
13.3.2. Καθορίστε την παρουσία και τη φύση της συσχέτισης μεταξύ του κόστους των κατασκευασμένων προϊόντων (Χ) και του ποσού του κέρδους ανά επιχείρηση (Υ). Σχεδιάστε ένα διάγραμμα διασποράς και μια γραμμή παλινδρόμησης.
13.3.3. Υπολογίστε τον γραμμικό συντελεστή συσχέτισης. Χρησιμοποιώντας το Student's t-test, ελέγξτε τη σημασία του συντελεστή συσχέτισης. Εξάγετε ένα συμπέρασμα σχετικά με την εγγύτητα της σχέσης μεταξύ των παραγόντων Χ και Υ χρησιμοποιώντας την κλίμακα Chaddock.
Κατευθυντήριες γραμμές. Η εργασία 13.3 εκτελείται χρησιμοποιώντας αυτήν την υπηρεσία.
Λήψη Λύσης

Μια εργασία. Τα ακόλουθα δεδομένα αντιπροσωπεύουν τον χρόνο που αφιερώνουν οι πελάτες για τη σύναψη συμβάσεων. Δημιουργήστε μια σειρά διαστημάτων διακύμανσης των παρουσιαζόμενων δεδομένων, ένα ιστόγραμμα, βρείτε μια αμερόληπτη εκτίμηση της μαθηματικής προσδοκίας, μια προκατειλημμένη και αμερόληπτη εκτίμηση της διακύμανσης.

Παράδειγμα. Σύμφωνα με τον πίνακα 2:
1) Δημιουργία σειράς διανομής για 40 εμπορικές τράπεζες της Ρωσικής Ομοσπονδίας:
Α) κατά το ποσό του κέρδους·
Β) κατά το ποσό των πιστωτικών επενδύσεων.
2) Σύμφωνα με τη ληφθείσα σειρά διανομής, προσδιορίστε:
Α) μέσο κέρδος ανά εμπορική τράπεζα.
Β) πιστωτικές επενδύσεις κατά μέσο όρο ανά εμπορική τράπεζα.
Γ) τροπική και διάμεση αξία του κέρδους. τεταρτημόρια, δεκαδικά?
Δ) τροπική και διάμεση αξία των πιστωτικών επενδύσεων.
3) Σύμφωνα με τη σειρά διανομής που λαμβάνεται στην παράγραφο 1, υπολογίστε:
α) εύρος διακύμανσης·
β) μέση γραμμική απόκλιση.
γ) τυπική απόκλιση.
δ) συντελεστής διακύμανσης.
Καταγράψτε τους απαραίτητους υπολογισμούς σε μορφή πίνακα. Αναλύστε τα αποτελέσματα. Βγάλτε τα συμπεράσματά σας.
Σχεδιάστε τη σειρά διανομής που προκύπτει. Προσδιορίστε τη λειτουργία και τη διάμεσο γραφικά.

Λύση:
Για να δημιουργήσουμε μια ομαδοποίηση με ίσα διαστήματα, θα χρησιμοποιήσουμε την υπηρεσία Ομαδοποίηση στατιστικών δεδομένων.

Εικόνα 1 - Εισαγωγή παραμέτρων

Περιγραφή παραμέτρων
Αριθμός γραμμών: ποσότητα ακατέργαστων δεδομένων. Εάν η διάσταση της σειράς είναι μικρή, υποδείξτε τον αριθμό της. Εάν η επιλογή είναι αρκετά μεγάλη, κάντε κλικ στο κουμπί Επικόλληση από το Excel.
Αριθμός ομάδων: 0 - ο αριθμός των ομάδων θα καθοριστεί από τον τύπο Sturgess.
Εάν έχει καθοριστεί ένας συγκεκριμένος αριθμός ομάδων, καθορίστε τον (για παράδειγμα, 5).
Τύπος σειράς: Διακριτή σειρά.
Επίπεδο σημασίας: για παράδειγμα, 0,954. Αυτή η παράμετρος έχει ρυθμιστεί για να ορίζει το διάστημα εμπιστοσύνης για τη μέση τιμή.
Δείγμα: Για παράδειγμα, γίνεται 10% μηχανική δειγματοληψία. Καθορίστε τον αριθμό 10. Για τα δεδομένα μας, καθορίζουμε 100 .

ΤΟ ΚΟΥΔΟΥΝΙ

Υπάρχουν εκείνοι που διαβάζουν αυτές τις ειδήσεις πριν από εσάς.
Εγγραφείτε για να λαμβάνετε τα πιο πρόσφατα άρθρα.
ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ
Ονομα
Επώνυμο
Πώς θα θέλατε να διαβάσετε το The Bell
Χωρίς ανεπιθύμητο περιεχόμενο