TEST

  • Μπορειτε να μεταφερθειτε σε οπιαδιποτε παραγραφο του κειμενου κανοντας δυπλο κλικ και να χρισιμοποιηστε το url ως bookmark
  • Μπορειτε να δειτε τις υποσιμιοσεις ειται κανοντας click ειτε περνοντας τον pointer απο πανω.

Έχουν περάσει από τα χέρια μου αρκετά εγχειρίδια στατιστικής και πιθανοτήτων με εισαγωγή στην κανονική κατανομή. Σχεδόν πάντα ξεκινούσαν με τον μαθηματικό ορισμό, και συνέχιζαν με τις ιδιότητες και τις χρήσεις της κατανομής αυτής. Για πολύ καιρό δεν είχα βρει κάποιο βιβλίο που να εξηγεί πώς δημιουργήθηκε αυτός ο τύπος και δεδομένης τις σημαντικότητας αυτης της κατανομής το θεωρώ μεγάλη παράληψη.


Τελικά κάποια στιγμή έπεσε στα χέρια μου ένα βιβλίο που εξηγεί με σαφήνεια πώς προκύπτει αυτός ο τύπος. Θύμαμε ακόμα την ικανοποίηση που πήρα κατανοώντας επιτέλους πως προκύπτει αυτή η κατανομή. Το βιβλίο λέγεται Lady Luck και, αν και παλιό, αποτελεί μια πολύ καλή εισαγωγή πάνω στο θέμα πιθανότητες και το συνιστώ ανεπιφύλακτα σε όποιον ψάχνει ένα εισαγωγικό βιβλίο στο θέμα.

Έκτοτε πέρασαν και αλα βιβλία από τα χέρια μου και με την εξάπλωση του διαδικτύου βρήκα και αρκετές Οnline αναφορές γύρω από το θέμα αυτό. Παρόλα αυτά ακόμα θεωρώ οτι η σχετική βιβλιογραφία ειναι περιορισμένη και αν την περιορίσουμε στα Ελληνικά μάλλον ανύπαρκτη. Ο σκοπός αυτής της εισαγωγής είναι να εξοικειώσει των αναγνώστη με την κανονική κατανομή αλά και να κάνει κατανοητό και το πως προκύπτει αυτος ο περίεργος τύπος καθώς και την πορεία της ανακάλυψης του.

Η κανονική κατανομή αποτελεί μάλλον την πιο σημαντική στατιστική κατανομή, έχει πολλές διαφορετικές χρήσεις και συναντάται σε πολλές διαφορετικές περιπτώσεις, Πολλές μεταβλητές ακολουθούν την κατανομή αυτή όπως για παράδειγμα το ανθρώπινο ύψος, η πίεση αίματος, λάθη ακριβείας σε μετρήσεις, αριθμός επιτυχιών σε παιχνίδια με ζάρια, και πολλές άλλες. Είναι αξιοπερίεργο πώς ένας τύπος εφαρμόζεται σε τόσες φαινομενικά διαφορετικές περιπτώσεις, τι σχέση μπορει ναι εχει το υψος των ανθρώπων με τα λαθη ακριβείας μετρήσεων και τα τυχερά παιχνίδια; Αυτα ειναι ερωτήματα που θα προσπαθήσω να απαντήσω σε αυτο εδω το αρθο.

διαγραμα: (h1)
διαγραμα: (h2)
διαγραμα: (h3)
διαγραμα: (h4)
διαγραμα: (h5)
διαγραμα: (h6)

Τυπικη αποκλιση

η τυπικη αποκλιση ειναι ενα μετρο διασπορας, μας διχνει ποσο απομακρισμενες ειναι η τιμες του πληθισμου απο τον μεσο ορο του.

αυτο που απικονιζει ειναι καταπροσεγιση το ποσο κατα μεσο ορο απεχουν οι τιμες απο τον μεσο ορο του πληθισμου. η τυπικη αποκλιση προερχετε απο μια μετατροπη της απολυτης αποκλησης (που υπολογιζει ακριβος το μεση αποσταση) αλαζοντας την απολητη τιμη με τετραγονικη ριζα του τετραγονου που ειναι περιπου το ιδιο.

Η τυπικη αποκλιση διμιουργιθηκε απο την αναγκη να απαληφθει η απολυτη τημη απο των τυπο της απολυτης αποκλισης γιατι σε πολες περιπτωσεις κανει τους υπολογισμου δισκολοτερους.

Για να προσεγγίσουμε το ζήτημα της κανονικής κατανομής θα ξεκινήσουμε με μια μικρή εισαγωγή για το πως την χρησιμοποιούμε. Ας υποθέσουμε ότι διεξάγουμε μια έρευνα για την κατανομή ύψους των ανθρώπων μιας περιοχής. Συλλέγουμε μετρήσεις για το ύψος από 800 άτομα και θέλουμε να μελετήσουμε το δείγμα αυτό. Τελικά έχουμε στα χέρια μας ένα σύνολο 800 μετρήσεων που ας υποθέσουμε ότι έχουν γίνει με ακρίβεια εκατοστού του μέτρου (cm). Ξεκινάμε υπολογίζοντας τα απλά περιγραφικά στατιστικά και βρίσκουμε τα εξής:

ΜετροΤιμη
πληθος800
μοναδικες τιμες[c1]Mοναδικες τιμες: το συνολο των διακριτων τιμων που λαμβανει ο πληθισμος.46
μεση τιμη179.7
διαμεσος τιμη180
τυπικη αποκληση[c2]Για την τυπικη αποκληση κιταξτε το κουτι με την επεξιση στο πλαι του αρθου.8.2
minimum157
maximum203
εάν τοποθετήσουμε τις τιμές σε σειρά και τις απεικονίσουμε τις τιμές σε ένα απλό χ,ψ διάγραμμα παίρνουμε το διάγραμμα (h1). σε αυτό το διάγραμμα μπορούμε να δούμε τη τιμές ύψους έχουν καταγράφει αλλά δεν μπορούμε να δούμε το πλήθος των ατόμων που έχουμε σε κάθε τιμή ύψους. Συνεχίζουμε φτιάχνοντας ένα πίνακα συχνοτήτων για κάθε διακριτή τιμή ύψους που έχουμε συλλέξει και κατασκευάζουμε το ραβδόγραμμα (h2). Σε αυτό βλέπουμε ότι οι τιμές συγκεντρώνονται γύρω από τον μέσο όρο και όσο απομακρυνόμαστε μειώνονται με ταχύ ρυθμό. στον πίνακα συχνοτήτων διαιρούμε την κάθε συχνότητα εμφάνισης (κάθετος άξονας στο (h1)) με το συνολικό αριθμό ατόμων (800) υπολογίζοντας έτσι την πιθανότητα εμφάνισης του κάθε ύψους και δημιουργούμε το ραβδογραμα (h3) το οποίο στην θέση των συχνοτήτων θα έχει πιθανότητες.

Μέχρι στιγμής έχουμε κάνει τα βασικά για να μπορέσουμε να πάρουμε μια ιδέα για το πως κατανέμετε το ύψος στον πληθυσμό. Ας προσπαθήσουμε να απαντήσουμε μερικά ερωτήματα.

εάν μας ενδιαφέρει η πιθανότητα του επιλέγοντας τυχαία ένα άτομο από τον πληθυσμό αυτό να έχει ύψος 1.80, μπορούμε απλά να κοιτάξουμε το ραβδογραμα (h3). Η πιθανότητα αυτή είναι: 0.05 ή 5%. Η πιθανότητα αυτή είναι αρκετά μικρός αριθμός μιας και η πιθανότητα κατανέμετε σε 46 διακριτές τιμές ύψους (το άθροισμα όλων των τιμών πιθανότητας εμφάνισης έχει αθρισμα 1).

Ας κάνουμε μια πιο ενδιαφέρουσα ερώτηση. Πια είναι η πιθανότητα μια τυχαία επιλογή να μας δώσει ένα μέτριου ύψους άτομο;

Αν ορίσουμε ως μέτριου ύψους άτομο αυτό που έχει ύψος από 175cm ως 185cm τότε για να απαντήσουμε στην ερώτηση θα πρέπει να αθροίσουμε όλες τις πιθανότητες από 175-185cm. εάν κάνουμε αυτή τη διαδικασία θα βρούμε ότι η πιθανότητα είναι: 0.5 ή 50%.

Ας σταθούμε λίγο σε αυτό το αποτέλεσμα, για μπορέσουμε να απαντήσουμε σε αυτή την ερώτηση κάναμε χρήση της σύμβασης ότι μετρήσαμε τα άτομα σε ακρίβεια cm και χρειάστηκε να υπολογίσουμε και να αθροίσουμε πιθανότητες για 11 διαφορετικές τιμες υψους.
μήπως υπάρχει καπιος τροπος να μην υπολογίσουμε και αθροίσουμε όλες αυτές τις πιθανότητες;
Τι θα κάναμε εάν τα άτομα είχαν μετρηθεί με ακρίβεια mm;
Αν αντί για ύψος είχαμε κάποια μεταβλητή που μπορει να πάρει οποιαδήποτε τιμη στο ℝ πως θα ομαδοποιούσαμε τις τιμές;

Σε αυτο το σημειο μπορουμε να δουμε την χριση των κατανομών πιθανότητας και για την περιπτωση μας της κανονικης κατανομης. Γνωριζοντας οτι το ηψος ακολουθει την κανονικη κατανομη μπορουμε με την βοηθια της, να υπολογισουμε την πιθανοτιτα για οπιοδιποτε διαστιμα τιμων, χορις να χριαζτε να ομαδοποιουμε το ηψος σε ομαδες και να κανουμε χρονοβορους και επαναλαμβανόμενους υπολογισμούς.

Να δουμε πως μπορει να γινει αυτο.

Πρωτα θα πρεπει να εισαγουμε την εννοια του ιστογραματος. Το ιστογραμα ειναι ενα διαγραμα που μιαζει οπτικα αρκετα με το ραβδογραμα αλα εχει θεμελιοδεις διαφορες. Στο ραβδογραμα, αυτο που μετραμε απεικονίζετε μεσω του υψους της μπαρας, ενω στο ιστογραμα μεσω του εμβαδου. Για να δημιουργήσουμε το ιστόγραμμα ομαδοποιούμε τις τιμες σε διαστήματα που ονομαζουμε bins και το πληθος των τιμων που βρισκετε σε αυτο το διαστιμα απικονιζετε απο το εμβαδο των αντιστοιχων παραλληλογράμμων του ραυδογραματος. Για παραδιγμα θα μετατρεψουμε το (h3) στα (h4),(h5) με 23 και 6 bins αντιστιχα. Πλεων η πηθανοτιτα δεν αντιστιχει στην τιμη του καθετου αξωνα αλα στο εμβαδο της μπαρας που εχει ως βαση το διαστιμα των τιμων που απικονιζει.

Για να γινει πιο κατανοητο το πως χρησιμοποιούμε την κανονική κατανομη θα φτιάξουμε ενα ιστόγραμμα (h6) με 47 bins, ενα bin για καθε εκατοστο[c3]Γενικα δεν χριαζετε να φτιαχνουμε ιστοργραμα με τετιο bin, στο παρον αρθο το κανουμε για να δουμε πως σημπεριφερετε η κανονικη κατανομη. ετσι οστε η ομαδοποιηση να συμπηπτει πρακτικα με το ραβδογραμα και ετσι να εχουμε καλύτερη εποπτεία. για να απαντισουμε στο ερωτιμα μας χριαζετε να αθρισουμε ολα τα εμβαδα του ιστογραματος μεταξι τον επιμαχων τιμων. Μεχρι στιγμις πρακτικα δεν εχει αλαξει κατι σχετικα με πριν περα του οτι στο κενουριο διαγραμα η πιθανοτιτα απικονιζετε απο το εμβαδον. Εαν μπορουσαμε να βρουμε μια καμπιλη η οποια να ειναι ευκολα ολοκλιροσιμη[c4]blah blah blah blah blah blah blahblah blah blahblah blah blah blah blah ddd και να περιεχει το ιδιο εμβαδο με το ιστογραμα μας, τοτε θα μπορουσαμε ευκολα να ιπολογισοθμε τις επιμαχες πιθανοτιτες. Αυτο ακριβος κανουν οι κατανομες PDF (probability density). Στην περιπτωσημας μπορουμε να χρισιμοποιησουμε την καταλιλη κανονικη κατανομη που θα εχει αυτο το χαρακτιριστικο.

πανω σε αυτο το ιστογραμα θα τοποθετισουμε την καμπηλη της καταληλης κανονικης κατανομης η οπoια οπως βλεπουμε βρισκετε πολη κοντα στις αληθινες τιμες του διγματος μας. Πρακτικα το εμβαδον που βρισκετε κατω απο την καμπηλη της κανονικης κατανομης (ροζ διαγραμιση) ειναι πολυ κοντα με το εμβαδον των αντιστων παραληλογραμων του ιστογραματος. Εαν κανουμε τους υπολογισμους θα δουμε οτι το εμβαδων του ιστογραματος ειναι: 0.5013,. Η διαφοραμας ειναι 0.0052 αρκετα μικρος αριθμος. Εαν θελετε να επαλιθευσετε ή να μελετετισετε το παραδηγμα μπορειτε να κατεβασετε τον κοδικα σε R απο το λινκ στο τελος του αρθου (article-data.R τα διαγραματα του παραδιγματος, normal.R ξεχωριστό παράδειγμα κοδικα για μελετη)

Αυτο που δεν φενετε καθολου στο παραδιγμα μας ειναι το πως βρισκουμε αυτην την καταληλη καμπυλη και για πιον λογο αυτη η καμπυλη τα καταφερνει τοσο καλα στο να υπολογιζει τις πιθανοτητες εμφανισης του υψους.

Η απαντιση, αν και ίσος ακούγετε λιγο παράξενο βρίσκετε στα τυχερά παιχνίδια. Ολα τα φαινόμενα που ακολουθούν την κανονική κατανομη μπορουν να μοντελοποιηθούν με πιραματα τύχης οπως πχ την ριψη ζαριων ή το στρίψιμο κερμάτων. Ή Διατυπώνοντας το πιο σωστά Εαν ενα φενομενο μοντελοποιείται με μια συγκεκριμένη κατηγορία πιραματων τυχης (που θα περιγράψουμε παρακάτω) τοτε το φενομενο αυτο ακολουθεί την κανονική κατανομή.

Ομως τι ακριβως ενοουμε οταν λεμε οτι μοντελοπιουντε με πιραματα τιχης; και πια ειναι αυτα τα πιραματα;

Οταν λεμε μοντελοποίηση αναφερόμαστε στην δημιουργία μιας ελεγχόμενης διαδικασίας τις οπιας την συμπεριφορά μπορούμε να αντιστιχισουμε με τα γεγονότα που συναντάμε στο πραγματικό φαινόμενο.
Π.χ. ας παρουμε το φαινομενο των Γεννήσεων αγοριων ή κοριτσιων. Με βαση τις γνωσεις μας γυρω απο τον μιχανισμο επιλογης φυλου, μπορουμε να μοντελοποιήσουμε την καθε γενιση σαν ισοδιναμο της ρυψης ενος τιμιου κερματος, που στην κορωνα αντιστοιχίζουμε την γέννηση κοριτσιού και στα γράμματα την γέννηση αγοριου (ή και αναποδα). Εαν ο τροπος που θεωρούμε οτι γινετε η επιλογή του φυλου ειναι λανθασμένη τοτε και η μοντελοποίηση του φαινομενου αυτου ως στριψιμο ενος κερματος θα ειναι λανθασμένη.
Στην ιδανική περίπτωση το μοντελο βασιζετε στις γνώσεις μας γυρω απο την φυση του φαινομένου και οχι στην παρατήρηση των αποτελεσματων, στην πραγματικότητα συνηθος προκιπτει και απο τα δυο, γιαυτο και αρκετές φορες τα μοντελα που φτιαχνουμε δεν ειναι ακριβη ή ακομα χειρότερα μπορεί να είναι και λάθος.

Την στατιστική σαν γνωστικό κλάδο συνήθως την τοποθετούμε κατω απο τα μαθηματικά, μιας και την εξασκούμε κάνοντας χρίση κυρίως αυτόν. Ομως υπαρχει μια θεμελιωδης διαφορά της στατιστικής με άλλους κλάδους των μαθηματικών, που φέρνει την στατιστική πιο κοντα σε άλλους κλάδους της γνώσης οπως η φυσική. Η στατιστική ειναι μια εμπειρική επιστήμη[c5]empiriki. Οταν αναλύουμε ενα πρόβλημα με στατιστικά εργαλεία τοτε υποχρεωτικά κάνουμε παραδοχές οι οποίες βασίζονται σε εμπειρικά δεδομένα (ακριβώς όπως και στην φυσική). Στο παραδείγμα μας θεωρήσαμε οτι το υψος ακολουθεί την κανονική κατανομή, αυτή η παραδοχή βασίζετε σε εμπειρικά δεδομένα και οχι σε κάποιου είδους μαθηματική απόδειξη. Μεσω των εμπειρικών δεδομένων και την γνώση του γενετικού/περιβαλλοντικού μηχανισμού επιλογής ύψους που επίσης βασίζετε σε εμπειρικά δεδομένα αποφασίζουμε οτι αυτό το μοντέλο παραγωγής ύψους (που καταλήγει σε κανονική κατανομή) αποτελεί το καταλληλότερο μοντέλο.

Για να κατανοήσουμε καλύτερα την κανονική κατανομή θα πρέπει να έχουμε στο μυαλό μας το οτι αποτελεί ένα εργαλείο μιας εμπειρικής επιστήμης και οχι ενα μαθηματικό θεώρημα όπως πχ το θεώρημα το Ευκλείδη. Σαν εμπειρικό εργαλείο θεμελιώθηκε πάνω σε παρατηρήσεις του φυσικού κόσμου και για να κατανοήσουμε την χρησιμότητα της θα πρέπει να μελετήσουμε τα φαινόμενα τα οποία περιγράφει και τυποποιεί.

Στα πλαίσια της στατιστικης και των πιθανοτήτων εχουν μελετηθει αρκετα πειράματα τυχης τα οποια μπορούν να λειτουργήσουν σαν μοντελα σε διαφορα φυσικα φαινομενα. Η κανονικη κατανομη μπορει να μοντελοποιηθεί με ενα αρκετα απλο πυραμα τυχης, την στρυψιμο ενος κερματος αρκετες φορες. Μέσω της κανονικής κατανομης μπορουμε να υπολογίσουμε την πιθανοτιτα εμφανισης ενος σιγκεκριμενου ενδεχομενου του πυραματος αυτου (πχ 10 γραμματα σε 20 ριψεις) με αρκετη ακριβια. Αυτος ειναι ιστορικα ο πρωτος δρομος που κατέληξε στην κανονική κατανομή (υπάρχει και δρόμος της σχέσης με τα λάθη μετρήσεων στον οποιο αναφερθούμε αργότερα).

Για να πάρουμε αυτον τον δρομο θα ξεκινισουμε απο την μελετη αυτο του απλου πηραματος τυχης το οποιο περιγραφετε απο την Δυονιμικη κατανομη.

Διωνυμική κατανομή

Η Διωνυμικη κατανομή μελεταει τον αριθμο εμφανισης ενος αποτελέσματος σε διαδοχικές ρίψεις ενος κερματος. Η ρυψη ενως κερματος εχει δυο δυνατα αποτελεσματα: κορώνα (Κ) ή γράμματα (Γ). Στα πλεσια της διωνυμικης κατανομης μας ενδιαφερει ο αριθμος εμφανισεων του ενος απο αυτα, την εμφανιση του οπιου ονομαζουμε επιτιχια. Πχ Εαν στριψουμε ενα κερμα μια φορα μπορει να παρουμε καμια ή μια κωρονα, εαν το στριψουμε δυο φορες: καμια , μια ή δυο κορωνες, τρεις φορες: καμια , μια , δυο ή τρεις κορωνες κοκ.

Σε μια πιο τεχνικη γλωσσα η διωνυμική κατανομή είναι μια διακριτή κατανομή που περιγράφει την πιθανότητα εμφάνισης ενος αριθμου επιτιχιων σε ένα παιχνίδι τύχης με δύο αποτελέσματα. (ο ορος διακριτή αναφερετε στο γεγωνος οτι η τυχαία μεταβλητή μπορει να περνει τιμες μεσα απο ενα πεπερασμενο συνολο - και οχι απο ενα απειροσύνολο οπως το ℝ - στην περιπτωση του κέρματος αναφερομαστε στα δυο ενδεχομενα (Κ)(Γ) σε αντιθεση πχ με το υψος που δυνιτικα μπορει να παρει οπιαδιοπτε τημη στο ℝ.

Συμπεριλαμβανοντας την ενια της πιθανοτητας σε οσα εχουμε αναφερει, εαν στρίψουμε ένα τιμιο κέρμα 1 φορά, έχουμε 2 δυνατά αποτελέσματα (κορώνα (Κ) ή γράμματα (Γ)) με πιθανότητα εμφάνισης του κάθε αποτελέσματος 1 2 = 0.5 (τιμιο)
Εάν στρίψουμε το κέρμα 2 φορές, τότε τα δυνατά αποτελέσματα είναι:

αποτελέσματαΚΓπιθανότητα
Κ Κ201/4
Κ Γ111/4
Γ Κ111/4
Γ Γ021/4

Εάν μας ενδιαφέρει μόνο ο αριθμός των κορωνών τοτε έχουμε το εξής αποτέλεσμα:

κορώνεςεμφανίσειςπιθανότητα
011/4
122/4
211/4

Εάν στρίψουμε το κέρμα 3 φορές, τα δυνατά αποτελέσματα είναι:

αποτελέσματαΚΓπιθανότητα
Κ Κ Κ301/8
Κ Κ Γ211/8
Κ Γ Κ211/8
Κ Γ Γ121/8
Γ Κ Κ211/8
Γ Κ Γ121/8
Γ Γ Κ121/8
Γ Γ Γ031/8

Εάν καταγράψουμε τον αριθμό των κορωνών στα δυνατά αποτελέσματα τότε ο πίνακας θα έχει ως εξής:

κορώνεςεμφανίσειςπιθανότητα
011/8
133/8
233/8
311/8

διωνυμική κατανομή στο R

> x=seq(0,3);
> y=dbinom(x, size=3, prob=0.5);
> x
[1] 0 1 2 3
> y
[1] 0.125 0.375 0.375 0.125

Γενικά, ο αριθμός των επιτυχιών (στην περίπτωση του παραδείγματος ο αριθμός των κορωνών) σε n επαναλήψεις ενός πειράματος τύχης με δύο αποτελέσματα υπολογίζεται από τη διωνυμική κατανομή. Ο τύπος της είναι:
ƒ k ; n , p = Pr K k = n k p k 1 - p n - k
οπου
k: ο αριθμός των επιτυχιών,
n ο αριθμός των επαναλήψεων,
p η πιθανότητα επιτυχiας.
Εαν πχ θελουμε να υπολογίσουμε την πιθανοτητα να εχουμε 3 γραμματα σε 8 ριψεις κερματος τοτε για k=3, n=8, p=0.5 εχουμε:
ƒ 3 ; 8 , 0.5 = Pr K 3 = 8 3 0.5 3 1 - 0.5 8 - 3 = 0.21875

Παρακατω παραθέτω διαγράμματα με τον αριθμό επιτυχιών k για n = 2, 8, 32, 64 επαναλήψεις αντίστοιχα (p=0.5):


διαγραμα: (1)
διαγραμα: (2)
διαγραμα: (3)
διαγραμα: (4)
διαγραμα: (5)
διαγραμα: (6)

Στον οριζοντιο αξωνα (Χ) ειναι ο αριθμος των εμφανισθεντων επιτιχιων, στων καθετο αξονα βρισκετε η πιθανοτιτα εμφανισης των αντιστιχων επιτιχιων.

ειναι εμφανες οτι παρολες τις αλαγες στους αξονες των γραφιματων ειπαρχει ενα μοτιβο το οποιο επαναλμβανετε σε ολα τα γραφηματα. Ειπαρχει μια επικρατούσα τιμη (με την μεγαλύτερη εμφάνιση) που βρισκετε στο κεντρο του καθε διαγραματος και εκατεροθεν οι υπολιπες τιμες μιονοντε σταδιακα κε συμετρικα ως προς αυτην. Οσο απομακρινομαστε απο το κεντρο (πολυ μικρες ή πολυ μεγαλες τιμες) η πιθανοτητα εμφανισης μικρενει δραματικα. Στο παραδιγμα των 64 επαναλιψεων βλεπουμε οτι ή πιθανοτιτα να εμφανιστουν 0 ή 64 επαναλιψεις εινα εξερετικα μικρες 1 2 64 = 5.4 · 10 -20   ή αλλιώς   0.00000000000000000054

Προσεγκιζωντας την διωνυμικη.

Ο πρωτος ιστορικα τροπος που καταληξε στην εξισωση της κανονικης κατανομης ειταν απτελεσμα της αναζητησης ενος εναλακτικου τροπου υπολογισμου των τιμων της διωνυμικης κατανωμης. Ο Abraham de Moivre το 1738[c1]Walker, Helen M. (1985). “De Moivre on the Law of Normal Probability”. In Smith, David Eugene. A Source Book in Mathematics. Dover. ISBN 0486646904. κατεληξε σε αυτο που σημερα ονομαζετε κανονικη προσεγιση της δυωνιμηκης κατανομής και σημερα αποτυπώνετε ως:
i j n k p k 1 - p n - k N j - n p n p 1 - p - N i - n p n p 1 - p      οπου      N z = 1 2 π - z e - x 2 2 dx

O Παραπανω τυπος αντυπρωσοπευει μια συνεχη συναρτιση η οποια να εχει την δινατοτητα να μας δινει την σωστη πιθανοτητα εμφανισης ενως ενδεχομενου για οπιοδιποτε αριθμο επαναληψεων n. Η ακρυβης μεθοδος που καταλυγουμε σε αυτον των τυπο ειναι αρκετα πολυπλοκη, για των λογο αυτο θα σκιαγραφισω τα βασικα βηματα μιας μεθοδου που μπορουμε να καταλήξουμε στην επιμαχη συναρτιση.

θα ξεκινισουμε με το τρυγωνο του pascal

0 1
1 1 1
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
7 21 35 35 21
8 28 56 70 56 28
Τρίγωνο Pascal
το τρυγωνο αυτο εχει την εξης ιδιοτιτα, καθε αριθμος προκυπτει ως αθρησμα δυο αριθμων που βρισκοντε διαγωνια αριστερα και δεξια στην προηγουμενη σειρα. Π.χ στην τελευτεα σειρα ο δευτερος αριθμος 8 προκηπτει απο το αθρησμα 1+7 που βρισκοντε στην προηγουμενη (προτελευτεα) σειρα εκατεροθεν του 8. Το τριγωνο του pascal αποτελει μια διαφορετικη διαδικασια υπολογιζουμου των αποτελεσματων της διονιμικης κατανομης.

Για να δούμε την διαδικασία αυτή πιο συγκεκριμένα θα πάρουμε την περίπτωση των 8 επαναλήψεων διαγραμα (3). τα αποτελέσματα που απεικονίζονται στο διαγραμα (3) είναι τα εξής:

0 1 2 3 4 5 6 7 8
0.00390625 0.03125 0.109375 0.21875 0.2734375 0.21875 0.109375 0.03125 0.00390625

Εάν πάρουμε την γραμμή 8 (τελευταία γραμη) απο το τρίγωνο pascal και διερεσουμε τον καθε αριθμο με τον συνολικό αριθμο δινατων ενδεχομένων (ο αριθμος των δινατων ενδεχομενων για 8 ριψεις ειναι 2 8 = 256 ) θα πάρουμε τα αποτελέσματα της διωνιμικης κατανομής
Abraham de Moivre

Abraham de Moivre

  • 1/256 = 0.00390625
  • 8/256 = 0.03125
  • 28/256 = 0.109375
  • 56/256 = 0.21875
  • 70/256 = 0.2734375

Οποτε με το τρυγωνο του pascal εχουμε εναν εναλακτικο τροπο να υπολογιζουμε τα αποτελεσματα της διονιμικης κατανομης. Οι συντελεστες που υπολογιζουμε με την διαδικασια αυτη μπορουν εναλακτυκα να υπολογιστουν και μεσω του δυονιμικου θεωρηματος
a + b N = a N + N 1 a N - 1 b + N 2 a N - 2 b 2 + + N Ν b N
π.χ. για 8 επαναληψεις εχουμε:
a + b 8 = 1 a 8 + 8 a 7 b + 28 a 6 b 2 + 56 a 5 b 3 + 70 a 4 b 4 + + 1 b 8

Εαν αποδοσουμε στα a,b τις τιμες p,1-p των πιθανωτιτων του πιραματος τιχης της διωνιμικης κατανωμης (του κερματος στο παραδιγμα μας, οποτε a = b = 0.5) τοτε το καθε μονονημο της δυωνιμικης αναπτυξης θα αποτελει και μια υπολογιζωμενη πιθανοτητα (αξωνας y στα διαγραματα 1-6) και ο αυξον αριθμος του μονονυμου θα αποτελει τον αριθμο επιτιχιων (αξωνας x στα διαγραματα 1-6). //Οποτε καταλιγουμε στο οτι τα αποτελεσματα της διονημικης κατανωμης μπορουν να υπολογισθουν μεσω του δυονιμικου θεωρηματος.

Εαν προσθεσουμε ολα τα μονομηνα θα εχουμε αθρησμα 1 (μιας και αποτελουν πιθανοτιτες ολων των δυνατων ενδεχομενων), και το αθρησμα μερικων διαδοχικων μονονημων μας δινει την πιθανοτητα να εχουμε αποτελεσμα στο αντιστιχο διαστημα επιτιχιων. Σε αυτο το σημειο μπορουμε να κανουμε χριση της ιδεας του ολοκληροματος κατα Ρίμαν[c6]το αθρησμα διαδοχικων παραληλογραμων μαs δινει εμβαδο και να προσεγισουμε την τιμη των αθρισματων αυτων μεσω της ολοκληρωσης κατα ριμαν της διωνιμηκης κατανωμης. το δυονυμο newton m n = m! n! m n ! που εμπεριεχετε στον τυπο της διωνιμικης κατανωμης αποτελει σημαντικο εμποδιο στην ολοκληρωση που θελουμε να πετιχουμε οποτε εναλακτηκα μπορουμε να χρισημοποιησουμε τον πρωσεγκιστικο τυπο του Stirling για το n!,   n ! n n e - n 2 π n

Ξεκινοντας απο το δυονιμικου θεωρημα, κανωντας χριση του προσεγγιστικού τυπου για το n! και ολοκληρονοντας κατα Ριμαν μπορουμε να καταλιξουμε στην κανονικη κατανομη. Η Σκοπος αυτης της χονδροιδους περιγραφης της διαδικασιας ειναι να διξω το πως προκυπτουν τα βασικα στιχια της εξισωσης της κανονικης κατανωμης: το ολοκληρωμα, το e και to 2π. Τα οποια πρωσοπικα την πρωτη φορα που την ειδα μου φανικε εξερετικα περιεργο το πως κατεληξαν να υπαρχουν μεσα σε αυτη την εξισωση.

Καμπιλη λαθων

To 1809 Gauss διμοσιευσε μια μονογραφια του με τιτλο “Theoria motus corporum coelestium in sectionibus conicis solem ambientium” στην οποια μεταξι αλων ισιγαγε μερικα σιμαντικες ενοιες της στατιστικης οπως ειναι η μεθοδος των ελαχιστων τετραγωνων, η μεθoδος maximum likelihood και η κανονικη κατανομη. Η μεθοδος που ακολοθισε ο gauss για να φτασει στην κανονικη κατανομη ειναι εντελος διαφορετικος απο αυτον του De Moivre και γιαυτο αξιζει να τον εξετασουμε.

Η αστρονομια ειναι απο τις πρωτες επιστημες στην οποια χριαστικε ακριβια στις μετρισεις. Σε αυτην η επανελιμενη λιψη μετρισεων απο αποτελει τυπικη διαδικασια οποτε απο νορις δημιουργιθηκε το προβλημα το πως τελικα λαμβανουμε την τελικη τιμη της μετρισης. Ο προτος που αναφερει το σχετικο ζιτιμα ειταν ο Γαλιλεος στο “Dialogue Concerning the Two Chief Systems of the World—Ptolemaic and Copernican”[c2]Galilei1967 το οποιο εκδοθηκε το 1632. Ο Γαλιλεος μελετισε τις ιδιοτιτες των τυχαιων λαθων που γινοντε στις αστρονομικες παρατιρισεις και τα συμπερασματα του συνοψιστικαν απο τον Stigler[c3]Hald1990 σε 5 προτασεις:

Ενα πολυ συμαντικο χαρακτιριστικο αυτου του τυπου ειναι οτι μπορει να αποδοσει πιθανοτιτα σε οπιοδιποτε αρχιθμο του πειδου ορισμου. Αυτο σημενει οτι μπορουμε να υπολογισουμε την πιθανοτιτα να εμφανιστουνε 3,5 κωρονες σε 8 ριψεις, kατι το οπιο προφανος δεν εχει νοιμα, αλα μπορει να φανει πολυ χρισιμο σε αλου ηδους εφαρμογες (πχ την μελετη της κατανομης υψους ενος πληθισμου, το υψος ειναι μια συνεχης μεταβλητη μπορει να παρει οπιαδιποτε τιμη μεσα σε εαν διαστημα πραγματικων αριθμων που ος γνωστον αποτελει εαν απυροσινολο.)


διαγραμα: (7)

(1) η πρωτη αλαγη που θα κανουμε ειναι να αλαξουμε την μετριση στων αξωνα χ ετσι ωστε να μην αναφερετε στων αριθμο επιτιχιων αλα στην διαφωρα του αριθμου επιτιχων απο την επικρατουσα τιμη που βρισκετε στο μεσο του διαγραματος.

η επικρατουσα τιμη ειναι η 32 , οποτε ο X αξωνας θα εχει τιμες απο -32 εως 32, η κεντρικη τιμη πλεων θα ειναι το 0 μιας και εκει βρισκοταν η επικρατουσα τιμη. προς το παρων δεν εχουμε καταφερει να απομονοσουμε το μοτιβο μιας και η μορφη πρακτικα μενει ιδια.

διαγραμα: (8)

(2) η δευτερη αλαγη που θα κανουμε ειναι λιγο πιο πολυπλοκη, διερουμε τον y με std και πολαπλασιαζουμε τον x με std θα διερεσουμε τις τιμες και των 2 αξωνων με μια καταλιλλη τιμη ετσι ωστε να σταματισει η μορφη να συρικνωνετε και να σιγκεντρωνετε στο κεντρο του διαγραματος οσο ο αριθμος των επαναλυψεων αυξανει, η τιμη αυτη ειναι η τυπικη αποκλιση.
επισησης μεσω αυτης της αλαγης καταφερνουμε οι τιμες στους δυο αξωνες να ειναι σχεδων ανεξαρτιτες απο των αριθμο των επαναλιψεων.


μπορειτε να κατεβασετε των κωδικα του αρθου απο εδω

Υποσημειοσεις

  1. ^Mοναδικες τιμες: το συνολο των διακριτων τιμων που λαμβανει ο πληθισμος.
  2. ^Για την τυπικη αποκληση κιταξτε το κουτι με την επεξιση στο πλαι του αρθου.
  3. ^Γενικα δεν χριαζετε να φτιαχνουμε ιστοργραμα με τετιο bin, στο παρον αρθο το κανουμε για να δουμε πως σημπεριφερετε η κανονικη κατανομη.
  4. ^blah blah blah blah blah blah blahblah blah blahblah blah blah blah blah ddd
  5. ^empiriki
  6. ^το αθρησμα διαδοχικων παραληλογραμων μαs δινει εμβαδο

citations

  1. ^Walker, Helen M. (1985). “De Moivre on the Law of Normal Probability”. In Smith, David Eugene. A Source Book in Mathematics. Dover. ISBN 0486646904.
  2. ^Galilei1967
  3. ^Hald1990

Add new comment

Filtered HTML

  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Lines and paragraphs break automatically.

Plain text

  • No HTML tags allowed.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Lines and paragraphs break automatically.