Δεσμευμένη μέση τιμή (μερικές ιδιότητες)
Δεσμευμένη μέση τιμή
Διευκρίνιση για τον ορισμό της δεσμευμένης μέσης τιμής.
(α) Κατ' αρχήν, όλη η διάλεξη αυτή αφορά διακριτές ΤΜ. Η δέσμευση μιας ΤΜ ως προς ενδεχόμενο ορίζεται ακριβώς με τον ίδιο τρόπο και για συνεχείς (καλύτερα, μη διακριτές) ΤΜ αλλά η δέσμευση μιας ΤΜ ως προς μια μη διακριτή ΤΜ ορίζεται με διαφορετικό τρόπο (αλλά έχει παρόμοιες ιδιότητες). Δεν αναφερόμαστε καθόλου σε δέσμευση ως προς μη διακριτές ΤΜ σε αυτή τη διάλεξη.
(β) Για να ορίσουμε την \(\Mean{X \given Y}\) λέμε ότι αυτή είναι μια συνάρτηση της ΤΜ \(Y\). Αν την πούμε αυτή τη συνάρτηση \(\phi\), δηλ.
\[ \Mean{X \given Y} = \phi(Y) \]
τότε πρέπει να ορίσουμε ποια είναι η τιμή \(\phi(a)\) για κάθε \(a\) που είναι στις τιμές του \(Y\). Ο ορισμός είναι
\[\phi(a) = \Mean{X \given Y=a},\]
όπως είδαμε και στα video. Όμως αυτό αφήνει αδιευκρίνιστο το τι γίνεται όταν \(\Prob{Y=a} = 0\), στην οποία περίπτωση η δέσμευση ως προς το ενδεχόμενο \(\Set{Y=a}\) δεν είναι δυνατή (αφού αυτό το ενδεχόμενο έχει πιθανότητα 0 και δε μπορούμε να διαιρέσουμε με την πιθανότητα αυτή όπως απαιτεί ο ορισμός της δεσμευμένης πιθανότητας). Η απάντηση είναι ότι σε αυτή την περίπτωση η \(\phi(a)\) αφήνεται αόριστη (ή, αν προτιμάτε, τη θέτουμε ίση με το 0).
Το σημαντικό είναι ότι παρά το ότι η ΤΜ \(\Mean{X \given Y}\) δεν ορίζεται για κάποιες τιμές του \(Y\) οι τιμές αυτές έχουν πιθανότητα 0. Με άλλα λόγια γνωρίζουμε την κατανομή της \(\Mean{X \given Y}\) πλήρως εκτός από τιμές του \(Y\) που συνολικά έχουν πιθανότητα 0 (αν προσθέσει κανείς τις πιθανότητες όλων των \(a\), τιμών του \(Y\), που έχουν πιθανότητα 0, τότε πάλι 0 θα βρει). Και είναι συνηθισμένο και αποδεκτό στη Θεωρία Πιθανοτήτων να αγνοούμε τέτοια ενδεχόμενα, που έχουν πιθανότητα 0 να συμβούν. Σκεφτείτε π.χ. το αν επηρεάζονται από αυτό το ελάττωμα διάφοροι υπολογισμοί που κάνουμε συνήθως. Για παράδειγμα, ο υπολογισμός της μέσης τιμής μιας ΤΜ δεν επηρεάζεται καθόλου από το αν δεν ξέρουμε την τιμή της πάνω σε ένα ενδεχόμενο πιθανότητας 0 (αφού αυτή η τιμή ούτως ή άλλως θα μετέχει στον υπολογισμό της μέσης τιμής πολλαπλασιασμένη με το 0).
Ιδιότητες της δεσμευμένης μέσης τιμής
Συγκεντρωμένες μερικές βασικές ιδιότητες της δεσμευμένης μέσης τιμής βρίσκονται παρακάτω. Οι αποδείξεις δε συμπεριλαμβάνονται παρά μόνο η διαισθητική (και πολύ σημαντική) αιτιολόγηση των κανόνων αυτών. Επίσης έχουν παραλειφθεί οι διάφορες υποθέσεις ύπαρξης μέσων τιμών. Μπορείτε π.χ. να περιοριστείτε σε ΤΜ που παίρνουν πεπερασμένες στο πλήθος τιμές μόνο, στην οποία περίπτωση όλες οι απαιτούμενες μέσες τιμές υπάρχουν αφού δεν τίθεται θέμα συγκλισης κάποιας σειράς.
-
- Η ποσότητα \(\Mean{X \given Y}\) δεν είναι εν γένει σταθερά αλλά μια ΤΜ που επίσης είναι συνάρτηση της ΤΜ \(Y\)
\[ \Mean{X \given Y} = \phi(Y), \]
όπου \(\phi(a) = \Mean{X \given Y=a}\) (η τελευταία μέση τιμή είναι η μέση τιμή της \(X\) υπό τη δέσμευση \(Y=a\)). - Η ΤΜ \(\Mean{X \given Y}\) είναι σταθερή μέσα σε κάθε ενδεχόμενο της μορφής \(\Set{Y=a}\).
- Σκεφτόμαστε την ποσότητα \(\Mean{X \given Y}\) ως τη μέση τιμή της \(X\) αν γνωρίζουμε την \(Y\). Αυτός είναι και συνήθως ο τρόπος με τον οποίο την υπολογίζουμε.
- Η πολύ σημαντκή γραμμικότητα της μέσης τιμής ισχύει και για τη δεσμευμένη μέση τιμή
\[ \Mean{\lambda X+\mu Y \given Z} = \lambda \Mean{X \given Z} + \mu \Mean{Y \given Z}, \]
όπου \(X, Y, Z\) είναι ΤΜ και \(\lambda, \mu\) αριθμοί. Ομοίως εξακολουθεί να ισχύει και η μονοτονία: αν \( X\le Y\) πάντα (δηλ. για κάθε έκβαση του πειράματος, ή, έστω, με πιθανότητα 1) τότε επίσης ισχύει πάντα:
\[ \Mean{X \given Z} \le \Mean{Y \given Z}. \] - Για κάθε ΤΜ \(X\) ισχύει
\[ \Mean{X \given X} = X. \]
Με απλά λόγια, αν κάποιος μας έχει πληροφορήσει για το ποια είναι η τιμή της ΤΜ \(X\), έστω \(a\), και μας ρωτήσουν, υπό αυτές τις συνθήκες, ποια είναι η μέση τιμή της \(X\), τότε φυσικά η απάντηση είναι \(a\). - Αν \(X, Y\) είναι ανεξάρτητες τότε
\[ \Mean{X \given Y} = \Mean{X}. \]
Δηλ. αν γνώση της \(Y\) δεν επηρεάζει καθόλου την κατανομή της \(X\) (αυτό σημαίνει ανεξαρτησία) τότε η γνώση της \(Y\) δεν επηρεάζει και τη μέση τιμή της \(X\). - Αν η ΤΜ \(Z\) είναι συνάρτηση της ΤΜ \(Y\), \(Z = f(Y)\), τότε
\[ \Mean{Z X \given Y} = Z \Mean{X \given Y}. \]
Αυτό γιατί αν κάποιος μας πληροφορήσει για την τιμή της \(Y\) τότε μας έχει αυτόματα πει ποια είναι η τιμή της \(Z\), οπότε η \(Z\) αντιμετωπίζεται πλέον ως σταθερά, και άρα βγαίνει έξω από τη μέση τιμή. Συνέπεια αυτού είναι και το:
\[ \Mean{ \Mean{X \given Y} \given Y} = \Mean{X \given Y}. \] - Αν \(X, Y\) ΤΜ τότε ισχύει
\[ \Mean{ \Mean{X \given Y} } = \Mean{X}. \]
Γι' αυτόν τον τελευταίο κανόνα δε γνωρίζω κάποια διαισθητικά φανερή αιτιολόγηση. Η απόδειξη πάντως δεν είναι δύσκολη και φαίνεται σε ένα από τα video. Επίσης ο νόμος αυτός της επαναλαμβανόμενης δεσμευμένης μέσης τιμής είναι, ουσιαστικά, ένας άλλος τρόπος να εκφράσει κανείς το νόμο της ολικής πιθανότητας, και πολλές φορές χρησιμοποιείται στα προβλήματα αντί του νόμου ολικής πιθανότητας.
- Η ποσότητα \(\Mean{X \given Y}\) δεν είναι εν γένει σταθερά αλλά μια ΤΜ που επίσης είναι συνάρτηση της ΤΜ \(Y\)
Δεσμευμένη διασπορά
Η δεσμευμένη διασπορά της \(X\) ως προς \(Y\), κατ' αναλογία με την περίπτωση όπου δεν υπάρχει δέσμευση, ορίζεται ως
\[\sigma^2(X \given Y) = \Mean{ (X-\Mean{X \given Y})^2 \given Y}. \]
Παριστάνει το ποια είναι η διασπορά της
\(X\) αν γνωρίζουμε την τιμή που έχει η \(Y\), και είναι μια ΤΜ που είναι συνάρτηση της \(Y\).
Ισχύει ο τύπος ολικής διασποράς:
\[ \sigma^2(X) = \sigma^2(\Mean{X \given Y}) + \Mean{ \sigma^2(X \given Y) }. \]