WPROWADZENIE
Zanim przejdziemy do analizy konkretnych rozkładów dyskretnych, musimy uporządkować aparat pojęciowy, który pozwala opisać niepewność w sposób matematyczny.
Fundamentem jest zmienna losowa, czyli funkcja, która wynikowi zdarzenia losowego (np. rzutowi monetą czy liczbie klientów w kolejce) przypisuje konkretną liczbę rzeczywistą. Dzięki temu przestajemy mówić o „orłach” czy „reszkach”, a zaczynamy operować na wartościach liczbowych. W sytuacjach, w których zmienna przyjmuje skończony lub przeliczalny zbiór oddzielnych wartości (jak np. wyniki rzutu kostką), mówimy o dyskretnej zmiennej losowej.
Pełną informację o takiej zmiennej niesie jej rozkład prawdopodobieństwa. Określa on, z jaką szansą zmienna przyjmuje każdą z możliwych wartości. W przypadku zmiennych dyskretnych najwygodniej przedstawić go w formie tabeli, wzoru lub wykresu słupkowego.
Kolejnym krokiem opisu jest dystrybuanta zmiennej losowej. Zamiast określać prawdopodobieństwo punktowe, informuje nas ona o szansie skumulowanej – czyli prawdopodobieństwie, że zmienna przyjmie wartość mniejszą od wyznaczonego punktu (lub mu równą). Możemy ją sobie wyobrazić jako narastającą sumę „cegiełek” prawdopodobieństwa przypisanych do kolejnych wartości.
Dystrybuanta dyskretnej zmiennej losowej może być określona za pomocą nierówności słabej lub mocnej.
Dopełnieniem tego obrazu są parametry rozkładu, takie jak wartość oczekiwana (2) (in. wartość przeciętna, średnia, nadzieja matematyczna) - przeciętny wynik, wokół którego oscylują wyniki długiej serii powtórzeń oraz wariancja (3), która określa stopień rozproszenia wyników wokół tej średniej.
Obliczanie wariancji bezpośrednio z definicji bywa uciążliwe. Znacznie wygodniejszy w praktyce jest tzw. wzór obliczeniowy, który wyprowadza się następująco:
ROZKŁAD RÓWNOMIERNY
Jeżeli zmienna losowa posiada skończoną liczbę realizacji, a prawopodobieństwo zdarzenia polegającego na realizacji dowolnej zmiennej losowej jest jednakowe, mówimy wtedy o rozkładzie równomiernym (in. jednostajny, prostokątny, uniform distribition).
Prawdopodobieństwo zajścia dowolnego zdarzenia z przestrzeni zdarzeń elementarnych jest stałe i dane wzorem:
gdzie:
n - liczebność zbioru zdarzeń elementarnych.
ROZKŁAD DWUPUNKTOWY
Rozkład dwupunktowy stosuje się w przypadku zmiennych losowych, które przyjmują wyłącznie dwie wartości. Można więc opisywać nim doświadczenia mogące się zakończyć na dwa sposoby np. rzut monetą (orzeł lub reszka). W praktyce, służy w badaniach populacji dzielących się na dwie kategorie np. ruda i skała płonna. Istnieją więc dwie realizacje zmiennej losowej X: X = {1, 0}. Gdy zmienna losowa przyjmuje wartość "1", przyjęło się mówić, że doświadczenie zakończyło się sukcesem, natomiast gdy zmienna przyjęła wartość "0", zakończyło się porażką.
Rozkład zmiennej losowej
.| i | 1 | 2 |
|---|---|---|
| xi | 0 | 1 |
| pi | q | p |
gdzie:
- pi - prawdopodobieństwa realizacji zmiennej losowej X,
- xi - realizacje zmiennej losowej X.
| \(P( 0) =q\) | \(P( 1) =p\) |
| \(p+q=1\) |
Wartość przeciętna zmiennej losowej
W nawiązaniu do wzoru (2):
Wariancja zmiennej losowej
W nawiązaniu do wzoru (5):
ROZKŁAD DWUMIANOWY
Rozkład Bernoulliego (dwumianowy, dwupunktowy, Bernoulli, binomial distribution) jest w praktyce najczęściej spotykanym rozkładem zmiennej losowej. Stosujemy go wówczas gdy wykonujemy n niezależnych doświadczeń (wynik każdego nich nie zależy od doświadczeń poprzednich), przy czym każde z doświadczeń ma, podobnie jak w rozkładzie dwupunktowym jedno z dwóch możliwych wyników: "sukces" lub "porażkę". Tak więc prawdopodobieństwo sukcesu jest w każdym z doświadczeń takie samo. Jako wartość zmiennej losowej przyjmujemy ilość sukcesów. Zmienna losowa może zatem przyjmować wartości: X takie, że: X = {0, 1, 2, 3,..., N}.
Rozkład zmiennej losowej
Zdefiniujmy zmienną losową X równą liczbie sukcesów k (np. wyrzucenie orła) w N=9 doświadczeniach (np. rzutach monetą).
Załóżmy, że otrzymaliśmy wynik: O, O, R, O, R, R, O, O, R.
gdzie:
- O - oznacza wyrzucenie "orła",
- R - oznacza wyrzucenie "reszki".
- N=9; k=5;
Jakie jest prawdopodobieństwo otrzymania takiego ciągu?
Prawdopodobieństwo, że za pierwszym i następnymi razami wyrzucimy orła jest równe p. W związku z tym, że zdarzenia są niezależne, prawdopodobieństwo otrzymania takiego ciągu jest równe iloczynowi prawdopodoboieństw kolejnych zdarzeń.
W związku z tym, że interesują nas wszystkie możliwe ustawienia wyników (wariacje), mnożymy wszystko przez dwumian Newtona i otrzymujemy:
- N - ilość doświadczeń,
- k - ilość sukcesów w N doświadczeniach.
Wartość przeciętna zmiennej losowej
Zdefiniujmy zmienną losową Y równą liczbie sukcesów k w N doświadczeniach.
Każdy z wyników otrzymanych w pojedynczym doświadczeniu zależy od innej zmiennej losowej Z, mającej dwie realizacje Z: Z={0, 1}.
| Y | Z | realizacje zmiennej losowej Z |
|---|---|---|
| y0=0 | z1, z2, z3, ..., zN | 0, 0, 0, ..., 0 |
| y1=1 | z1, z2, z3, ..., zN | 0, 0, 1, ..., 0 |
| y2=2 | z1, z2, z3, ..., zN | 1, 0, 1, ..., 0 |
| ... | ... | ... |
| yn=N | z1, z2, z3, ..., zN | 1, 1, 1, ..., 1 |
Wariancja zmiennej losowej
PRZYKŁAD
Dwóch równorzędnych graczy gra w szachy. Co jest bardziej prawdopodobne dla każdego z nich:
1. wygrać dwie partie z czterech?,
2. czy trzy z sześciu?.
Partie remisowe nie są brane pod uwagę.
ROZWIĄZANIE
| co jest bardziej prawdopodobne? | N | k |
|---|---|---|
| 2 partie z 4 | 4 | 2 |
| 3 partie z 6 | 6 | 3 |
gdzie:
- N - ilość doświadczeń,
- k- ilość sukcesów w N doświadczeniach.
gdzie:
- P(S) - prawdopodobieństwo sukcesu,
- P(P) - prawdopodobieństwo porażki.
Podstawiając do wzoru (11):
ODPOWIEDŹ
ROZKŁAD POISSONA
Rozkład zmiennej losowej
Rozkład Poissona (Poisson beta distribution ) stanowi szczególny przypadek rozkładu dwumianowego (Bernoulliego), w którym prawdopodobieństwo sukcesu (p) jest bardzo małe, a liczba niezależnych doświadczeń (N) na tyle duża, że iloczyn:
jest wielkością stałą, dodatnią i niezbyt dużą.
Wartość przeciętna zmiennej losowej
Wariancja zmiennej losowej
Rozkład Poissona stosujemy wszędzie tam, gdzie liczba obserwowanych doświadczeń niezależnych N w przestrzeni lub czasie jest bardzo duża, a prawdopodobieństwo sukcesu w pojedyńczym doświadczeniu p bardzo małe.
Przykłady:
- rozpad promieniotwórczy: liczba jąder n duża, prawdopodobieństwo rozpadu konkretnego jądra bardzo małe;
- zderzenia cząstek elementarnych, duża ilość cząstek, mała szansa na zderzenie;
Zjawisko emisji cząstek α zachodzi w ekstremalnie krótkim czasie patrząc z punktu widzenia czasu geologicznego także trzęsienia Ziemi mogą być traktowane jako zjawiska epizodyczne, podobnie obecność drumlinów (polodowcowe wzgórki) czy też ponorów (wchłony wód) mogą byc uważane za zjawiska punktowe w porównaniu z wielkością regionów.
Analiza każdego zagadnienia wymaga obliczenia ilości zdarzeń w przyjętych interwałach przestrzeni lub czasu. Możemy np. policzyć ilość erupcji wulkanicznych w 25-letnich okresach czy rozkład ziarn granatów w cienkich przedziałach płaszczyzn foliacji łupków. Pytanie kiedy mamy do czynienia z losowym i niezależnym modelem zdarzeń i czy model ten odpowiada rozkładowi Poissona? Zdarzenia mogą być uważane za losowe i niezależne jeżeli:
- prawopodobieństwo pojedynczego zdarzenia w bardzo krótkim interwale czasu lub przestrzeni jest w przybliżeniu proporcjonalne do długości tego interwału (czyli bardzo małe)
- Prawdopodobieństwo zajścia większej niż jedno ilości zdarzeń w każdym z interwałów jest zbliżone do zera (możemy stworzyć interwały wystarczająco małe do stworzenia takich warunków). Założenie to oznacza w praktyce, że w każdym z interwałów będzie odnotowane "0" lub "1" zdarzenie
- Pojawienie się lub brak zdarzenia jest od siebie niezależne