Test losowości rozkładu zdarzeń

Losowość zdarzeń oznacza, że wystąpienie jednego zdarzenia nie oddziaływuje probabilistycznie na możliwość wystąpienia innego zdarzenia. W geologii mamy najczęściej do czynienia z innymi sytuacjami. Trzęsienie ziemi lub erupcja wulkanu oddziałują na prawdopodobieństo kolejnych zdarzeń tego typu.

Wyobraźmy sobie, że w ciągu okresu czasu wynoszącego 100 lat, mamy do czynienia z 10-cioma zdarzeniami o rozkładzie losowym. Jeżeli cały analizowany okres podzielimy na dekady, to okaże się, że w większości dekad będzie miało miejsce jedno zdarzenie, być może w kilku dekadach zdarzenia będą dwa lub nie będzie ich wcale. Dekad o ilości zdarzeń większej od dwóch, z uwagi na niezwykle małe prawdopodobieństwo takiego wystąpienia, nie będzie zapewne wcale. Rozkład częstotliwości wystąpienia zdarzeń losowych z powyższego przykładu przyjmie model Poissona.

Rozkład Poissona jest jednym z rozkładów dyskretnych (skokowych). Stosuje się go w przypadku określania prawdopodobieństwa zajścia zdarzeń stosunkowo rzadkich i niezależnych od siebie przy występowaniu dużej ilości doświadczeń.
Rozkład Poissona jest przybliżeniem rozkładu Bernoulliego dla dużych prób i przy małym prawdopodobieństwie zajścia zdarzenia sprzyjającego.

PRZYKŁAD

Fig. 1. przedstawia rozkład horyzontów tufitowych obserwowanych w wybranym profilu geologicznym. Liczby oznaczajš położenie horyzontów tufitowych względem podstawy profilu

Rozkłady horyzontów tufitowych obserwowanych w profilu geologicznym
Fig. 1. Rozkład horyzontów tufitowych w profilu geologicznym

Jeżeli zdażenia jakimi są poziomy skał piroklastycznych związane z okresami nasilonej działalności wulkanicznej występują w sekwencji losowo, wtedy liczba obserwacji w każdym z regularnie interwałów profilu podlegać będzie rozkładowi Poissona. Jednocześnie trzeba pamiętać, że tego typu zdarzenia w większym stopniu związane są z procesami sedymentacyjnymi niż cyklicznością zjawisk wulkanicznych.

Jeżeli użyjemy interwałów 3 m miąższości wtedy otrzymamy następujące wyniki:

Tab. 1. Rozkład horyzontów tufitowych obserwowanych w wybranym profilu geologicznym
nr interwał [m] liczba obserwacji (j)
1 0-3 2
2 3-6 3
3 6-9 1
4 9-12 1
5 12-15 2
6 15-18 1
7 18-21 0
8 21-24 2
9 24-27 1
10 27-30 0
11 30-33 2
12 33-36 0
13 36-39 1
14 39-42 0
15 42-45 1

Tak więc rozkład zmiennej losowej jaką jest liczba poziomów tufitowych w interwałach o stałej miąższości równej 3 m będzie wyglądał następująco:

Tab. 2. Rozkład zmiennej losowej J
j Oj
0 4
1 6
2 4
3 1
4 0

Aby zbadać czy otrzymany rozkład jest zgodny z teoretycznym rozkładem Poissona o znanej gęstości prawdopodobieństwa zdarzeń, użyjemy testu χ2.

$$ \begin{equation} \chi ^{2} =\sum _{j=1}^{k}\frac{( O_{j} -E_{j})^{2}}{E_{j}} \end{equation} $$ (1)

gdzie:

  • Oj - zdarzenia obserwowane [Observed];
  • Ej - zdarzenia spodziewane [Expected].

Stawiamy hipotezę zerową w brzmieniu:

H0: rozkład zdarzeń występowania tufitów w badanym profilu ma charakter losowy

Prawdopodobieństwo, że zmienna losowa jaką jest liczba poziomów tufitowych przypadająca na każdy z regularnych interwałów obliczamy ze wzoru na rozkład Poissona [szczegóły zob.: Rozkłady zmiennych losowych dyskretnych].

$$ \begin{equation} P_{( X=k)} =\left(\frac{\lambda ^{k}}{k!}\right) e^{-\lambda } \end{equation} $$ (2)

gdzie:

  • λ - wartość przeciętna (oczekiwana) zmiennej losowej,
  • k - zmienna losowa będąca liczbą sukcesów (liczba zdarzeń elementarnych w interwale).
$$ \begin{equation} \lambda =Np \end{equation} $$ (3)

gdzie:

  • N - liczba doświadczeń (liczba poziomów tufitowych - u nas N = 17),
  • p - prawdopodobieństwo sukcesu w pojedynczym doświadczeniu.

Z klasycznej definicji prawdopodobieństwa:

$$ \begin{equation} p=\frac{1}{T} \end{equation} $$ (4)

gdzie:

  • T - liczba regularnych interwałów (u nas T = 15)

tak więc:

$$ \begin{equation} P_{( X=k)} =\left(\frac{\left(\frac{N}{T}\right)^{k}}{k!}\right) e^{-\frac{N}{T}} \end{equation} $$ (5)

PRZYKŁAD cd.

Tab. 3. Obliczenia parawdopodobieństw, że zmienna losowa liczby poziomów tufitowych w profilu geologicznym ma rozkład Poissona
k (N/T)k k! (N/T)k/k! Ek
0 1 1 1.0 4.829
1 1.133 1 1.333 5.470
2 1.284 2 0.642 3.101
3 1.456 6 0.243 1.173
4 1.649 24 0.069 0.333
5 1.870 120 0.013 0.063

W związku z zaleceniem dla testu χ2 aby łączyć klasy w których liczba oczekiwanych elementów jest mniejsza niż 5, połączono zmienne losowe 2, 3, 4 i 5 w jedną klasę 2-.

Tab. 4. Obliczenia statystyki χ2
k Ok Ek χ2
0 4 4.829 0,142
1 6 5.470 0.051
2- 5 4.701 0.019
Σ 15 15 0.212

Tak więc:
χ2 = 0.212
α = 0.05
df = k - p - 1 = k - 1 = 2
χ2α, df = 5.99

χ2 < χ2α, df

Z tego wynika, że nie mamy podstaw do odrzucenia hipotezy zerowej (H0), co jednocześnie oznacza, że nie możemy wykluczyć, że rozkład tufitów w badanym profilu ma rozkład losowy.

Bibliografia

  • Swan A.R.H., Sandilands M., . Introduction to Geological Data Analysis. Blackwell Science Ltd., s. 447.