Miary zmienności

Tab. 1. Miary zmienności
Miary klasyczne Miary pozycyjne
wariancja
odchylenie standardowe
odchylenie przeciętne
współczynnik zmienności
rozstęp
odchylenie ćwiartkowe
współczynnik zmienności
PRZYKŁAD
 

Dwa rozłączne obszary badań cechowały się następującymi wartościami wskaźnika W:

Tab. 2. Pomiary wskaźnika W w obszarach A i B
obszar wartość cechy
A 60 59 58 61 60 61 57 62 59 63
B 53 60 67 49 65 62 56 70 63 55

Oba badane obszary cechują się taką samą ilością pobranych prób (ni = 10), średnie arytmetyczne wartości badanych wskaźników w obu populacjach są sobie równe i wynoszą 60. Zadajmy sobie pytanie czy poza poszczególnymi wartościami istnieje jakaś różnica pomiędzy obiema populacjami? Aby się temu lepiej przyjrzeć przedstawmy oba zbiory danych na jednej osi współrzędnych.

Rozstęp danych w obszarach A i B
Fig. 1. Przedziały zmienności oraz średnie wartości wskaźnika W w obszarach A i B

Szczegółowe wyniki przedstawia poniższa tabelka:

Tab. 3. Wybrane podstawowe parametry statystyczne wskaźnika W w obszarach A i B
obszar ni \(\begin{equation} \overline{x_{i}} \end{equation}\) Me min max Q1 Q3 R
A 10 60 60 57 63 59 61 6
B 10 60 61 49 70 55 65 21

Jak widać, obszar A i B wyróżniają się różnych rozrzutem danych wokół wartości średniej. W obszarze A wartość min jest znacznie wyższa niż w obszarze B, a wartość max jest znacznie niższa niż w obszarze B.

To proste spostrzeżenie pozwala na sformułowanie pierwszego, najprostszego lecz jak się okaże obarczonego znacznym mankamentem parametru statystycznego. Tym parametrem jest rozstęp (R) będący po prostu różnicą pomiędzy wartościami xmax i xmin.

ROZSTĘP

Najprostszą i najbardziej intuicyjną miarą zmienności przypadków w populacji próby jest rozstęp. Rozstęp - różnica pomiędzy wartością maksymalną, a minimalną cechy - jest miarą charakteryzującą empiryczny obszar zmienności badanej cechy. W związku z tym, że przy jego obliczeniu ignoruje się wszystkie dane (za wyjątkiem dwóch wartości - minimalnej i maksymalnej), nie daje on jednak informacji o zróżnicowaniu poszczególnych wartości cechy w zbiorowości.

$$ \begin{equation} r=x_{max} -x_{min} \end{equation} $$ (1)

WARIANCJA

PRZYKŁAD cd.

Tak więc rozstęp możemy uznać jedynie za wstępną miarę zmienności w populacji próby. Zresztą przyjrzyjmy się takiemu przykładowi:

Rozstęp danych w obszarach A i B
Fig. 2. Rozstępy pewnego parametru w próbach A i B

Dwa obszary charakteryzują się identycznymi wartościami średnimi badanego parametru i identycznymi wartościami minimalnymi i maksymalnymi, a co za tym idzie identycznymi rozstępami. Jednak już na pierwszy rzut oka widać, że rozrzuty danych wokół wartości przeciętnej w obu przypadkach są skrajnie różne. W obszarze A dane są znacznie bardziej skumulowane przy wartości średniej niż w obszarze B.

Powyższy przykład dobitnie pokazuje konieczność istnienia parametru statystycznego opisującego całkowitą zmienność wszystkich elementów populacji próby. Parametrem tym jest wariancja.

Wariancja (s2) - jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej zbiorowości.

szereg szczegółowy:

$$ \begin{equation} s^{2} =\frac{1}{n}\sum _{i=1}^{n}( x_{i} -\overline{x})^{2} \end{equation} $$ (2)

szereg rozdzielczy punktowy:

$$ \begin{equation} s^{2} =\frac{1}{n}\sum _{i=1}^{k}( x_{i} -\overline{x})^{2} n_{i} \end{equation} $$ (3)

szereg rozdzielczy z przedziałami klasowymi:

$$ \begin{equation} s^{2} =\frac{1}{n}\sum _{i=1}^{k}(\mathring{x}_{i} -\overline{x})^{2} n_{i} \end{equation} $$ (4)

Wykonując proste przekształcenia algebraiczne, otrzymamy:

szereg szczegółowy:

$$ \begin{equation*} s^{2} =\frac{1}{n}\sum _{i=1}^{n} x_{i}^{2} -\overline{x}^{2} \end{equation*} $$ (5)
$$ \begin{equation} s^{2} =\sum _{i=1}^{k}( x_{i} -\overline{x})^{2} \omega _{i} \end{equation} $$ (6)

szereg rozdzielczy:

$$ \begin{equation} s^{2} =\frac{1}{n}\sum _{i=1}^{k} x_{i}^{2} n_{i} -\overline{x}^{2} \end{equation} $$ (7)
$$ \begin{equation*} s^{2} =\sum _{i=1}^{k} x{_{i}}^{2} \omega _{i} -\overline{x}^{2} \end{equation*} $$ (8)

Uwaga !!! należy pamiętać o problemie obciążenia estymatora wariancji.

Gdy mamy do czynienia z opisem populacji próby (np. chcemy znać wariancję średnich prędkości samochodów, które jadąc uległy wypadkowi w woj. małopolskim w miesiącu styczniu 2026 roku (skończona liczba elementów populacji)), będziemy stosować wzory na wariancję w postaci przedstawionej powyżej. Jeżeli, jednak w obliczeniach dokonujemy estymacji wariancji występującej w jakiejś większej populacji generalnej (np.: chcemy znać wariancję średniego wzrostu Polek), zamiast ułamka 1 / n, musimy zastosować 1 / n - 1. Więcej o obciążeniu estymatora wariancji.

ODCHYLENIE STANDARDOWE

Odchylenie standardowe (standard deviation - SD) (s) - jest to pierwiastek kwadratowy z wariancji. Stanowi miarę zróżnicowania o mianie zgodnym z mianem badanej cechy, określa przeciętne zróżnicowanie poszczególnych wartości cechy od średniej arytmetycznej.

Przy pomocy odchylenia standardowego definiuje się typowy obszar zmienności cechy. Stanowi go około 2/3 wszystkich jednostek badanej zbiorowości statystycznej posiadający wartości cechy w tym przedziale:

$$ \begin{equation*} \overline{x} -s< x_{typ} < \overline{x} +s \end{equation*} $$ (9)

ODCHYLENIE PRZECIĘTNE

Odchylenie przeciętne (d) - jest to średnia arytmetyczna bezwzględnych odchyleń wartości cechy od średniej arytmetycznej. Określa o ile jednostki danej zbiorowości różnią się średnio, ze względu na wartość cechy, od średniej arytmetycznej.

szereg szczegółowy:

$$ \begin{equation} d=\frac{1}{n}\sum _{i=1}^{n} |x_{i} -\overline{x} | \end{equation} $$ (10)

szereg rozdzielczy:

$$ \begin{equation} d=\frac{1}{n}\sum _{i=1}^{k} |x_{i} -\overline{x} |\cdotp n_{i} \end{equation} $$ (11)

Pomiędzy odchyleniem przeciętnym i standardowym, dla tego samego szeregu zachodzi relacja: d < s.

ODCHYLENIE ĆWIARTKOWE

Odchylenie ćwiartkowe (D) - jest to parametr określający odchylenie wartości cechy od mediany. Mierzy poziom zróżnicowania tylko części jednostek; po odrzuceniu 25% jednostek o wartościach najmniejszych i 25% jednostek o wartościach największych.

$$ \begin{equation} Q=\frac{( Q_{3} -Me) +( Me-Q_{1})}{2} =\frac{Q_{3} -Q_{1}}{2} \end{equation} $$ (12)

Typowy obszar zmienności cechy:

$$ \begin{equation} Me-Q < x_{typ} < Me+Q \end{equation} $$ (13)

WSPÓŁCZYNNIK ZMIENNOŚCI

Współczynnik zmienności (Coefficient of Variation - CV) - jest ilorazem bezwzględnej miary zmienności cechy (odchylenia standardowego) i średniej wartości tej cechy, jest wielkością niemianowaną, najczęściej podawaną w procentach.

Klasyczne współczynniki zmienności:

$$ \begin{equation*} v_{s} =\frac{s}{\overline{x}} \end{equation*} $$ (14)

oraz

$$ \begin{equation*} V_{d} =\frac{d}{\overline{x}} ,\ \ \ \overline{x} >0 \end{equation*} $$ (15)

Pozycyjne współczynniki zmienności:

$$ \begin{equation*} V_{Q} =\frac{Q}{Me} ,\ \ \ \ \ Me >0 \end{equation*} $$ (16)

oraz

$$ \begin{equation*} V_{Q_{1} Q_{3}} =\frac{Q_{3} -Q_{1}}{Q_{3} +Q_{1}} \end{equation*} $$ (17)

Współczynnik zmienności stosuje się w porównaniach zróżnicowania:

  • kilku zbiorowości pod względem tej samej cechy,
  • tej samej zbiorowości pod względem kilku różnych cech.
Tab. 4. Klasyfikacja zmienności złóż (wg. Baryszewa) (Smirnow & Prokofiew, , Mucha, )
Grupa zmienności złóż Zmienność V [%]
I mała 0-20
II przeciętna 20-40
III duża 40-100
IV bardzo duża 100-150
V skrajnie duża >150

O zmienności całego złoża zawsze decydują cechy najbardziej zmiennego parametru.

Bibliografia

  • Krawczyk A., Słomka T., . Podstawowe metody modelowania w geologii. Materiały pomocnicze do ćwiczeń. AGH Kraków, s. 186.
  • Mucha J., . PMetody geostatystyczne w dokumentowaniu złóż. AGH, Katedra Geologii Kopalnianej, Kraków, s. 155.