Miary zmienności - Tomasz Bartuś

Tab. 1. Miary zmienności
Miary klasyczne	Miary pozycyjne
wariancja odchylenie standardowe odchylenie przeciętne współczynnik zmienności	rozstęp odchylenie ćwiartkowe współczynnik zmienności

PRZYKŁAD

Dwa rozłączne obszary badań cechowały się następującymi wartościami wskaźnika W:

Tab. 2. Pomiary wskaźnika `W` w obszarach A i B
obszar	wartość cechy
A	60	59	58	61	60	61	57	62	59	63
B	53	60	67	49	65	62	56	70	63	55

Oba badane obszary cechują się taką samą ilością pobranych prób (n_i = 10), średnie arytmetyczne wartości badanych wskaźników w obu populacjach są sobie równe i wynoszą 60. Zadajmy sobie pytanie czy poza poszczególnymi wartościami istnieje jakaś różnica pomiędzy obiema populacjami? Aby się temu lepiej przyjrzeć przedstawmy oba zbiory danych na jednej osi współrzędnych.

Rozstęp danych w obszarach A i B — Fig. 1. Przedziały zmienności oraz średnie wartości wskaźnika `W` w obszarach A i B

Szczegółowe wyniki przedstawia poniższa tabelka:

Tab. 3. Wybrane podstawowe parametry statystyczne wskaźnika `W` w obszarach A i B
obszar	`n_i`	`$\begin{equation} \overline{x_{i}} \end{equation}$`	`M_e`	`min`	`max`	`Q₁`	`Q₃`	`R`
A	10	60	60	57	63	59	61	6
B	10	60	61	49	70	55	65	21

Jak widać, obszar A i B wyróżniają się różnych rozrzutem danych wokół wartości średniej. W obszarze A wartość min jest znacznie wyższa niż w obszarze B, a wartość max jest znacznie niższa niż w obszarze B.

To proste spostrzeżenie pozwala na sformułowanie pierwszego, najprostszego lecz jak się okaże obarczonego znacznym mankamentem parametru statystycznego. Tym parametrem jest rozstęp (R) będący po prostu różnicą pomiędzy wartościami x_max i x_min.

ROZSTĘP

Najprostszą i najbardziej intuicyjną miarą zmienności przypadków w populacji próby jest rozstęp. Rozstęp - różnica pomiędzy wartością maksymalną, a minimalną cechy - jest miarą charakteryzującą empiryczny obszar zmienności badanej cechy. W związku z tym, że przy jego obliczeniu ignoruje się wszystkie dane (za wyjątkiem dwóch wartości - minimalnej i maksymalnej), nie daje on jednak informacji o zróżnicowaniu poszczególnych wartości cechy w zbiorowości.

$$ \begin{equation} r=x_{max} -x_{min} \end{equation} $$ (1)

WARIANCJA

PRZYKŁAD cd.

Tak więc rozstęp możemy uznać jedynie za wstępną miarę zmienności w populacji próby. Zresztą przyjrzyjmy się takiemu przykładowi:

Dwa obszary charakteryzują się identycznymi wartościami średnimi badanego parametru i identycznymi wartościami minimalnymi i maksymalnymi, a co za tym idzie identycznymi rozstępami. Jednak już na pierwszy rzut oka widać, że rozrzuty danych wokół wartości przeciętnej w obu przypadkach są skrajnie różne. W obszarze A dane są znacznie bardziej skumulowane przy wartości średniej niż w obszarze B.

Powyższy przykład dobitnie pokazuje konieczność istnienia parametru statystycznego opisującego całkowitą zmienność wszystkich elementów populacji próby. Parametrem tym jest wariancja.

Wariancja (s²) - jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej zbiorowości.

szereg szczegółowy:

$$ \begin{equation} s^{2} =\frac{1}{n}\sum _{i=1}^{n}( x_{i} -\overline{x})^{2} \end{equation} $$ (2)

szereg rozdzielczy punktowy:

$$ \begin{equation} s^{2} =\frac{1}{n}\sum _{i=1}^{k}( x_{i} -\overline{x})^{2} n_{i} \end{equation} $$ (3)

szereg rozdzielczy z przedziałami klasowymi:

$$ \begin{equation} s^{2} =\frac{1}{n}\sum _{i=1}^{k}(\mathring{x}_{i} -\overline{x})^{2} n_{i} \end{equation} $$ (4)

Wykonując proste przekształcenia algebraiczne, otrzymamy:

szereg szczegółowy:

$$ \begin{equation*} s^{2} =\frac{1}{n}\sum _{i=1}^{n} x_{i}^{2} -\overline{x}^{2} \end{equation*} $$ (5)

$$ \begin{equation} s^{2} =\sum _{i=1}^{k}( x_{i} -\overline{x})^{2} \omega _{i} \end{equation} $$ (6)

szereg rozdzielczy:

$$ \begin{equation} s^{2} =\frac{1}{n}\sum _{i=1}^{k} x_{i}^{2} n_{i} -\overline{x}^{2} \end{equation} $$ (7)

$$ \begin{equation*} s^{2} =\sum _{i=1}^{k} x{_{i}}^{2} \omega _{i} -\overline{x}^{2} \end{equation*} $$ (8)

Uwaga !!! należy pamiętać o problemie obciążenia estymatora wariancji.

Gdy mamy do czynienia z opisem populacji próby (np. chcemy znać wariancję średnich prędkości samochodów, które jadąc uległy wypadkowi w woj. małopolskim w miesiącu styczniu 2026 roku (skończona liczba elementów populacji)), będziemy stosować wzory na wariancję w postaci przedstawionej powyżej. Jeżeli, jednak w obliczeniach dokonujemy estymacji wariancji występującej w jakiejś większej populacji generalnej (np.: chcemy znać wariancję średniego wzrostu Polek), zamiast ułamka 1 / n, musimy zastosować 1 / n - 1. Więcej o obciążeniu estymatora wariancji.

ODCHYLENIE STANDARDOWE

Odchylenie standardowe (standard deviation - SD) (s) - jest to pierwiastek kwadratowy z wariancji. Stanowi miarę zróżnicowania o mianie zgodnym z mianem badanej cechy, określa przeciętne zróżnicowanie poszczególnych wartości cechy od średniej arytmetycznej.

Przy pomocy odchylenia standardowego definiuje się typowy obszar zmienności cechy. Stanowi go około 2/3 wszystkich jednostek badanej zbiorowości statystycznej posiadający wartości cechy w tym przedziale:

$$ \begin{equation*} \overline{x} -s< x_{typ} < \overline{x} +s \end{equation*} $$ (9)

ODCHYLENIE PRZECIĘTNE

Odchylenie przeciętne (d) - jest to średnia arytmetyczna bezwzględnych odchyleń wartości cechy od średniej arytmetycznej. Określa o ile jednostki danej zbiorowości różnią się średnio, ze względu na wartość cechy, od średniej arytmetycznej.

szereg szczegółowy:

$$ \begin{equation} d=\frac{1}{n}\sum _{i=1}^{n} |x_{i} -\overline{x} | \end{equation} $$ (10)

szereg rozdzielczy:

$$ \begin{equation} d=\frac{1}{n}\sum _{i=1}^{k} |x_{i} -\overline{x} |\cdotp n_{i} \end{equation} $$ (11)

Pomiędzy odchyleniem przeciętnym i standardowym, dla tego samego szeregu zachodzi relacja: d < s.

ODCHYLENIE ĆWIARTKOWE

Odchylenie ćwiartkowe (D) - jest to parametr określający odchylenie wartości cechy od mediany. Mierzy poziom zróżnicowania tylko części jednostek; po odrzuceniu 25% jednostek o wartościach najmniejszych i 25% jednostek o wartościach największych.

$$ \begin{equation} Q=\frac{( Q_{3} -Me) +( Me-Q_{1})}{2} =\frac{Q_{3} -Q_{1}}{2} \end{equation} $$ (12)

Typowy obszar zmienności cechy:

$$ \begin{equation} Me-Q < x_{typ} < Me+Q \end{equation} $$ (13)

WSPÓŁCZYNNIK ZMIENNOŚCI

Współczynnik zmienności (Coefficient of Variation - CV) - jest ilorazem bezwzględnej miary zmienności cechy (odchylenia standardowego) i średniej wartości tej cechy, jest wielkością niemianowaną, najczęściej podawaną w procentach.

Klasyczne współczynniki zmienności:

$$ \begin{equation*} v_{s} =\frac{s}{\overline{x}} \end{equation*} $$ (14)

oraz

$$ \begin{equation*} V_{d} =\frac{d}{\overline{x}} ,\ \ \ \overline{x} >0 \end{equation*} $$ (15)

Pozycyjne współczynniki zmienności:

$$ \begin{equation*} V_{Q} =\frac{Q}{Me} ,\ \ \ \ \ Me >0 \end{equation*} $$ (16)

oraz

$$ \begin{equation*} V_{Q_{1} Q_{3}} =\frac{Q_{3} -Q_{1}}{Q_{3} +Q_{1}} \end{equation*} $$ (17)

Współczynnik zmienności stosuje się w porównaniach zróżnicowania:

kilku zbiorowości pod względem tej samej cechy,
tej samej zbiorowości pod względem kilku różnych cech.

Tab. 4. Klasyfikacja zmienności złóż (wg. Baryszewa) (Smirnow & Prokofiew, 1960, Mucha, 1994)
Grupa zmienności złóż	Zmienność	`V` [%]
I	mała	0-20
II	przeciętna	20-40
III	duża	40-100
IV	bardzo duża	100-150
V	skrajnie duża	>150

O zmienności całego złoża zawsze decydują cechy najbardziej zmiennego parametru.

Bibliografia

Krawczyk A., Słomka T., 1982. Podstawowe metody modelowania w geologii. Materiały pomocnicze do ćwiczeń. AGH Kraków, s. 186.
Mucha J., 1994. PMetody geostatystyczne w dokumentowaniu złóż. AGH, Katedra Geologii Kopalnianej, Kraków, s. 155.

Powiązane tematy:

statystyka miary zmienności wariancja odchylenie standardowe odchylenie przeciętne współczynnik zmienności rozstęp odchylenie ćwiartkowe zmienność