Miary koncentracji

WSPÓŁCZYNNIK SKUPIENIA (KONCENTRACJI, KURTOZA)

Współczynnik skupienia (in. współczynnik koncentracji, kurtoza, kurtoza bezwzględna) (K) - jest miarą skupienia poszczególnych obserwacji wokół średniej. Im wyższa wartość współczynnika tym bardziej wysmukła krzywa liczebności i większa koncentracja wartości cech wokół średniej.

$$ \begin{equation} K=\frac{m_{4}}{s^{4}} \end{equation} $$ (1)

gdzie tzw. czwarty moment (m4):
dla szeregu szczegółowego to:

$$ \begin{equation} m_{4} =\frac{1}{n}\sum _{i=1}^{n}( x_{i} -\overline{x})^{4} \end{equation} $$ (2)

dla szeregu rozdzielczego to:

$$ \begin{equation} m_{4} =\frac{1}{n}\sum _{i=1}^{k}( x_{i} -\overline{x})^{4} n_{i} \end{equation} $$ (3)

Jaki jest sens czwartego momentu?

Wyobraźmy sobie, że analizujemy odległość wyników od średniej (xi - ). Pierwszy moment to po prostu suma odchyleń (zawsze wyjdzie 0). Drugi moment podnosi odchylenia do kwadratu. Jest to więc wariancja. Dzięki temu wszystkie liczby są dodatnie i wiemy, jak szeroko rozrzucone są dane. Czwarty moment (m4) podnosi te odchylenia do czwartej potęgi. Działa to jak "wzmacniacz" dla wartości ekstremalnych. Jeśli wynik jest blisko średniej (np. odchylenie wynosi 0,5), to po podniesieniu do czwartej potęgi staje się bardzo mały (0,0625). Jeśli jednak wynik jest daleko od średniej (np. odchylenie wynosi 10), to po podniesieniu do czwartej potęgi wartość m4 staje się gigantyczna (10000).

Jeżeli przyjmiemy, że zbiorowość ma:

  • rozkład normalny (mezokurtyczny), to: K = 3,
  • rozkład bardziej spłaszczony od normalnego (platokurtyczny), to: K < 3,
  • rozkład bardziej wysmukły od normalnego (leptokurtyczny), to: K > 3.
Spłaszczenie rozkładów
Fig. 1. Rozkłady o spłaszczeniu mniejszym, większymi równym rozkładowi normalnemu

KURTOZA NADMIAROWA (EKSCES)

Skoro dla idealnego rozkładu normalnego (krzywej Gaussa), który jest rodzajem wzorca, kurtoza jest równa 3, statystycy uznali, że najlepiej byłoby, gdyby wskaźnik dla niego wynosił 0. Dlatego wymyślono Eksces, który jest równy K - 3, żeby mieć wygodny punkt odniesienia:

$$ \begin{equation} Ex=\frac{m_{4}}{s^{4}} -3 \end{equation} $$ (4)
  • Ex = 0: Masz rozkład normalny (mezokurtyczny). Twoje dane zachowują się "standardowo".
  • Ex > 0: Wykres jest strzelisty (leptokurtyczny). Dane są mocno skupione wokół średniej, ale mają tzw. "grube ogony" (częste wartości skrajne).
  • Ex < 0: Wykres jest płaski (jak plackowaty) (platykurtyczny). Dane są bardziej rozproszone, a wartości skrajne zdarzają się rzadziej niż w rozkładzie normalnym.

WSPÓŁCZYNNIK KONCENTRACJI LORENZA

O ile kurtoza i współczynnuk ekscesu opisują strzelistość rozkładu empirycznego porównując go do rozkładu normalnego, o tyle współczynnik koncentracji Lorenza (często utożsamiany z współczynnikiem Giniego) sprawdza sprawiedliwość podziału, np. stosuje się go, gdy chcemy odpowiedzieć na pytanie: Czy mała grupa osób trzyma w rękach większość pieniędzy, czy może wszyscy mają po równo?

Krzywa Lorenza
Fig. 2. Przykład krzywej Lorenza

Podstawą wyznaczenia współczynnika Lorenza jest wykreślenie krzywej Lorenza. Na wykresie na osi OX zaznaczamy skumulowany % populacji (np. od najbiedniejszych do najbogatszych), zaś na osi OY mamy skumulowany % zasobu (np. dochodu). Gdyby każdy zarabiał tyle samo, krzywa byłaby idealnie linią prostą nachyloną pod kątem 45° (linia idealnej równości). Jednak w rzeczywistości krzywa „zapada się” w dół, tworząc łuk. Im bardziej łuk jest wygięty, tym większe są nierówności.

Wzór na współczynnik koncentracji (k lub G) to stosunek pola powierzchni między linią idealnej równości a krzywą Lorenza, do pola całego trójkąta pod linią równości. Dla szeregu rozdzielczego najczęściej stosuje się wzór:

$$ \begin{equation} k=1-\sum _{i=1}^{n}( x_{sk,i} +x_{sk,i-1}) \cdotp p_{i} \end{equation} $$ (5)

Gdzie:
xsk,i – skumulowany odsetek wartości cechy (np. dochodu) w i-tej grupie
pi – odsetek liczebności w i-tej grupie.

Wartości wskaźnika zmieniają sie w zakresie (0; 1), k = 0: oznacza pełną równość. Każdy ma dokładnie tyle samo (krzywa Lorenza pokrywa się z linią 45°). Wynik bliski 1 oznacza skrajną koncentrację. Jeden człowiek ma prawie wszystko, a reszta nie ma nic.