Szeregi rozdzielcze

Miary położenia, rozrzutu, skośności i asymetrii w zależności od liczebności próby obliczamy na podstawie szeregu pozycyjnego (dla prób mało licznych - poniżej 30 przypadków) lub szeregu rozdzielczego (dla prób licznych - powyżej 30 przypadków).

Szereg pozycyjny tworzy się przez uszeregowanie danych według wzrastającej wartości.
X1 < X2..... < Xn

Szereg rozdzielczy tworzy się przez uszeregowanie danych według wzrastającej lub malejącej wartości i podzielenie powstałego szeregu na rozłączne podzbiory zwane grupami.
W wyniku takiego podziału otrzymujemy bardziej jednorodne grupy. Obliczając częstości wystąpień w danej grupie otrzymujemy szereg rozdzielczy. Każdy szereg rozdzielczy charakteryzują przedziały klasowe grup i ilości przypadków występujących w kolejnych grupach. Szereg rozdzielczy reprezentuje postać rozkładu danych populacji próby.

PROCEDURA:

  1. Uszereguj dane wg wzrastającej wartości badanego parametru.
  2. Podziel powstały szereg na m klas według reguł:
    • Wszystkie przypadki muszą trafić do jednego z przedziałów klasowych.
    • Liczba przedziałów klasowych nie powinna być zbyt duża ani zbyt mała.
    • Najczęściej liczba przedziałów klasowych waha się w okolicy 10 (8-15).
    • Najlepszym sposobem doboru ilości klas jest metoda prób i błędów.
    • Szerokość przedziałów klasowych w miarę możliwości powinna być stała.
    • Granice przedziałów, o ile to możliwe powinny być liczbami całkowitymi lub "zaokrąglonymi" (1,5; 1,75 itp.).
    • Można kierować się znanymi regułami tworzenia grup:
      • Optymalna liczba klas k dla próby o liczebności n można obliczyć z sugestii Huntsbergera:
        k = 1 + 3.3 log n (Mucha J., ),
      • ilość przedziałów klasowych może przybliżać wyciągnięcie pierwiastka kwadratowego z ilości obserwacji (Swan A.R.H., ),
      • zakres zmienności badanego parametru obliczamy ze wzoru:
        Δx = xmax - xmin,
      • optymalną szerokość przedziłów klasowych Δx można obliczyć ze wzoru:
        Δx = xmax - xmin / 1 + 3,3 log n,
  3. oblicz liczebności wystąpień przypadków dla poszczególnych grup (li);
  4. w praktyce zamiast liczebności najczęściej używa się częstości wystąpień (pi) wyrażonych w procentach:
    pi = li / n ⋅ 100%;
  5. najczęściej szereg rozdzielczy przedstawia się w formie tabelarycznej,
  6. wizualną ocenę struktury populacji próby najwygodniej jest przeprowadzić za pomocą graficznej reprezentacji szeregu rozdzielczego - histogramu

PRZYKŁAD

Pomierzone średnice 40-tu amonitów [cm] wynoszą:

3,23,73,93,43,13,13,13,93,53,3
3,63,83,73,03,53,23,53,73,93,6
3,42,93,23,42,93,63,73,33,44,0
3,83,73,32,93,13,23,63,53,33,4

podsumujmy:

  • wszystkich przypadków: n = 40;
  • przybliżeniem ilości klas będzie pierwiastek kwadratowy z 40, k6;
  • wartość minimalna xmin = 2,9;
  • wartość maksymalna xmax = 4,0;
  • rozstęp (różnica pomiędzy xmax - xmin) = ΔX = 1,1;
  • szerokość przedziału klasowego: ΔX / k = 0,18 (dla wygody wartość tą rozszerzamy do 0,2);

Szereg rozdzielczy przedstawiono poniżej w formie tabelarycznej:

lp.przedziałliczebności
(li)
częstości
(pi) [%]
1.2,85-3,05410
2.3,05-3,25820
3.3,25-3,45922,5
4.3,45-3,65820
5.3,65-3,85717,5
6.3,85-4,05410
  Σ = 40Σ = 100%

UWAGA!: Przy testowaniu zgodności rozkładów z rozkładami teoretycznymi (np. rozkładem normalnym) testem Χ2 (czyt.: chi-kwadrat), klasy zawierające mniej niż 5 elementów są łączone z jedną z klas sąsiednich.

Bibliografia

  • Mucha J., . Metody geostatystyczne w dokumentowaniu złóż. Skrypt, Katedra Geologii Kopalnianej. AGH Kraków, s. 155.
  • Swan A.R.H., Sandilands M., . Introduction to Geological Data Analysis. Blackwell Science Ltd., s. 447.