Miary położenia, rozrzutu, skośności i asymetrii w zależności od liczebności próby obliczamy na podstawie szeregu pozycyjnego (dla prób mało licznych - poniżej 30 przypadków) lub szeregu rozdzielczego (dla prób licznych - powyżej 30 przypadków).
Szereg pozycyjny tworzy się przez uszeregowanie danych według wzrastającej wartości.
X1 < X2..... < Xn
Szereg rozdzielczy tworzy się przez uszeregowanie danych według wzrastającej lub malejącej wartości i podzielenie powstałego szeregu na rozłączne podzbiory zwane grupami.
W wyniku takiego podziału otrzymujemy bardziej jednorodne grupy. Obliczając częstości wystąpień w danej grupie otrzymujemy szereg rozdzielczy. Każdy szereg rozdzielczy charakteryzują przedziały klasowe grup i ilości przypadków występujących w kolejnych grupach. Szereg rozdzielczy reprezentuje postać rozkładu danych populacji próby.
PROCEDURA:
- Uszereguj dane wg wzrastającej wartości badanego parametru.
- Podziel powstały szereg na m klas według reguł:
-
- Wszystkie przypadki muszą trafić do jednego z przedziałów klasowych.
- Liczba przedziałów klasowych nie powinna być zbyt duża ani zbyt mała.
- Najczęściej liczba przedziałów klasowych waha się w okolicy 10 (8-15).
- Najlepszym sposobem doboru ilości klas jest metoda prób i błędów.
- Szerokość przedziałów klasowych w miarę możliwości powinna być stała.
- Granice przedziałów, o ile to możliwe powinny być liczbami całkowitymi lub "zaokrąglonymi" (1,5; 1,75 itp.).
- Można kierować się znanymi regułami tworzenia grup:
-
- Optymalna liczba klas k dla próby o liczebności n można obliczyć z sugestii Huntsbergera:
k = 1 + 3.3 log n (Mucha J., ), - ilość przedziałów klasowych może przybliżać wyciągnięcie pierwiastka kwadratowego z ilości obserwacji (Swan A.R.H., ),
- zakres zmienności badanego parametru obliczamy ze wzoru:
Δx = xmax - xmin, - optymalną szerokość przedziłów klasowych Δx można obliczyć ze wzoru:
Δx = xmax - xmin / 1 + 3,3 log n,
- Optymalna liczba klas k dla próby o liczebności n można obliczyć z sugestii Huntsbergera:
- oblicz liczebności wystąpień przypadków dla poszczególnych grup (li);
- w praktyce zamiast liczebności najczęściej używa się częstości wystąpień (pi) wyrażonych w procentach:
pi = li / n ⋅ 100%; - najczęściej szereg rozdzielczy przedstawia się w formie tabelarycznej,
- wizualną ocenę struktury populacji próby najwygodniej jest przeprowadzić za pomocą graficznej reprezentacji szeregu rozdzielczego - histogramu
PRZYKŁAD
Pomierzone średnice 40-tu amonitów [cm] wynoszą:
| 3,2 | 3,7 | 3,9 | 3,4 | 3,1 | 3,1 | 3,1 | 3,9 | 3,5 | 3,3 |
| 3,6 | 3,8 | 3,7 | 3,0 | 3,5 | 3,2 | 3,5 | 3,7 | 3,9 | 3,6 |
| 3,4 | 2,9 | 3,2 | 3,4 | 2,9 | 3,6 | 3,7 | 3,3 | 3,4 | 4,0 |
| 3,8 | 3,7 | 3,3 | 2,9 | 3,1 | 3,2 | 3,6 | 3,5 | 3,3 | 3,4 |
podsumujmy:
- wszystkich przypadków: n = 40;
- przybliżeniem ilości klas będzie pierwiastek kwadratowy z 40, k ≈ 6;
- wartość minimalna xmin = 2,9;
- wartość maksymalna xmax = 4,0;
- rozstęp (różnica pomiędzy xmax - xmin) = ΔX = 1,1;
- szerokość przedziału klasowego: ΔX / k = 0,18 (dla wygody wartość tą rozszerzamy do 0,2);
Szereg rozdzielczy przedstawiono poniżej w formie tabelarycznej:
| lp. | przedział | liczebności (li) | częstości (pi) [%] |
|---|---|---|---|
| 1. | 2,85-3,05 | 4 | 10 |
| 2. | 3,05-3,25 | 8 | 20 |
| 3. | 3,25-3,45 | 9 | 22,5 |
| 4. | 3,45-3,65 | 8 | 20 |
| 5. | 3,65-3,85 | 7 | 17,5 |
| 6. | 3,85-4,05 | 4 | 10 |
| Σ = 40 | Σ = 100% |
UWAGA!: Przy testowaniu zgodności rozkładów z rozkładami teoretycznymi (np. rozkładem normalnym) testem Χ2 (czyt.: chi-kwadrat), klasy zawierające mniej niż 5 elementów są łączone z jedną z klas sąsiednich.
Bibliografia
- Mucha J., . Metody geostatystyczne w dokumentowaniu złóż. Skrypt, Katedra Geologii Kopalnianej. AGH Kraków, s. 155.
- Swan A.R.H., Sandilands M., . Introduction to Geological Data Analysis. Blackwell Science Ltd., s. 447.