Статистика - Опря А. Т. - § 1.6. Оцінка розподілів з використанням критерію згоди Колмогорова
Розглянуті в попередніх параграфах способи оцінки відмінності між двома вибірковими спостереженнями грунтувалися на припущенні про нормальний характер розподілу генеральних сукупностей (або близькому до нормального). Але експериментатору (досліднику) не завжди відома форма розподілу даних, з яких проводиться вибірка. Тому використання критеріїв X і х1 може інколи привести до суб'єктивної оцінки результатів спостережень. У зв'язку з цим в математичній статистиці розроблені критерії оцінки вибірок з будь - якого виду розподілу.
Теоретичною основою їх розробки є припущення, що ряд послідовних спостережень можна розглядати як просту незалежну вибірку з незмінним розподілом. Ці критерії одержали назву непараметричних. Для їх розрахунків непотрібно обчислювати середню, дисперсію та інші статистичні характеристики вибіркових розподілів. У деяких випадках для розрахунку непараметричних критеріїв використовуються не безпосередні дані спостереження, а різного роду впорядковані ряди (з нагромадженими частотами, ранжировані різниці одиниць спостережень і т. п.). Критерії, які розраховуються у цьому випадку, називають порядковими.
До непараметричних критеріїв відносять: критерій Л, (ламбда) Колмогорова, критерій Уайта, критерій Уілксона.
Ступінь наближення емпіричного розподілу до обчислюваного (теоретичного), в равній мірі як і порівняльну оцінку двох однорідних варіаційних рядів, визначають за допомогою непараметричного критерію Л (ламбда). Якщо використання хі - квадрат критерію грунтується на використанні таких вибіркових характеристик (параметрів) як середня (5с) і стандарт (а), то при розрахунку Л - критерію їх обчислення непотрібно. Він оснований на відповідності рядів інтегральних (нагромаджених) частот досліджуваних сукупностей. Суть його полягає в розрахунку величини максимальної різниці (D) нагромаджених частот (частостей) емпіричного і теоретичного розподілів. Тобто для використання цього критерію необхідне впорядкування двох рядів розподілу у вигляді їх кумуляції. А. Н. Колмогоров довів, що при необмеженому зростанні чисельності вибірки (n) імовірність нерівності DYfn >Х прямує до границі
LimРф4П >х) = і£ (-1)К е-2Л
Де D - величина максимальної різниці нагромаджених частот (частостей) емпіричного і теоретичного розподілів.
Непараметричний показник X розраховується як відношення максимальної різниці (без врахування її знака) нагромаджених частот емпіричного і теоретичного рядів розподілу до кореня квадратного із чисельності вибірки:
D Max| nI - nT І
У випадку повного збігу порівнюваних частот в рядах розподілу X = 0. Чим більша розбіжність в рядах, тим більша величина ламбда-критерію. Але занадто велику величину X випадковими відхиленнями у порівнюваних рядах розподілу пояснити важко, тому робиться висновок про невідповідність вибіркового розподілу і теоретично припущеного.
Критерій згоди Колмогорова (а), на відміну від Хі - квадрат критерію, дуже простий не тільки в розрахунках, але й не передбачає використання стандартних таблиць для його оцінки. Теоретично доведено, що при чисельності вибіркової сукупності приблизно більш 25 одиниць (n > 25) граничні значення критерію ламбда (ХІ), що відповідають трьом порогам довірчої імовірності (Р = 0,95; Р = 0,99; Р= 0,999), дорівнюють відповідно 1,36; 1,63; 1,95. Показник числа ступенів вільності при цьому не розраховується.
Таким чином, якщо лР >хТ, то з відповідною ймовірністю розбіжності між емпіричним і теоретичним розподілами визнаються значущими (істотними).
Приклад. Продемонструємо розрахунок критерію згоди Колмогорова на прикладі розподілу підприємств за урожайністю зернових культур (табл. 106).
Таблиця 106
Розрахунок критерію "ламбда" (X ) при оцінці розбіжностей між емпіричним і теоретичним
Рядами розподілу
Серединне значення (центр) інтервалу, Хі |
Частота, я, |
Центрування, ХІ ~* | |
Нормоване відхилення, IХ! ~* | А |
Табличне значення функції, Ед |
Теоретична частота (заокруглена), пТ |
Нагромаджені частоти |
СІ = пгПт 1 | |
Гі, | ||||||||
20,5 |
7 |
6,4 |
1,42 |
0,1456 |
6 |
1 |
6 |
І |
23,5 |
15 |
3,4 |
0,75 |
0,3011 |
12 |
22 |
18 |
4 |
26,5 |
16 |
0,4 |
0,10 |
0,3970 |
15 |
38 |
33 |
5 |
29,5 |
9 |
2,6 |
0,58 |
0,3372 |
13 |
47 |
46 |
1 |
32,5 |
5 |
5,6 |
1,24 |
0,1849 |
7 |
52 |
53 |
1 |
35,5 |
3 |
8,6 |
1,91 |
0,0644 |
3 |
55 |
56 |
1 |
38,5 |
2 |
11,6 |
2,58 |
0,0143 |
І |
57 |
57 |
0 |
X |
57 |
X |
X |
X |
X |
X |
X |
X |
Максимальне значення різниці нагромаджених частот емпіричного і теоретичного рядів розподілу дорівнює " - гіт = 5 ■ Величина ламбда-критерію становитиме:
Х=-5= = 0,66.
Одержана величина критерію (0,66) значно менше теоретичного її рівня (Л05= 1,36) відповідного порога ймовірності (Р = 0,95). Тому розходження між емпіричним розподілом і нормальним визнаються невірогідними, тобто розходження між частотами знаходяться в межах випадкових коливань.
Для виявлення вірогідності двох емпіричних розподілів, одержаних в результаті вибірки з однієї і тієї ж генеральної сукупності, але які мають неоднакову кількість одиниць, критерій "ламбда" обчислюється за формулою:
Би, Щ, и, и,
X = -1--- max -
БИ,
Де -1 - суми нагромаджених частот по кожному інтервалу першого ряду гі
Розподілу, поділені на обсяг вибірки;^"і - Те ж по другому ряду розподілу;
^гі. _ Zrii max - максимальне абсолютне значення (без врахування знака)
Різниці часток від ділення нагромаджених частот на обсяг вибірки;
И1, и2 - обсяги одиниць вибіркової сукупності по першому і другому ряду розподілів.
У таблиці 107 представлені два емпіричних ряди розподілу підприємств за врожайністю зернових культур, відібраних з однієї генеральної сукупності, але які різняться обсягами вибірки.
В останній графі цієї таблиці максимальна різниця кумульованих частот
Представлена величиною 0,07. Підставивши її у вище наведену формулу,
Знайдемо значення критерію "ламбда".
Ггі1хгі7 Пг7 /100 х 200 " Гп
Х = d max Р-^ = 0.07,-= 0,57 .
1+ n2 V 100 + 200
Розрахована величина критерію менше граничних критичних значень X для всіх трьох порогів імовірності (Л005 = 1,36; 10 01 = 1,63; 10 001 = 1,95). Це свідчить
Про неістотність розбіжностей між порівнюваними емпіричними рядами розподілу. Звідси висновок про те, що обидві вибірки репрезентують досліджувану генеральну сукупність.
У випадках, коли під знаком радикала громіздкі числа, розглянуту вище формулу приводять до вигляду:
XІ = d2 Max ril^ri..
П + n2
Таблиця 107
Розрахунок критерію "ламбда" {X >при оцінці розбіжностей між емпіричними рядами розподілу з
Неоднаковими обсягами вибірки
Серединне значення інтервалу, Хі |
Частоти |
Нагромаджені частоти |
Розрахункові дані | ||||
"і |
П, |
Ги Пі |
Гй Пі |
Пі Пі | |||
20,5 |
3 |
5 |
3 |
5 |
0,03 |
0,02 |
0,01 |
23,5 |
10 |
15 |
13 |
20 |
0,13 |
0,10 |
0,03 |
26,5 |
12 |
20 |
25 |
40 |
0,25 |
0,20 |
0,05 |
29,5 |
20 |
58 |
45 |
98 |
0,45 |
0,49 |
0,04 |
32,5 |
19 |
44 |
64 |
142 |
0,64 |
0,71 |
0,07 |
35,5 |
16 |
20 |
80 |
162 |
0,80 |
0,81 |
0,01 |
38,5 |
10 |
15 |
90 |
177 |
0,90 |
0,88 |
0,02 |
41,5 |
5 |
10 |
95 |
187 |
0,95 |
0,93 |
0,02 |
44,5 |
4 |
8 |
99 |
195 |
0,99 |
0,97 |
0,02 |
47,5 |
1 |
5 |
100 |
200 |
1,00 |
1,00 |
X |
X |
100 |
200 |
X |
X |
X |
X |
X |
Підставивши в цю формулу необхідні значення, маємо:
* = О,0722000- = 0,327; 300
X = ^0,327 = 0,57.
Схожі статті
-
Статистика - Опря А. Т. - § 1.5. Основні аспекти і умови застосування Xi - квадрат критерію
Хі - квадрат (критерій згоди Пірсона - %2) є об'єктивною оцінкою близькості емпіричних розподілів до теоретичних. Використовується, як уже було сказано,...
-
Статистика - Опря А. Т. - Тема 6. Аналіз подібності розподілів
5.1. Яка з перелічених відповідей виходить за межі видів рядів розподілу? - Атрибутивні, варіаційні. - Дискретні. - Інтервальні. * Структурні. 5.2. За...
-
Статистика - Опря А. Т. - § 1.4. Перевірка статистичних гіпотез відносно розподілів
Серед статистичних характеристик, відносно яких може висуватися і оцінюватися гіпотеза, найважливішим параметром є середня величина. Це зумовлює її роль...
-
Статистика - Опря А. Т. - § 6.1. Статистична оцінка параметрів розподілу
§ 6.1. Статистична оцінка параметрів розподілу Питання статистичної оцінки пов'язують в єдине ціле такі проблемні аспекти математичної статистики, як...
-
Статистика - Опря А. Т. - 6.2.2. Нормальний розподіл
Закон нормального розподілу, так званий Закон Гаусса, - один з найпоширеніших законів. Це фундаментальний закон у теорії ймовірностей і в її...
-
Статистика - Опря А. Т. - 6.2.5. Розподіл Фішера - Снедекора
При перевірці статистичних гіпотез розглядаються питання про критерії узгодженості. Останні дозволяють вирішити задачу про відповідність або...
-
Статистика - Опря А. Т. - 6.2.4. Розподіл Хі - квадрат
При перевірці статистичних гіпотез розглядаються питання про критерії узгодженості. Останні дозволяють вирішити задачу про відповідність або...
-
Статистика - Опря А. Т. - Тема 5. Аналіз рядів розподілу
5.1. Яка з перелічених відповідей виходить за межі видів рядів розподілу? - Атрибутивні, варіаційні. - Дискретні. - Інтервальні. * Структурні. 5.2. За...
-
Статистика - Опря А. Т. - 6.2.3. Розподіл Стьюдента
При розгляді питання середньої арифметичної у вибірках, які взяті з генеральної сукупності і підпорядковуються закону нормального розподілу, стає...
-
Статистика - Опря А. Т. - § 4.3. Середні величини як характеристики ряду
При зоровому сприйнятті показників рядів розподілу і їх графіків переконуємося, що розмір варіант має деякі загальні закономірності, які проявляються в...
-
Графічне зображення рядів розподілу (як і статистичних даних взагалі), крім досягнення наочності, переслідує й аналітичну мету. Графік дозволяє в...
-
Статистика - Опря А. Т. - § 1.3. Перевірка статистичних гіпотез відносно середніх
Серед статистичних характеристик, відносно яких може висуватися і оцінюватися гіпотеза, найважливішим параметром є середня величина. Це зумовлює її роль...
-
Статистика - Опря А. Т. - § 11.4. Помилки вибірки, їх визначення при різних способах відбору
Між характеристиками вибіркової сукупності і шуканими параметрами відповідних характеристик генеральної сукупності існують певні розбіжності. їх...
-
Статистика - Опря А. Т. - § 5.4. Моменти статистичного розподілу
Варіаційний ряд розподілу може характеризуватися системою статистик, які мають загальний математичний вираз і носять назву Моментів розподілу. В цій...
-
Статистика - Опря А. Т. - Тема 12. Подання статистичних даних: таблиці, графіки, карти
Тема 11. Вибірковий метод 11.1. Як називається вид статистичного спостереження, при якому обстеженню підлягає лише частина одиниць сукупності, відібраних...
-
Статистика - Опря А. Т. - Тема 11. Вибірковий метод
Тема 11. Вибірковий метод 11.1. Як називається вид статистичного спостереження, при якому обстеженню підлягає лише частина одиниць сукупності, відібраних...
-
Статистика - Опря А. Т. - МОДУЛЬ 5
Тема 11. Вибірковий метод 11.1. Як називається вид статистичного спостереження, при якому обстеженню підлягає лише частина одиниць сукупності, відібраних...
-
Статистика - Опря А. Т. - § 6.2. Закони розподілу вибіркових характеристик
6.2.1. Загальне поняття законів розподілу Закон розподілу характеризує випадкову величину з точки зору теорії ймовірностей. Розподіл імовірностей тісно...
-
Статистика - Опря А. Т. - § 11.5.Організація вибіркового спостереження
Цієї сукупності. При невідомій генеральній сукупності таку схему побудувати неможливо і кількісні характеристики генеральної сукупності не можуть бути...
-
Статистика - Опря А. Т. - § 11.3. Способи відбору у вибіркову сукупність
Способи відбору одиниць з досліджуваної генеральної сукупності з метою утворення вибіркової сукупності можуть бути різні. Залежно від того, як поставлена...
-
Статистика - Опря А. Т. - § 11.1. Загальне поняття вибіркового методу статистичного спостереження
ТЕМА 11. ВИБІРКОВИЙ МЕТОД § 11.1. Загальне поняття вибіркового методу статистичного спостереження Щоб вивчити будь - яку сукупність (а таке завдання...
-
Статистика - Опря А. Т. - 6.2.1. Загальне поняття законів розподілу
6.2.1. Загальне поняття законів розподілу Закон розподілу характеризує випадкову величину з точки зору теорії ймовірностей. Розподіл імовірностей тісно...
-
Статистика - Опря А. Т. - § 5.5. Характеристика асиметрії і ексцесу
При зміщенні вправо від центра асиметрія буде характеризуватися додатнім числом, при зміщенні вліво - від'ємним. Коефіцієнт асиметрії (А.) розраховується...
-
Статистика - Опря А. Т. - Тема 8. Аналіз інтенсивності динаміки
Тема 8. Аналіз інтенсивності динаміки 8.1. Яка з відповідей виходить за межі вимог до побудови рядів динаміки? - Вірогідність, точність, наукова...
-
Статистика - Опря А. Т. - МОДУЛЬ 4
Тема 8. Аналіз інтенсивності динаміки 8.1. Яка з відповідей виходить за межі вимог до побудови рядів динаміки? - Вірогідність, точність, наукова...
-
Статистика - Опря А. Т. - 12.2.3. Види статистичних графіків і способи їх побудови
Статистичні графіки за напрямом використання характеризуються значною різноманітністю. їх наукова класифікація передбачає такі ознаки, як загальне...
-
Статистика - Опря А. Т. - § 8.2. Види рядів динаміки, їх аналітичні показники
Залежно від реєстрації фактів ряди динаміки бувають дискретними і неперервними. Дискретні ряди Містять дані, одержані через певні проміжки часу ( місяць,...
-
Статистика - Опря А. Т. - § 5.3. Варіація ознак. Показники варіації
Розміри ознак, які характеризують кількісні зміни тих чи інших явищ, зазнають коливань. Як відомо, у певних межах коливаються (варіюють) показники рівнів...
-
Статистика - Опря А. Т. - § 11.2. Теоретичні основи вибіркового методу
Кожна досліджувана сукупність залежить від дії певних суб'єктивних факторів, котрі зумовлюють коливання результатів досліджень. Кожна окрема одиниця...
-
Статистика - Опря А. Т. - Тема 9. Аналіз тенденцій розвитку та коливань
Тема 8. Аналіз інтенсивності динаміки 8.1. Яка з відповідей виходить за межі вимог до побудови рядів динаміки? - Вірогідність, точність, наукова...
Статистика - Опря А. Т. - § 1.6. Оцінка розподілів з використанням критерію згоди Колмогорова