Математична статистика - Руденко В. М. - Точково-бісеріальний коефіцієнт кореляції rpb
Для визначення тісноти зв'язку ознак X і Y, які оцінюються у двох значеннях 1 і 0, застосовується коефіцієнт <р Пірсона:
Я>= І, (5.32)
JpX ■ PY ■ (N - PX ) o (N - PY )
Де: PXy - число об'єктів, що мають "1" і з X, і з Y; PX і pY - число об'єктів, що мають "1" з XІ з YВідповідно; n - загальна кількість об'єктів.
Приклад 5.23. Оцінити зв'язаність між захопленістю учнів спортом та їхньою схильністю до математики. У таблиці рис. 5.50 позначення для X і Y: 1 - наявність ознаки, 0 - її відсутність.
Послідовність рішення:
O Розрахунки коефіцієнта <р проводимо за допомогою таких виразів:
- у комірку В15 внести вираз =СЧЕТ(В3:В14);
- у комірку В16 - вираз =СУММЕСЛИ(В3:В14;"=1";С3:С14);
- у комірку В17 - вираз =СУММ(В3:В14);
- у комірку В18 - вираз =СУММ(С3:С14);
- у комірку В19 - вираз =(В15*В16-В17*В18)/КОРЕНЬ(В17*В18*(В15-В17)*(В15-В18)). Звичайні арифметичні розрахунки дають аналогічний результат коефіцієнта кореляції <р Пірсона длярХу = 5,рХ = 6, рУ = 7 і п = 12:
12o5 - 6 o 7 У> = ~ 0,51.
Д/6 o 7 o (12 - 6) o (12 - 7)
O Оцінка значущості коефіцієнта кореляції ^. Якщо прийняти, що вибірковий розподіл коефіцієнта ер приблизно описується нормальним законом з нульовим середнім і одиничним стандартним відхиленням, перевірка нуль-гіпотези виконується за допомогою г-критерію: гЕмп = д) -4п.
Внести у комірку В20 вираз =В19*КОРЕНЬ(В15) і отримати 2Емп:
ІЕяп = 0,51 -712 * 1,76.
Рис. 5.50. Розрахунки коефіцієнта кореляції <р
O Критичне значення г-критерію для а=0,05 розташоване нижче гО/2 стандартного нормального розподілу (0,025 або 0,975). У комірку В21 внести функцію =НОРМСТОБР(1-0,05/2), яка поверне значення гКр ~ 1,96.
Висновки: оскільки гЕм"<іКр (1,76<1,96), на рівні значущості 0,05 нульова гіпотеза Н0 приймається. Отже, значення коефіцієнта Ер ~ 0,51 не може свідчити про існування зв'язку між захопленістю спортом учнів і проявом схильності до математики.
Точково-бісеріальний коефіцієнт кореляції rpb
Точково-бісеріальний коефіцієнт кореляції гРЬ використовується для емпіричних даних, значення яких отримано за різними шкалами вимірювань, наприклад, якщо змінна X вимірюється за дихотомічною шкалою, а змінна У - у шкалі інтервалів або відносин:
_ У1 - У 0 І п1 ■ п0 ГРь - Лі : тг, (5.33)
*у п ■ (п -1)
Де У1 і п1- середнє і кількість У об'єктів, що мають 1 з X; У0 і п0 - середнє і кількість У об'єктів, що мають 0 з X; яУ - стандартне відхилення всіх П значень У; П = п1 + п0 . Приклад 5.24. Оцінити зв'язок між показниками "стать" і "зріст" рис. 5.51 для 15 підлітків (x = 1 для чоловічої, x = 0 для жіночої статі). Послідовність рішення:
O Розрахунки коефіцієнта кореляції гРЬ :
- у комірку Е3 внести =СЧЕТ(Л3:Л12) і отримати п = 10;
- у комірку Е4 внести =СУММ(В3:В12) і отримати п1=6;
- у комірку Е5 внести =Е3-Е4 і отримати п0=4;
- у комірку Е6 внести =СУММЕСЛИ(В3:В12;1;С3:С12)/Е4 і отримати середній зріст хлопчиків У1 "167,83 см;
- у комірку Е7 внести =СУММЕСЛРІ(В3:В12;0;С3:С12)/Е5 і отримати середній зріст дівчат У0 ~ 154 см;
- у комірку Е8 внести =СТАНДОТКЛОН(С3:Є12) і отримати стандартне відхилення 5У= 11,35;
- у комірку Е9 внести вираз для розрахунку точково-бісеріального коефіцієнта =(Е6-Е7)ІЕ8*КОРЕНЬ(Е4*Е5ІЕ3І(Е3-1)) і отримати його значення:
= 167,83-154 Р^ Т 0,63
РЬ 11,35 10 o (10-1) ■
На рис. 5.51 представлено результати розрахунку точково-бісеріального коефіцієнта кореляції г"Ь, на рис. 5.52 - відповідні розрахункові формули.
O Оцінка значущості коефіцієнта кореляції гРЬ зводиться до перевірки нуль-гіпотези (Н0: гРЬ = 0) , для якої використовується статистика г-критерій Стьюдента з (п-2) ступенями вільності:
Г = , І* . (5.34)
^/(1 - гД )І(п - 2) ' '
Для розрахунку гЕля у комірку Е10 внести =Е9ІКОРЕНЬ((1-Е9Л2)І(Е3-2)) і отримати значення гЕля ~ 2,29.
O Критичне значення г-критерію можна отримати за допомогою функції =СТЬЮДРАСПОБР(<хІ2; п-2). При а =0,05 і п=10 у комірку В256 внести функцію =СТЬЮДРАСПОБР(0,05І2;Е3-2), яка дає значення г", = 2,75.
O Висновки: оскільки отримане значення ЇЕмп -2,29 не перевищує критичне значення ^-2,75 нуль-гіпотеза про відсутність кореляції приймається. Отже, з імовірністю 95% (а=0,05) правдоподібно, що у цій ситуації коефіцієнт кореляції гРЬ, який приймає доволі суттєве значення (0,63), не є вірогідним!
Запитання. Завдання.
1. Охарактеризуйте особливості застосування, розрахунку і перевірки значущості коефіцієнта лінійної кореляції Пірсона.
2. Охарактеризуйте особливості застосування, розрахунку і перевірки значущості коефіцієнта рангової кореляції Спірмена.
3. Охарактеризуйте особливості застосування, розрахунку і перевірки значущості дихотомічного коефіцієнта кореляції Пірсона ^.
4. Охарактеризуйте особливості застосування, розрахунку і перевірки значущості точково-бісеріального коефіцієнта кореляції.
6. Повторіть математичні процедури завдань за прикладами 5.21 - 5.24.
7. Виконайте лабораторні роботи № 20 - № 22.
Схожі статті
-
Математична статистика - Руденко В. М. - Дихотомічний коефіцієнт кореляції Пірсона φ
Для визначення тісноти зв'язку ознак X і Y, які оцінюються у двох значеннях 1 і 0, застосовується коефіцієнт Я>= І, (5.32) JpX ■ PY ■ (N - PX ) o (N - PY...
-
Математична статистика - Руденко В. М. - Коефіцієнт лінійної кореляції Персона rху
Коефіцієнти кореляції як міри зв'язку між випадковими величинами є також величинами випадковими, носять імовірнісний характер. Статистичні висновки про...
-
Математична статистика - Руденко В. М. - Коефіцієнт рангової кореляції Спірмена rs
Коефіцієнти кореляції як міри зв'язку між випадковими величинами є також величинами випадковими, носять імовірнісний характер. Статистичні висновки про...
-
Математична статистика - Руденко В. М. - 5.6. ПЕРЕВІРКА ЗНАЧУЩОСТІ КОЕФІЦІЄНТІВ КОРЕЛЯЦІЇ
Коефіцієнти кореляції як міри зв'язку між випадковими величинами є також величинами випадковими, носять імовірнісний характер. Статистичні висновки про...
-
Математична статистика - Руденко В. М. - Коефіцієнти взаємної зв'язаності
Приклад 2.8. Оцінити зв'язок між віком (змінна X) і результатами допоміжного тесту "цифра-знак" шкали інтелекту дорослих Векслера (змінна Y)....
-
Математична статистика - Руденко В. М. - Нелінійна кореляція
Приклад 2.8. Оцінити зв'язок між віком (змінна X) і результатами допоміжного тесту "цифра-знак" шкали інтелекту дорослих Векслера (змінна Y)....
-
Математична статистика - Руденко В. М. - Критерій Шапіро-Вілка W
Критерій х засновано на порівнянні емпіричної гістограми розподілу випадкової величини з її теоретичною щільністю. Діапазон виміряних емпіричних даних...
-
Математична статистика - Руденко В. М. - Критерій згоди х2
Критерій х засновано на порівнянні емпіричної гістограми розподілу випадкової величини з її теоретичною щільністю. Діапазон виміряних емпіричних даних...
-
Математична статистика - Руденко В. М. - Множинна регресія
Статистичні зв'язки між змінними досліджуються не лише методами кореляційного, а й регресійного аналізу, які доповнюють один одного. Основне завдання...
-
Математична статистика - Руденко В. М. - Одномірна лінійна регресія
Статистичні зв'язки між змінними досліджуються не лише методами кореляційного, а й регресійного аналізу, які доповнюють один одного. Основне завдання...
-
Математична статистика - Руденко В. М. - 2.4. РЕГРЕСІЯ
Статистичні зв'язки між змінними досліджуються не лише методами кореляційного, а й регресійного аналізу, які доповнюють один одного. Основне завдання...
-
Математична статистика - Руденко В. М. - Розподіли "хі-квадрат", Стьюдента і Фішера
При побудові статистичних моделей нормальному законові безумовно належить центральне місце. Проте намагання використовувати його для моделювання...
-
Математична статистика - Руденко В. М. - 2.3. КОРЕЛЯЦІЙНИЙ АНАЛІЗ
Завданням описової статистики є не лише систематизація емпіричних даних у вигляді розподілу частот та розрахунки типових показників МЦТ і варіацій ознак...
-
Математична статистика - Руденко В. М. - Лінійна кореляція
Завданням описової статистики є не лише систематизація емпіричних даних у вигляді розподілу частот та розрахунки типових показників МЦТ і варіацій ознак...
-
Математична статистика - Руденко В. М. - Сутність кореляції
Завданням описової статистики є не лише систематизація емпіричних даних у вигляді розподілу частот та розрахунки типових показників МЦТ і варіацій ознак...
-
Математична статистика - Руденко В. М. - Згруповані розподіли
Розподіли згрупованих частот Використовуються у разі інтервальних або відносних типів вимірювань, якщо емпіричні дані приймають будь-які дійсні значення...
-
Математична статистика - Руденко В. М. - Метод найменших квадратів
В основі застосування методу найменших квадратів покладено умову Мінімізації суми квадратів відхилень вибіркових даних від тих, що визначаються оцінкою....
-
Математична статистика - Руденко В. М. - Ранжировані розподіли
Атрибутивні розподіли Використовуються у разі Номінальних (категоріальних) типів вимірювань властивостей досліджуваних об'єктів. Приклад 2.5. Розрахувати...
-
Математична статистика - Руденко В. М. - Критерій Крамера-Велча T
Критерій Крамера-Велча Т побудований на підході оцінювання рівності математичних очікувань генеральних сукупностей, звідки взято вибірки. Статистика...
-
Математична статистика - Руденко В. М. - Значущість дисперсії (критерій х2)
Критерій Стьюдента t використовується для перевірки гіпотез про чисельне значення середнього параметра з нормальним законом розподілу, коли дисперсія...
-
Математична статистика - Руденко В. М. - 5.5. ВИЯВЛЕННЯ ВІДМІННОСТЕЙ І ЗСУВУ У РІВНІ ОЗНАКИ
Виявлення відмінностей між двома, трьома і більше чинниками застосовується при оцінці вірогідності впливу тієї чи іншої методики навчання, тренінгу,...
-
Математична статистика - Руденко В. М. - Критерій тенденцій Пейджа L
Критерій тенденцій Пейджа L застосовується для зіставлення показників, вимірюваних у трьох і більш умовах на одній і тій же вибірці випробовуваних....
-
Математична статистика - Руденко В. М. - Критерій Крускала-Волліса H
Виявлення відмінностей між двома, трьома і більше чинниками застосовується при оцінці вірогідності впливу тієї чи іншої методики навчання, тренінгу,...
-
Процедури перевірки гіпотез про рівність середніх для двох незалежних (незв'язаних) вибірок на основі критерію Стьюдента І продемонстровано у розділі...
-
Процедури перевірки гіпотез про рівність середніх для двох незалежних (незв'язаних) вибірок на основі критерію Стьюдента І продемонстровано у розділі...
-
Математична статистика - Руденко В. М. - Значущість середнього (критерій t, дисперсія невідома)
Критерій Стьюдента t використовується для перевірки гіпотез про чисельне значення середнього параметра з нормальним законом розподілу, коли дисперсія...
-
Математична статистика - Руденко В. М. - Значущість середнього (критерій Z, дисперсія відома)
Гіпотези про чисельні значення параметрів зустрічаються тоді, коли необхідно переконатися, що параметри центральних тенденції або мінливості відповідають...
-
Математична статистика - Руденко В. М. - 5.4. ПЕРЕВІРКА ГІПОТЕЗ ПРО ЧИСЕЛЬНІ ЗНАЧЕННЯ ПАРАМЕТРІВ
Гіпотези про чисельні значення параметрів зустрічаються тоді, коли необхідно переконатися, що параметри центральних тенденції або мінливості відповідають...
-
Математична статистика - Руденко В. М. - Критерій Вілкоксона-Манна-Вітні U
Статистика критерію Вілкоксона-Манна-Вітні25 И визначається у такий спосіб. Всі Х-елементи першої і 7-елементи другої вибірки об'єднуються. Об'єднана...
-
Математична статистика - Руденко В. М. - Критерій Колмогорова-Смірнова λ
Критерій Крамера-Велча Т побудований на підході оцінювання рівності математичних очікувань генеральних сукупностей, звідки взято вибірки. Статистика...
Математична статистика - Руденко В. М. - Точково-бісеріальний коефіцієнт кореляції rpb