Визначення вірогідності вибірки при розрахунках коефіцієнта кореляції 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Визначення вірогідності вибірки при розрахунках коефіцієнта кореляції



 

Допустимі межі коефіцієнта кореляції (r) генеральної сукупності з достатньою ймовірністю визначають у такий спосіб.

1. На підставі числа випадків – n – знаходять величину  за формулою:

2.  Використовуючи таблицю «Значення коефіцієнта » і обчислений у вибірці коефіцієнт кореляції, знаходять величину z.

3. Приймаючи довірчу ймовірність по таблиці «Значення функції » визначають величину коефіцієнта t.

Зазвичай у практиці психологічних досліджень працюють з довірчими ймовірностями 0,95 і 0,99, для яких t дорівнює відповідно: .

4. Знаходять величину :

5. До величини коефіцієнта z (яка була знайдена по таблиці «Значення коефіцієнта » додають і віднімають :

 ;                     .

6. Використовуючи ту ж саму таблицю для значень коефіцієнта z, визначають за допомогою  нижню межу довірчого інтервалу, а за допомогою  - верхню його межу.

7. У цьому інтервалі з прийнятою довірчою ймовірністю знаходять коефіцієнт кореляції генеральної сукупності.

Приклад. За даними того ж дослідження (з психологічними показниками уваги і віком) зробити оцінку коефіцієнта кореляції з довірчою ймовірністю  при якій t = 1,96.

● Рішення.

1. ;

2. z = 1,3758 (з огляду на те, що r = -0,88);

3. t = 1,96;

4. ;

5. ;

6. ;

7. Використовуючи лінійну інтерполяцію по таблиці знаходимо (вираховуємо, якщо  і  не збігаються точно з табличними значеннями) верхню і нижню межу довірчого інтервалу:

а) ;

б) .

Висновки. З огляду на те, що в даному прикладі мала місце зворотна залежність, то у проведеному дослідженні з імовірністю  коефіцієнт кореляції генеральної сукупності, з якої взята вибірка, знаходиться в межах:

(-0,56) ≤ r ≤ (-0,97).

Варто звернути увагу, що нижня і верхня межа довірчого інтервалу розташовані несиметрично (на нерівних відстанях) щодо коефіцієнта кореляції.

Визначення необхідного числа спостережень при встановленні кореляційного зв'язку

Обсяг необхідної кількості досліджуваного матеріалу визначається за формулою:

 , де                          (29)

r – коефіцієнт кореляції;

- гранична помилка, яку вважає за можливе допустити дослідник, з урахуванням мети, де буде використаний r.

 

Англійський вчений В. Госсет (Стьюдент) досліджував розподіл математичне значення показника t для малих вибірок (до 30 членів) і встановив формулу щільності цього розподілу.

t – критерій використовується там, де потрібно оцінити вірогідність відмінностей у показниках варіативних рядів при малому числі спостережень.

Приклад. Середнє значення об’єму короткочасної пам’яті після фізичної роботи складає одиниць інформації, а після розумової роботи =3,75 одиниць інформації. Треба з'ясувати, чи закономірна різниця  одиниць інформації і чи дійсно розумова робота викликає більш помітне зниження пам’яті внаслідок втоми, ніж фізична праця?

Дані занесені в таблицю:

Вид занять, що викликали втому

Показники об’єму пам’яті

Фізична праця 6 5 7 4 8 3 8 5 5,75
Розумова праця 2 3 4 2 7 5 4 3 3,75

 = 8; 

v – окремі спостереження, варіанти

Для розрахунку ймовірності різниці показників користуються формулою:

 , де            (31)

 - середні значення в рядах показників;

v – окремі спостереження, варіанти;

n – кількість спостережень (вимірів).

● Рішення.

1. Робимо попередні розрахунки похідних індексів, що є у формулі:

;

;

 = 5,75; = 3,75; = 33,06; =14,06

 =8; = 8.

2. Підставляємо у формулу:

Висновки. Оцінюючи t за даними «Таблиці значень t – критерію Стьюдента», нескладно віднайти, що при  у графі під  стоїть величина 2,14. порівнюють табличне значення з фактично розрахованим і встановлюють, що фактичне є більше за теоретичне (табличне) за стовпчиком 0,05. Отже, з імовірністю помилки не більше ніж у 0,05 (5%) можна стверджувати вірогідність зниження пам’яті при втомлюванні від розумової праці більш вираженою, ніж при втомі, що наступає від фізичної праці (достатньо, щоб t (фактичне) було не менше, ніж 2,15, а в нашому випадку =2,25). Іншими словами,  >  при .

При поясненні та інтерпретації математично встановлену сутність (розраховану у такий спосіб) тлумачать і записують так: “... виявлено статистично значиме зниження пам’яті внаслідок перевантаження розумовою працею більш виражене, ніж те саме зниження мнестичних функцій при втомі від фізичної роботи (  < 0,05)”.

Але цього ми не можемо сказати стосовно більш високого критерію ймовірності  = 0,01 (1% помилки), бо у цій колонці з =14 стоїть теоретично розраховане число 2,98, яке є більшим за 2,25 (фактично нами розраховане).

Статистичний критерій (хі-квадрат)

 

 - це значення показника відповідності, яке застосовується там, де треба встановити ймовірність відповідності декількох відносних величин, пов'язаних між собою будь-якою ознакою, або там, де здійснюється перевірка припущення про наявність (відсутність) зв'язку між явищами (без виміру їх величин), звичайно, якщо такий зв'язок теоретично можливий. Саме тоді оцінка близькості двох розподілів може бути виявлена шляхом обчислення показника відповідності, що позначається .

Показник відповідності вказує на те, наскільки суттєва чи неістотна різниця між числами, зафіксованими у процесі статистичного дослідження і теоретично обчисленими («очікуваними») показниками на підставі припущення про відсутність зв'язку між досліджуваними явищами (на основі так званої нульової гіпотези). Його можна визначити, як критерій, що установлює відповідність між теоретичними й емпіричними частотами розподілу відповідних показників психодіагностичних вимірів.

Показник відповідності обчислюється за формулою:

 , де                         (32)

 - фактичні дані;

 - очікувані дані.

Якби , то  був би рівним нулю, а значить підтверджувалась би нульова гіпотеза про відсутність закономірного впливу досліджуваного фактора на отриману різницю в даних. Чим менше р відрізняється від , тим ближче величина  до 0 і, навпаки, при більшій відмінності між р і  буде більше, а значить і закономірність досліджуваного зв'язку більша.

Щоб установити істотність чи випадковість різниці , величину  знаходять по “Таблиці значень ”.

При порівнянні враховується число ступенів свободи , що визначається за формулою:

 , де                               (33)

s – число граф первинної таблиці (крім графи «разом»);

r – число рядків у таблиці (крім рядка «усього»).

Приклад. Проводиться кампанія проти паління. Дані про тих, що закурили і утрималися від паління (2 місяці) після проведеного курсу психотерапії наведені в таблиці.

  Закурило Не закурило Разом
Пройшли психотерапію 56 6759 6815
Курс не проходили 272 11396 11668
Усього 328 18155 18483

 

● Рішення.

1. Допустимо, що психотерапія не впливає на звичку палити. Тоді, звичайно, кількість курців і тих людей, які не палять повинна відповідати % паління всього обстеженого населення, тобто

 .

2. Виявилося, що серед тих, які закурили і:

· пройшли курс психотерапії  чол.;

· не проходили курсу          328-121=207 чол.

Які не закурили:

· серед учасників курсу психотерапії 6815-121=6694 чол.;

· серед не охвачених курсом терапії 11668-207=11461 чол.

3. Зведемо це все в таблицю:

 



Поделиться:


Последнее изменение этой страницы: 2021-12-15; просмотров: 78; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.223.106.100 (0.021 с.)