Корреляционный анализ. Ранговая корреляция 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Корреляционный анализ. Ранговая корреляция



Весьма часто при проведении психологических исследований требуется установить зависимость изучаемой случайной величины от одной или нескольких других величин. Две случайные величины и могут быть связаны либо функциональной зависимостью (), либо статистической зависимостью, либо быть независимыми.

Статистической называют зависимость, при которой каждому значению одной случайной величины соответствует распределение другой величины.

Частным случаем статистической зависимости является корреляционная зависимость. Две случайные величины находятся в корреляционной зависимости, если каждому возможному значению любой из этих случайных величин соответствует определенной распределение вероятностей другой величины. Корреляционная зависимость характеризуется формой, теснотой и направлением взаимосвязи.

Изучением наличия связи между величинами, оценкой ее тесноты и направления занимается корреляционный анализ.

Количественной мерой тесноты и направления связи между величинами является коэффициент корреляции r.

 

Свойства коэффициента корреляции

 

1. .

2. Если и – независимые величины, то .

3. Если или , то между величинами существует функциональная зависимость.

4. Если , то связь между величинами практически отсутствует, если , то связь слабая, если , то связь существенная, если , то связь тесная (сильная).

5. Если , то связь прямая (увеличение одного из исследуемых признаков (факторного) ведет к увеличению другого (результативного)), если , то связь обратная (увеличение одного из исследуемых признаков (факторного) ведет к уменьшению другого (результативного)).

 

Для изучения тесноты линейной связи между двумя величинами, измеренными в метрических шкалах, применяется коэффициент корреляции Пирсона. Если даны значения n пар чисел , то коэффициент корреляции Пирсона находится по формуле:

 

.

 

Коэффициенты ранговой корреляции применяются при оценке степени взаимосвязи качественных признаков. Под качественным подразумевается признак, который невозможно измерить точно, но позволяющий сравнивать объекты между собой и, следовательно, располагать их в порядке возрастания или убывания качества. Такие признаки оцениваются во всевозможных опросниках в дихотомических или номинальных шкалах.

Допустим, что объекты генеральной совокупности обладают двумя качественными признаками.

Пусть выборка объема n содержит независимые объекты, которые обладают двумя качественными признаками А и В. Рассмотрим случай, когда все объекты имеют различное качество по обоим признакам.

Ранжированием называется расположение объектов по возрастанию (убыванию) признака. Ранг – номер объекта в упорядоченном списке.

Проранжируем объекты в порядке ухудшения качества по признаку А и присвоим им ранги ().

Далее расположим объекты в порядке убывания качества по признаку В и припишем каждому ранг ().

Получим две последовательности рангов:

 

по признаку А x 1 x 2 xn
по признаку В y 1 y 2 yn

 

Выборочный коэффициент ранговой корреляции Спирмена определяется следующим образом:

,

где – разность рангов.

Возможны следующие крайние случаи по признакам А и В:

1) x i= yi. В этом случае ухудшение качества по одному признаку влечет за собой ухудшение качества по другому признаку. Полная прямая зависимость.

2) x 1 = 1 и y 1 = n; x 2 = 2 и y 2 = n – 1…, т.е. ранги по признакам А и В противоположны. Ухудшение качества по одному признаку ведет к улучшению качества по другому признаку. Противоположная зависимость.

 

Пусть выборочный коэффициент корреляции оказался отличным от нуля. Так как выборка была отобрана случайно, то нельзя делать вывод, что коэффициент корреляции в генеральной совокупности тоже отличен от нуля. Возникает необходимость для заданного уровня значимости a проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции.

 


Проверка гипотезы о значимости

генерального коэффициента корреляции

 

1. Выдвинуть гипотезу : генеральный коэффициент корреляции (линейный Пирсона или ранговой Спирмена) равен нулю (незначимо отличается от нуля или незначим). Выдвинуть гипотезу : генеральный коэффициент корреляции (линейный Пирсона или ранговой Спирмена) не равен нулю (значимо отличается от нуля или значим).

2. Найти наблюдаемое значение t –критерия Стьюдента по формуле: .

3. Найти критическое значение по таблице критических точек распределения Стьюдента для уровня значимости a и числа степеней свободы .

4. Сделать вывод. Если , то нет оснований отвергать нулевую гипотезу. Если , то нулевую гипотезу следует отвергнуть.


 

 

Образец оформления задания 2

1. Пусть Х – результат тестирования 25 сотрудников учреждения по 8-балльной системе. Простой статистический ряд представлен в следующей таблице:

 

№ п/п Балл тестирования   № п/п Балл тестирования
1. 3,2   16. 5,3
2. 7,3   17. 5,8
3. 5,6   18. 5,8
4. 6,3   19. 4,3
5. 4,5   20. 5,0
6. 4,7   21. 5,3
7. 5,2   22. 5,9
8. 3,8   23. 4,3
9. 5,2   24. 5,1
10. 5,7   25. 5,4
11. 6,3      
12. 6,7      
13. 6,4      
14. 4,9      
15. 4,1      

2. Сгруппируем полученные данные. Построим интервальный вариационный ряд. Для этого:

 

1) Найдем ширину интервала по формуле Стерджесса , где —максимальная варианта (максимальное значение признака Х в простом статистическом ряду), —минимальная варианта, n — объем выборки.

Определим максимальную и минимальную варианты: , . Объем выборки .

Найдем ширину интервала:

 

 

В качестве ширины интервала можно взять .

2) Найдем левую границу первого интервала по формуле , тогда правая граница первого интервала имеет значение .

3) Строим последовательность интервалов до тех пор, пока не попадет в последний интервал группировки (6,7; 7,7], подсчитываем частоту каждого интервала (т.е. находим число единиц выборочной совокупности, имеющих значение признака Х из этого интервала). Получаем интервальный вариационный ряд, представленный в следующей таблице:

 

Интервал Частота
(2,7; 3,7]  
(3,7; 4,7]  
(4,7; 5,7]  
(5,7; 6,7]  
(6,7; 7,7]  
 

 

3. Построим гистограмму частот. На оси абсцисс откладываем отрезки, изображающие интервалы вариационного ряда (или середины этих интервалов), на этих отрезках, как на основаниях, строят прямоугольники с высотами, равными частотам соответствующих интервалов. В результате получается ступенчатая фигура из прямоугольников.

 

4. Для расчета числовых выборочных характеристик интервального вариационного ряда преобразуем его в дискретный ряд, заменив каждый интервал его серединой.

 

Интервал Середина интервала Частота
(2,7; 3,7] 3,2  
(3,7; 4,7] 4,2  
(4,7; 5,7] 5,2  
(5,7; 6,7] 6,2  
(6,7; 7,7] 7,2  
   

 

Вспомогательные вычисления для расчета и оформим в таблицу:

 

Интервал Середина интервала Частота
(2,7; 3,7] 3,2   3,2 –2    
(3,7; 4,7] 4,2   25,2 –1    
(4,7; 5,7] 5,2          
(5,7; 6,7] 6,2   43,4      
(6,7; 7,7] 7,2   7,2      
       

 

.

Таким образом, выборочная средняя показывает типичное значение балла тестирования сотрудников данной выборочной совокупности.

 

.

 

Выборочная дисперсия показывает среднее значение квадрата отклонения баллов сотрудников от среднего балла тестирования.

 

.

 

Выборочное среднее квадратическое отклонение показывает среднее отклонение баллов сотрудников от среднего балла тестирования.

 

5. Найдем точечные и интервальные оценки параметров генеральной совокупности.

 

1) Найдем точечные оценки.

;

, где – исправленная выборочная дисперсия;

, где – исправленное выборочное среднее квадратическое отклонение.

2) Найдем интервальную оценку для математического ожидания в случае повторной выборки объема .

 

.

 

Для и по следующей таблице найдем значение .

 

Соответствие некоторых значений вероятности g

и коэффициента доверия t

g 0,683 0,866 0,954 0,988 0,997 0,999
t   1,5   2,5   3,5

 

 

;

.

 

Итак, с доверительной вероятностью 0,95 неизвестный параметр генеральной совокупности заключен в интервале (4,864; 5,616).

 

6. Для уровня значимости проверим гипотезу о нормальном распределении признака Х в генеральной совокупности с помощью критерия согласия c2 Пирсона.

 

Первый этап проверки гипотезы. Сформулируем гипотезу : балл тестирования Х в генеральной совокупности распределен нормально с математическим ожиданием и средним квадратическим отклонением . Альтернативная гипотеза : балл тестирования Х в генеральной совокупности не распределен нормально.

Второй этап проверки гипотезы. Найдем наблюдаемое значение критерия . Для этого:

1) Найдем теоретические частоты . Расчет теоретических частот оформим в виде следующей таблицы. Первые два столбца берем из задания 4, остальные столбцы рассчитываем в соответствии с указанными формулами, где значения функции берутся из таблицы приложения 1, n – объем выборки, h – ширина интервала интервального вариационного ряда, – исправленное выборочное среднее квадратическое отклонение.

Отметим, что для выборки большого объема вместо исправленного выборочного среднего квадратического отклонения можно взять просто выборочное среднее квадратическое отклонение .

 

           
3,2   –2 –2,13 0,0413 1,10
4,2   –1 –1,06 0,2275 6,05
5,2       0,3989 10,61
6,2     1,06 0,2275 6,05
7,2     2,13 0,0413 1,10

 

2) Первые два столбца берем из предыдущей таблицы. Расчет наблюдаемого значения критерия оформим в виде новой таблицы.

 

         
  1,10 – 0,10 0,009683 0,008816
  6,05 – 0,05 0,002553 0,000422
  10,61 – 0,61 0,370933 0,034964
  6,05 0,95 0,90149 0,148993
  1,10 – 0,10 0,009683 0,008816
        0,202011

.

 

Третий этап проверки гипотезы. По таблице приложения 2 для числа степеней свободы (где k – количество интервалов в интервальном вариационном ряду) и уровня значимости найдем критическое значение критерия .

Четвертый этап проверки гипотезы. , поэтому гипотеза принимается на уровне значимости . Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.

 

 



Поделиться:


Последнее изменение этой страницы: 2016-12-30; просмотров: 281; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.90.205.166 (0.078 с.)