Табличный расчет коэффициента корреляции по Пирсону 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Табличный расчет коэффициента корреляции по Пирсону



№ п/п X Y X·X Y·Y X·Y
Сумма Σ x Σy Σ x·x Σ y·y Σ x·y

Величина коэффициента линейной корреляции находится в интервале: 1< r < + 1 и не может выходить за его пределы, т. е. равняться или превышать 1 по модулю. Интерпретация полученного коэффициента проводится на основе его фактического выражения по модулю полученного знака и уровня статистической значимости. Коэффициент корреляции, близкий к 1 по модулю, свидетельствует о высоком уровне связи между анализируемыми переменными, близкий к 0 – о низком уровне связи или ее отсутствии на данной выборке.

Знак корреляционной связи описывает характер зависимости. Положительный знак указывает на прямо пропорциональную зависимость, отрицательный – на обратно пропорциональную. То есть в первом случае с изменением одной переменной с определенной долей статистической вероятности можно говорить о последовательном изменении второй (согласованном росте или убывании), во втором случае с уменьшением одной переменной вторая увеличивается (и наоборот).

Заключительным этапом при расчете коэффициента корреляции является определение уровня статистической значимости полученной связи. С этой целью результаты вычислений по формуле (12) сопоставляются с табл. I в прил. 2. В данной таблице представлены критические значения коэффициентов корреляции по Пирсону для выборок от 4 до 1000 элементов (n).

Помимо установления связи между переменными, достаточно часто в психологических исследованиях ставится задача определения различий в выраженности какого-либо признака в связи с влиянием некоторых факторов. С этой целью применяется параметрический критерий t, иначе называемый критерий Стьюдента. Критерий Стьюдента был разработан английским химиком У. Госсетом в ходе работы на пивоваренном заводе Гиннеса. Поскольку по условиям контракта Госсет не имел права открытой публикации своих исследований, поэтому статьи по t-критерию были напечатаны в 1908 г. в журнале «Биометрика» под псевдонимом «Student». В отечественной литературе принято писать «Стьюдент»[18].

Простота вычисления t-критерия Стьюдента, а также его наличие в большинстве статистических пакетов и программ привели к широкому использованию этого критерия даже в тех условиях, когда применять его нельзя. Рассмотрим более подробно особенности использования статистического t-критерия Стьюдента.

Наиболее часто t-критерий используется в двух случаях. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная и опытная группы, состоящие из разных лиц, их количество в группах может быть различно. Во втором же случае используется так называемый парный t-критерий, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних. Поэтому эти выборки называют зависимыми, связанными. Например, психологические свойства одних и тех же лиц до и после психологического тренинга. В обоих случаях должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп.

Следующее требование, которое должно выполняться, – это равенство дисперсий в сравниваемых группах. Чем больше различаются между собой дисперсии и объемы выборок, тем сильнее отличается распределение «вычисляемого t-критерия» от распределения истинного «t-критерия Стьюдента». При этом различную величину имеют и сам t-критерий, и такой параметр этих распределений, как число степеней свободы. В свою очередь, число степеней свободы сказывается на величине достигнутого уровня значимости
(р <...), определяемого для вычисленной величины t-критерия. Во многих статистических пакетах величина t-критерия вычисляется для двух случаев: 1) дисперсии равны, 2) дисперсии не равны. При этом предполагается, что в обоих случаях требование нормальности распределения выполняется.

Таким образом, для применения t-критерия Стьюдента:

1. Данные должны быть представлены в шкале интервалов либо отношений.

2. Сравниваемые выборки должны иметь распределение, близкое к нормальному.

3. Сравниваемые выборки должны иметь одинаковый размер.

Формула t-критерия имеет следующий вид:

для несвязанных выборок:

, (13)

и

, (14)

где

Х – среднее арифметическое для X;

Y – среднее арифметическое для Y;

Sd – сумма среднеквадратических отклонений X и Y.

Число степеней свободы вычисляется для неравных групп: k = n1 + n2 – 2, где n1 – выборка первой группы, n2 – второй; для равных по размеру групп:

k = 2 · n – 2, где n – объем выборки;

для связанных выборок:

0, (15)

где

(16)

и

(17)

Число степеней свободы вычисляется как k = n – 1, где n – объем выборки. t-критерий Стьюдента без применения пакета статистических программ может быть рассчитан «вручную». С этой целью необходимо заполнить табл. 9. Приведем пример для несвязанных выборок.

Таблица 9



Поделиться:


Последнее изменение этой страницы: 2021-04-12; просмотров: 82; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.224.215.188 (0.008 с.)