Кореляционно-регрессионный анализ 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Кореляционно-регрессионный анализ



 

Функциональная зависимость между двумя переменными величинами характеризуется тем, что каждому значению одной из них соответствует вполне определенное значение другой. Например, между радиусом круга r и его площадью S существует функциональная зависимость, которая выражается формулой . Однако, на практике часто встречаются и такие виды связей между величинами, которые нельзя отнести к функциональной зависимости. Корреляционная связь не является точной зависимостью одного признака от другого. Еще Гиппократ в 6 веке до нашей эры обратил внимание на наличие связи между телосложением и темпераментом людей, между строением тела и предрасположенностью к тем или иным заболеваниям. Масса тела, рост, пульс, ЧДД связаны с возрастом детей; изменение диуреза обусловлены изменениями клубочковой фильтрации и канальцевой реадбсорбции; пульс меняется при изменениях АД и температуры тела. К примеру, существует корреляционная связь между ростом и весом взрослых мужчин. Одному значению переменной Y(рост, см) соответствует множество значений переменной X(вес, кг), и, наоборот, мужчины с весом 75 кг могут быть самого разного роста. Тем не менее, в целом более высокие мужчины имеют больший вес.

Корреляционный анализ решает задачи обнаружения связей между варьирующими признаками и установления характера этих связей.

Корреляционная связь не является точной зависимостью одного признака от другого – она может иметь различную степень: от полной независимости до очень сильной связи. Кроме того, характер связи между признаками может быть различен по форме и направлению. По форме корреляции может быть прямолинейной и криволинейной, по направлению – прямой (или положительной) и обратной (или отрицательной). Степень корреляции определяется различными показателями, введенными для установления силы связи между количественными признаками. Такими показателями являются коэффициент парной корреляции rxy , корреляционное отношение , тетрахорический, полилихорический показатели связи, частный и множественный коэффициенты корреляции.

Коэффициент парной корреляции измеряет степень и определяет направление только прямолинейных связей. Коэффициент парной корреляции rxy есть безразмерная величина, значения которой принадлежат отрезку: .

При отрицательной корреляционной связи увеличение одной из переменных ведет к уменьшению другой. Соответствие между значениями rxy и характером связи может быть представлено следующей таблицей (шкала Чеддока):

Значение коэффициента парной корреляции, Связь
  Функциональная
>0,9 Очень сильная
0,7 – 0,9 Сильная (тесная)
0,5 – 0,7 Значительная (заметная)
0,3 – 0,5 Умеренная
<0,3 Слабая
  Отсутствует

 

Выборочный коэффициент парной корреляции rxy вычисляется по формуле: ,

здесь - выборочная средняя признака ;

- выборочная средняя признака ;

- среднее значение произведений и ;

- среднеквадратическое отклонение признака ;

- среднеквадратическое отклонение признака ;

- среднее значение квадрата признака ;

- среднее значение квадрата признака ;

- квадрат среднего значения признака ;

- квадрат среднего значения признака .

Достоверность значения выборочного коэффициента парной корреляции rxy проверяется следующим образом:

- вычисляют наблюдаемое значение критерия достоверности tнабл. по формуле: , здесь – объём выборки;

- находят стандартное значение критерия достоверности по таблицам значений коэффициентов Стьюдента (Приложение 4).;

- сравнивают tнабл. с t ст .

Если tнабл. > tсm, то при уровне значимости делают вывод о достоверности найденного значения rxy. В этом случае с (доверительной) вероятностью (или р) можно считать, что между коррелирующими признаками имеется связь и в генеральной совокупности такая же по характеру, какая получилась в выборке.

Если tнабл. tcm, то выборочный коэффициент корреляции недостоверен при уровне значимости , а, значит, у нас нет возможности сделать какое-либо заключение о связи признаков в генеральной совокупности. Для выяснения этого вопроса требуется провести повторные испытания на более многочисленном материале, т.е. увеличить объем выборки.

Помимо наличия связи, статистика позволяет найти уравнения, описывающие зависимость между признаками. Такая зависимость называется функцией регрессии или регрессией. При линейных связях функция регрессии имеет вид: Параметры уравнения определяются методом наименьших квадратов.

Уравнение регрессии:

на :

Уравнение регрессии позволяет прогнозировать возможные значения зависимых переменных, иначе, позволяет предсказывать поведение одного из параметров при целенаправленном изменении другого.

Пример решения задач:

Пример. В книге "Основы химии" Д.И. Менделеева приводятся данные о растворимости азотнокислого натрия в зависимости от температуры воды. В 100 частях воды растворяется следующее чис­ло условных частей () при соответствующих температурах () раствора:

                 
66,7 71,0 76,3 80,6 85,7 92,9 99,4 113,6 125,1

 

Требуется:

1) построить корреляционное поле;

2) предполагая, что данная зависимость между и близка к линейной, найти выборочный коэффициент корреляции ;

3) проверить достоверность найденного значения выборочного коэффициента корреляции при уровне значимости ;

4) найти уравнение регрессии на и построить линию регрессии на фоне корреляционного поля;

5) используя уравнение регрессии, найти, при какой температуре раствориться 100 условных частей и сколько условных частей растворится при .

Решение:

1) Построим корреляционное поле. Для этого на координатную плоскость нанесем точки

 

2)Для вычисления выборочного коэффициента парной корреляции используем формулу: .

Промежуточные вычисления выполним в таблице:

    66,7     4448,89
    71,0      
    76,3     5821,69
    80,6     6496,36
    85,7 1799,7   7344,49
    92,9 2694,1   8630,41
    99,4 3578,4   9880,36
    113,6 5793,6   12904,96
    125,1 8506,8   15650,01
  811,3 24628,6   76218,17

 

Вычисляем: ; ;

; ;

; ;

Далее получаем: ;

;

.

Вывод 1: Полученное значение выборочного коэффициента парной корреляции показывает согласно шкале Чеддока, что в выборочной совокупности между признаками (растворимостью ) и (температурой раствора) обнаружена сильная положительная связь.

3) Проверим достоверность найденного значения . Для этого:

– вычислим наблюдаемое значение критерия достоверности по формуле: ;

– найдем стандартное значение критерия достоверности по таблицам значений коэффициентов Стьюдента (Приложение 4): ;

– сравнение с показывает, что > .

Вывод 2: При уровне значимости можно утверждать, что и в генеральной совокупности между признаками и существует сильная положительная связь.

4) Найдем уравнения регрессии:

на вида ;

или

Построим линию регрессии (рекомендуется строить график на фоне корреляционного поля):

5)

a) Найдем, при какой температуре растворится 100 условных частей . Если получаем, что ;

b) Найдем, сколько условных частей растворится при температуре воды, равной . Если то получаем, что



Поделиться:


Последнее изменение этой страницы: 2016-12-29; просмотров: 419; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.226.187.24 (0.035 с.)