Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Построение линейного корреляционного уравнения

Поиск

Рассмотрим практический подход к построению линейного корреляционного уравнения (уравнения регрессии).

При большом числе наблюдений одно и то же значение х может встретиться nx раз, одно и то же значение у - nу раз, одна и та же пара чисел (х, у) может наблюдаться nху раз. Поэтому данные наблюдений группируют, то есть подсчитывают частоты nх, nу, nху. Все сгруппированные данные записывают в виде таблицы, которую называют корреляционной.

Поясним устройство корреляционной таблицы на примере.

 

Y X
        ny
0,4   -      
0,6 -        
0,8     - -  
nx         n = 60

 

В первой строке таблицы указаны наблюдаемые значения (10, 20, 30, 40) признака Х, а в первом столбце - наблюдаемые значения (0,4; 0,6; 0,8) признака Y. На пересечении строк и столбцов находятся частоты nxy наблюдаемых пар значений признаков. Например, частота 5 указывает, что пара чисел (10; 0,4) наблюдалась 5 раз. (Все частоты выделены жирным шрифтом. Прочерк означает, что соответствующая пара чисел, например (20; 0,4), не наблюдалась).

В последнем столбце записаны суммы частот строк.

Например, сумма частот первой строки широкого прямоугольника равна nу = 5 + 7 + 14 = 26; это число указывает, что значение признака Y, равное 0,4 (в сочетании с различными значениями Х), наблюдалось 26 раз.

В клетке, расположенной в нижнем правом углу таблицы, помещена сумма всех частот (общее число всех наблюдений n).

Очевидно .

0, .

Так как практически для удовлетворительной оценки искомых параметров должно быть проведено достаточно большое число наблюдений, причём среди полученных данных есть повторяющиеся, и они сгруппированы в виде корреляционной таблицы, то целесообразно, введя новую величину - выборочный коэффициент корреляции rв, написать уравнение прямой линии регрессии Y на Х (5) в виде

,

где - условная средняя, и - выборочные средние признаков X и Y, rв - выборочный коэффициент корреляции, причём

,

где sх, sу - выборочные средние квадратические отклонения;

х, у - варианты (наблюдаемые значения) признаков X и Y;

nху - частота пары вариант (х, у);

n - объем выборки (сумма всех частот).

Условным средним называют среднее арифметическое наблюдавшихся значений Y, соответствующих определенному значению X = x. Например, если при х = 2 величина Y приняла значения у1 = 5, у2 = 6, у3 = 10, то условное среднее .

Выборочный коэффициент корреляции rВ является оценкой коэффициента корреляции r генеральной совокупности и поэтому также служит для измерения линейной связи между величинами - количественными признаками Y и Х.

Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность (репрезентативна), то заключение о тесноте линейной зависимости между признаками, полученное по данным выборки, в известной степени может быть распространено и на генеральную совокупность.

Если данные наблюдений над признаками Х и Y заданы в виде корреляционной таблицы с равноотстоящими вариантами (h - const), то целесообразно перейти к условным вариантам

, ,

где С1 - ложный нуль вариант Х (новое начало отсчета), в качестве которой выгодно принять варианту, расположенную примерно в середине вариационного ряда (обычно в качестве ложного нуля принимают варианту, имеющую наибольшую частоту); h1 - шаг, то есть разность между двумя соседними вариантами Х; С2 - ложный нуль вариант Y; h2 - шаг вариант Y.

Формула для вычисления коэффициента корреляции принимает вид

,

причем, для вычисления слагаемого удобно составить расчетную таблицу (см. ниже).

Величины могут быть вычислены либо рассмотренным выше методом произведений (при большом числе данных), либо непосредственно по формулам.

, , , .

Зная эти величины, можно определить входящие в уравнение регрессии параметры по формулам

, , .

 

Пример. Найти выборочное уравнение прямой линии

(*)

регрессии Y на Х по данным корреляционной таблицы.

 

Y Х
          ny
      - - -  
  -     - -  
  - -        
  - -        
  - - -      
nx           n = 100

Решение. Составим корреляционную таблицу в условных вариантах, выбрав в качестве ложных нулей С1 = 30, С2 = 36.

Найдем

;

.

v u
-2 -1       nv
-2     - - -  
-1 -     - -  
  - -        
  - -        
  - - -      
nu           n = 100

 

Найдем вспомогательные величины

,

.

Найдем su и sv

,

.

Найдем , для чего составим расчетную таблицу (см. ниже).

Дадим некоторые пояснения к составлению расчетной таблицы.

1. Произведение частоты nuv на варианту u, то есть nuv×u записывают в правом верхнем углу клетки, содержащей значение частоты. Например, в правых верхних углах клеток первой строки записаны произведения: 4×(-2) = -8; 6×(-1) = -6.

2. Складывают все числа, помещенные в правых верхних углах клеток одной строки, и их сумму помещают в клетку этой же строки «столбца U».

Например, для первой строки

.

3. Наконец, умножают варианту v на U и полученное произведение записывают в соответствующую клетку «столбца v×U». Например, в первой строке таблицы v = -2; U = -14; следовательно,

.

v u
–2 –1       Snuvu = = U v·U
–2   –8   –6                
                –14  
–8   –12                  
–1       –8                
                –8  
    –8   –10              
                         
                 
                       
                         
                 
                       
                         
                   
                       
Snuvv = V –8 –20 –6       Sv·U = 82
u·V           Su·V = 82 контроль
                                 

 

4. Сложив все числа «столбца v×U», получают сумму , которая равна искомой сумме . Например, , следовательно, искомая сумма .

Для контроля аналогичные вычисления производят по столбцам:

- произведения nuv×v записывают в левый нижний угол клетки, содержащей значение частоты;

- все числа, помещенные в левых нижних углах одного столбца, складывают и их сумму помещают в «строку V»;

- наконец, умножают каждую варианту u на V и результаты записывают в клетках последней строки.

Сложив все числа последней строки, получают сумму , которая также равна искомой сумме .

Например, , следовательно, .

Найдем искомый выборочный коэффициент корреляции

.

Найдем шаги h1 и h2 (разность между любыми двумя соседними вариантами)

; .

Найдем , учитывая, что С1 = 30, С2 = 36,

;

.

Найдем sх и sу

;

.

Подставив найденные величины в соотношение (*), получим искомое уравнение прямой линии регрессии Y на Х

,

или окончательно

.


Контрольные задания

 

 



Поделиться:


Последнее изменение этой страницы: 2016-04-23; просмотров: 930; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.218.38.67 (0.008 с.)