Задачи регрессионного анализа. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Задачи регрессионного анализа.



Раздел корреляционно-регрессионного метода, посвященный определению и

оценке уравнения связи между признаками, называется регрессионным анализом.

Найти в каждом конкретном случае тип функции, с помощью которой можно наиболее адекватно отразить ту или иную зависимость между признаками х и у, — одна из основных задач регрессионного анализа.

 Подбор уравнения регрессии представляет собой математическое описание изменения взаимно коррелируемых величин по эмпирическим (фактическим) данным. Уравнение регрессии должно определить, каким будет среднее значение результативного признака у при том или ином значении факторного признака х, если остальные факторы, влияющие на у и не связанные с х, не учитывать, т.е. абстрагироваться от них. Другими словами, уравнение регрессии можно рассматривать как вероятностную гипотетическую функциональную связь величины результативного признака у со значениями факторного признака х. Уравнение регрессии можно также назвать теоретической линией регрессии. Рассчитанные по уравнению регрессии значения результативного признака называются теоретическими. Они обычно обозначаются  или   (читается: «игрек, выравненный по х») и рассматриваются как функция от х, т.е. = f(x).

Выбор теоретической линии регрессии часто обусловлен формой эмпирической линии регрессии; теоретическая линия как бы сглаживает изломы эмпирической линии регрессии. Кроме того, необходимо учитывать природу изучаемых показателей и специфику их взаимосвязей.

Обычно зависимость, выражаемую уравнением прямой, называют линейной (или прямолинейной), а все остальные — криволинейными зависимостями.

Для построения уравнения связи используют графический способ или метод наименьших квадратов (МНК).

Графический способ включает следующие этапы:

  • построить поле корреляции;
  •  на основе визуальной оценки расположения точек на поле координат провести

линию, наиболее точно отражающую тенденцию распределения точек;

Выбрав тип функции, по эмпирическим данным определяют параметры уравнения. При этом отыскиваемые параметры должны быть такими, при которых рассчитанные по уравнению теоретические значения результативного признака   были бы максимально близки к эмпирическим данным.

Существует несколько методов нахождения параметров уравнения регрессии. Наиболее часто используется метод наименьших квадратов (МНК). Его суть заключается в следующем требовании: искомые теоретические значения результативного признака   должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических значений, т.е. .

В соответствии с этим условием в случае линейной зависимости получаем систему уравнений:                , из которой находим параметры

 и   линейной корреляционной зависимости.

Параметр a1 в уравнении линейной регрессии называется коэффициентом регрессии, он показывает на сколько изменяется значение результативного признака y при изменении факторного признака x на единицу.

Далее необходимо оценить существенность коэффициента регрессии и уравнения связи, для чего определяют среднюю ошибку параметров уравнения регрессии и сравнивают их с этой ошибкой.

Расчет ошибок параметров уравнения регрессии основан на использовании остаточной дисперсии, характеризующей расхождение (отклонение) между эмпирическими и теоретическими значениями результативного признака. Для линейного уравнения регрессии () средние ошибки параметров  и   определяются соответственно по формулам: ,      , .        

Значимость параметров проверяется путем сопоставления его значения со средней ошибкой. Обозначим это соотношение как t: , (12.20)

При большом числе наблюдений (n >30) параметр ai считается значимым, если >3.

Если выборка малая (n <30), то значимость параметра ai проверяется путем сравнения с табличным значения t -критерия Стьюдента при числе степеней свободы ν = n -2 и заданном уровне значимости α. Если рассчитанное по формуле (12.20) значение больше табличного, то параметр считается значимым.

Наряду с проверкой значимости отдельных параметров осуществляется проверка значимости уравнения регрессии в целом или, что то же самое, проверка адекватности модели с помощью критерия Фишера.

На основе уравнения регрессии можно найтикоэффициент эластичности, показывающий, на сколько процентов изменяется в среднем результативный признак y при изменении факторного признака x на 1%.: , (12.21)

где  – первая производная уравнения регрессии y по x.

Коэффициент эластичности – величина переменная, т.е. изменяется с изменением значений фактора x. Так, для линейной зависимости :

. (12.22.)

ГЛОССАРИЙ

Корреляционная решетка – это аналитическая группировка единиц совокупности по двум признакам, между которыми оценивается связь.

Корреляционная связь имеет место между двумя признаками, если с изменением

значений одного признака закономерным образом изменяется среднее значение другого признака.

Обратная связь имеет место между двумя признаками, если с увеличением значений

одного признака значения другого признака уменьшаются, или с уменьшением значений одного признака значения другого признака увеличиваются

Поле корреляции – это графическое отображение связи между переменными, это

множество точек, координатами которых являются пары значений признаков по всем

единицам совокупности. Анализируя график, расположение и концентрацию точек на координатном поле, можно сделать предположение о наличии, направлении и тесноте связи между признаками

Прямая связь имеет место между двумя признаками, если с увеличением значений одного признака увеличиваются значения и другого признака, или с уменьшением значений одного признака уменьшаются значения и другого признака



Поделиться:


Последнее изменение этой страницы: 2021-12-15; просмотров: 87; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.12.161.161 (0.007 с.)