Критерии оценки качества модели регрессии 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Критерии оценки качества модели регрессии



 

Качество математической модели регрессии можно оценить по нескольким критериям.

Полученная математическая модель будет качественной в том случае, если между фактическими значениями результативного признака и соответствующими теоретическими значениями существует тесная зависимость, которую можно оценить с помощью коэффициента парной корреляции. Если значение коэффициента корреляции близко к единице, то качество модели высокое. Коэффициент парной корреляции определяется с помощью статистической функции КОРРЕЛ мастера функций. В диалоговом окне функции КОРРЕЛ в поле массив 1 вводится диапазон ячеек, занимаемых элементами массива результативного признака, а в поле массив 2 – диапазон ячеек, занимаемых расчетными значениями

Коэффициент множественной корреляции служит критерием оценки точности функции регрессии. Чем его значение ближе к единице, тем сильнее факторные признаки влияют на результативный признак.

Критериями оценки качества являются также отклонения и их дисперсия. Чем больше отклонения (остатки), тем хуже модель регрессии и тем меньше коэффициент парной корреляции.

Общая дисперсия (выборочная дисперсия) характеризует разброс наблюдаемых значений результативного признака около его среднего значения и определяется по формуле

(17)

где количество точек корреляционного поля, – число неизвестных параметров уравнения регрессии; - среднее значение результативного признака.

Общую дисперсию можно разложить на две составляющие

(18)

где - дисперсия, вызванная регрессией т.е. часть рассеивания значений результативного признака под влиянием факторного (факторных) признака (признаков); - остаточная дисперсия, т.е. часть рассеивания значений результативного признака, характеризуемая влиянием неучтенных факторных признаков. Чем меньше остаточная дисперсия, тем меньше влияние неучтенных факторных признаков и тем лучше математическая модель регрессии соответствует данным наблюдений, так как изменения результативного признака в этом случае в основном объясняется влиянием рассматриваемых факторных признаков.

Остаточная дисперсия определяется по формуле:

(19)

где .

В качестве показателя интенсивности связи используют коэффициент детерминации – это отношение

(20)

показывающее часть полного рассеивания значений результативного признака под влиянием рассматриваемых факторных признаков. Чем больше коэффициент детерминации, тем лучше выбранная модель регрессии соответствует данным наблюдений. Если коэффициент детерминации равен единице, то все данные наблюдений расположены на линии регрессии.

Важным критерием оценки качества полученной модели регрессии является оценка статистической значимости уравнения регрессии в целом и отдельных его параметров. Оценка статистической значимости уравнения регрессии в целом проводится с помощью – критерия Фишера, а оценка статистической значимости ее параметров проводится по – распределению Стьюдента.

Расчетное значение - критерия определяется по формуле:

(21)

где – коэффициент детерминации; – объем выборки; – количество факторных признаков линейной модели регрессии и количество параметров нелинейной модели регрессии, связанных с факторными признаками.

Критическое значение определяется с помощью статистической функции FРАСПОБР (обратное распределение Фишера) мастера функций по заданному уровню значимости и числу степеней свободы: Обычно принимают

Если , то с вероятностью 1-a гипотеза о несоответствии заложенных в уравнение регрессии связей реально существующим отвергается и уравнение в целом статистически значимо, т.е. имеется хорошее соответствие данным наблюдений.

Оценить статистическую значимость параметров модели регрессии означает установить, существенно ли влияет факторный признак в генеральной совокупности на результативный признак , т.е. может ли параметр модели регрессии принимать нулевое значение.

Расчетное значение - статистики определяется по формуле:

(22)

где – стандартное отклонение (стандартная ошибка) для параметра . Расчетные значения статистики и стандартные ошибки выдаются в выходной информации инструмента «Регрессия».

Стандартные ошибки параметров модели регрессии – это их среднеквадратические отклонения, т.е. квадратные корни из дисперсий соответствующих параметров уравнения регрессии.

Стандартные ошибки параметров модели парной линейной регрессии определяются по формулам:

¨ (23)

¨ (24)

где - соответственно е и среднее значения факторного признака.

Определяется критическое значение – статистики с помощью статистической функции СТЬЮДРАСПОБР мастера функций по уровню значимости и числу степеней свободы . Если , то нулевую гипотезу о равенстве нулю параметра модели регрессии отвергают и параметр считают статистически значимым. Иначе, нет причин отвергать нулевую гипотезу.

Примечание: Не учитывать статистическую значимость параметра при оценке качества линейной модели регрессии.

При оценке качества модели регрессии возможны следующие случаи:

¨ Уравнение регрессии на основе проверки по - критерию Фишера в целом статистически значимо и его параметры статистически значимы. Такая модель может быть использована для принятия решений и прогнозирования.

¨ Уравнение регрессии по критерию Фишера статистически значимо, но хотя бы один его параметр статистически незначим. В этом случае модель пригодна для принятия некоторых решений внутри выборки, но не для прогнозирования.

¨ Уравнение регрессии по критерию Фишера статистически незначимо. В этом случае модель регрессии считается ненадежной и непригодной для использования в практике.

 



Поделиться:


Последнее изменение этой страницы: 2016-08-15; просмотров: 546; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.129.249.141 (0.01 с.)