Понятие статистических гипотез, этапы проверки. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Понятие статистических гипотез, этапы проверки.



Статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Обозначается гипотеза буквой Н от латинского слова hypothesis. Так, может быть выдвинута гипотеза о том, что средняя в генеральной совокупности равна некоторой величине Н: μ = а, или о том, что генеральная средняя больше некоторой величины Н: μ > b.

Различают простые и сложные гипотезы. Гипотеза называется простой, если она однозначно характеризует параметр распределения случайной величины. Например, Н: ц = а.'Сложная гипотеза состоит из конечного или бесконечного числа простых гипотез, при этом указывается некоторая область вероятных значений параметра. Например, Н: μ > b. Эта гипотеза состоит из множества простых гипотез Н:μ = с, где с — любое число, большее b.

Гипотезы о параметрах генеральной совокупности называются параметрическими, о распределениях непараметрическими.

Гипотеза о том, что две совокупности, сравниваемые по одному или нескольким признакам, не отличаются, называется нулевой гипотезой (или нуль-гипотезой). Она обозначается Н0. При этом предполагается, что действительное различие сравниваемых величин равно нулю, а выявленное по данным отличие от нуля носит случайный характер. Например, Н0: μ1 = μ2. Нулевая гипотеза отвергается тогда, когда по выборке получается результат, который при истинности выдвинутой нулевой гипотезы маловероятен. Границей невозможного или маловероятного обычно считают α = 0,05, т.е. 5\%, или 0,01, 0,001. Если ориентироваться на правило «трех сигм», то вероятность ошибки α должна быть.равна 0,0027. Однако для этого уровня вероятности ошибки значения критериев редко табулируются: как правило, значения критериев в статистико-математических таблицах рассчитаны для вероятностей ошибки 0,05; 0,01; 0,001.

Статистическим критерием называют определенное правило, устанавливающее условия, при которых проверяемую нулевую гипотезу следует либо отклонить, либо не отклонить. Критерий проверки статистической гипотезы определяет, противоречит ли выдвинутая гипотеза фактическим данным или нет.

Проверка статистических гипотез складывается из следующих этапов:

• формулируется в виде статистической гипотезы задача исследования;

• выбирается статистическая характеристика гипотезы;

• выбираются испытуемая и альтернативная гипотезы на основе анализа возможных ошибочных решений и их последствий;

• определяются область допустимых значений, критическая область, а также критическое значение статистического критерия (t, F, χ2) по соответствующей таблице;

• вычисляется фактическое значение статистического критерия;

• проверяется испытуемая гипотеза на основе сравнения фактического и критического значений критерия, и в зависимости от результатов проверки гипотеза либо отклоняется, либо не отклоняется.

При проверке гипотез по одному из критериев возможны два ошибочных решения:

1) неправильное отклонение нулевой гипотезы: ошибка 1-го рода;

2) неправильное принятие нулевой гипотезы: ошибка 2-го рода. В то время, как фактически нулевая гипотеза верна (1) и нулевая гипотеза не верна (2), принимают два ошибочных решения: 1) нулевая гипотеза отклоняется и принимается альтернативная гипотеза; 2) нулевая гипотеза не отклоняется.

 

Содержание дисперсионного анализа.

Дисперсия в статистике находится как среднее квадратическое отклонение индивидуальных значений признака в квадрате от средней арифметической. В зависимости от исходных данных она определяется по формулам простой и взвешенной дисперсий:

 

1. Простая дисперсия (для несгруппированных данных) вычисляется по формуле:

2. Взвешенная дисперсия (для вариационного ряда):

где n - частота (повторяемость фактора Х)

Свойство 1. Дисперсия постоянной величины равна нулю.

Свойство 2. Уменьшение всех значений признака на одну и ту же величину A не меняет величины дисперсии . Значит, средний квадрат отклонений можно вычислить не по заданным значениям признака, а по отклонениям их от какого-либо постоянного числа.

Свойство 3. Уменьшение всех значений признака в K раз уменьшает дисперсию в K2 раз, а среднее квадратическое отклонение в K раз . Значит, все значения признака можно разделить на какое-то постоянное число, например, на величину интервала ряда, исчислить среднее квадратическое отклонение, а затем умножить его на постоянное число: .

Свойство 4. Если вычислить средний квадрат отклонений от любой величины A, в той или иной степени отличающейся от средней арифметической (), то он всегда будет больше среднего квадрата отклонений, вычисленного от средней арифметической . Средний квадрат отклонений при этом будет больше на величину (– A)2: .

Значит, дисперсия от средней величины всегда меньше дисперсий, вычисленных от любых других величин, т.е. она имеет свойство минимальности.

На этих математических свойствах дисперсии основываются способы, которые позволяют упростить ее вычисление. Например, расчет дисперсии по способу моментов или способу отсчета от условного нуля применяется в вариационных рядах с равными интервалами. Расчет производится по формуле: ,

где K – ширина интервала;

A – условный нуль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой;

– момент второго порядка.

Правило сложения дисперсии заключается в том, что общая дисперсия равна сумме межгрупповой и средней из внутригрупповых дисперсий

, где — межгрупповая дисперсия; — средняя из внутригрупповых дисперсия.

 

Содержание корреляционно регрессивного анализа, виды моделей.

Корреляционно-регрессионный анализ позволяет установить тесноту, направление и форму связи, т.е. ее аналитическое выражение

Этапы корреляционно-регрессионного анализа

1. Качественный анализ сущности изучаемого явления методами экономической теории, экономики отрасли, социологии.

2. Постановка задачи и выбор факторных и результативных признаков;

3. Сбор статистического материала, его контроль;

4. Установление аналитической формы связи, расчет параметров уравнения связи и других количественных характеристик;

5. Решение уравнения регрессии, расчет теоретически ожидаемых значений результативного признака;

6. Определение и сравнительный анализ дисперсий: общей, факторной и остаточной; оценка тесноты связи между признаками, включенными в модель;

 

7. Оценка статистической надежности выборочных показателей связи; отсев несущественных (или включение дополнительных) факторов, построение новой модели (т.е. при необходимости, повторение п.1-6);

8. Статистическая оценка достоверности параметров уравнения регрессии, построение доверительных границ для теоретически ожидаемых по уравнению регрессии значений функции;

9. Практические выводы из анализа;

10. Оформление результатов анализа в виде схем, таблиц, графиков, написание аналитической записки.

Задачи корреляционно-регрессионного анализа и моделирования

1. Измерение параметров уравнения регрессии, выражающего связь средних значений зависимой переменной со значениями независимой переменной (зависимость средних величин результативного признака от значений одного или нескольких факторных признаков. Уравнение корреляционной связи измеряет зависимость между вариацией результативного признака и вариацией факторного признака.

2. Измерение тесноты связи двух (или большего числа) признаков между собой. Меры тесноты связи измеряют долю вариации результативного признака, которая связана корреляционно с вариацией факторного признака (признаков).

Нельзя трактовать корреляцию признаков как связь их уровней. Метод корреляционно-регрессионного анализа не может объяснять роли факторных признаков в создании результативного признака.

Задачи, имеющие не формально математический, а содержательный характер:

3. Выделение важнейших факторов, влияющих на вариацию результативного признака в совокупности.

4. Оценка хозяйственной деятельности по эффективности использования имеющихся факторов производства. Решается путем расчета для каждой единицы совокупности тех величин результативного признака, которые были бы получены при средней по совокупности эффективности использования факторов и сравнения их с фактическими результатами производства.

5. Прогнозирование возможных значений результативного признака при задаваемых значениях факторных признаков. Решается путем подстановки ожидаемых, или планируемых значений факторных признаков в уравнение связи и вычисление ожидаемых значений результативного признака.

6. подготовка данных, необходимых в качестве исходных для решения оптимизационных задач.

При решении каждой из названных задач нужно учитывать особенности и ограничения корреляционно-регрессионного метода. Всякий раз необходимо специально обосновать возможность причинной интерпретации уравнения как объясняющего связь между вариацией фактора и результата.

Любое эконометрическое исследование начинается со спецификации модели, т.е. с формулировки вида модели, исходя из соответствующей теории связи между переменными: из всего круга факторов, влияющих на результат, необходимо выделить наиболее существенно влияющие факторы; кроме того, необходимо знать, какие остальные факторы предполагают неизменными, поскольку возможно, в дальнейшем их придется учесть в модели и от простой регрессии перейти к множественной.

Двумерная корреляционная модель

Наиболее простой случай корреляционной зависимости: две нормально распределенные случайные величины. Двумерная линейная корреляционная модель характеризуется пятью параметрами – два математических ожидания, две дисперсии, парный линейный коэффициент корреляции.

Трехмерная корреляционная модель

На примре трехмерной генеральной совокупности достаточно четко просматриваются основные задачи и особенности многомерного корреляционного анализа. Для изучения многообразия взаимозависимости между переменными в модели используют три меры тесноты корреляционной связи – парный, частный, множественный коэффициенты корреляции.

 



Поделиться:


Последнее изменение этой страницы: 2016-12-29; просмотров: 748; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.189.22.136 (0.017 с.)