Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения



 

Процедура сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, которые определяются по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сравнения эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретических распределений.

Выбор конкретного типа теоретического распределения осуществляется на основе содержательного анализа ранее полученных статистических характеристик вариационного ряда, а также на визуальном анализе построенных графиков распределения. Для проверки статистической гипотезы о законе распределения наиболее универсальным является критерий χ2 – критерий Пирсона. Статистикой этого критерия является величина:

, (12)

где – число интервалов,

- эмпирические абсолютные частоты,

– абсолютные частоты теоретического распределения.

 

Для корректности применения критерия Пирсона необходимо, чтобы для всех интервалов. Если частота теоретического распределения, в каком либо интервале меньше, либо равна 5, то этот интервал объединяется с соседним интервалом.

Расчетное значение критерия Пирсона сравнивается с критическим для распределения хи-квадрат с степенями свободы, которое может быть вычислено в вероятностном калькуляторе. Здесь – число интервалов, – число параметров распределения. Если расчетное значение меньше критического, то принимается гипотеза о соответствии эмпирического распределения теоретическому.

Для ряда общей площади жилых помещений, приходящейся в среднем на одного жителя, проверим гипотезы о соответствии распределения нормальному и логнормальному распределениям. Предварительный анализ показал, что распределение, близко к нормальному, имеет незначительную отрицательную асимметрию. Логнормальное распределение имеет положительную асимметрию, поэтому оно, скорее всего, будет менее подходящим для анализируемого показателя.

На рисунке 14 приведены результаты расчета статистики критерия хи-квадрат для проверки гипотезы о соответствия распределения ряда общей площади жилых помещений, приходящейся в среднем на одного жителя, нормальному распределению.

 

Рис. 14. Результаты проверки гипотезы о соответствии распределения ряда общей площади жилых помещений, приходящейся в среднем на одного жителя, нормальному распределению с помощью критерия хи-квадрат

 

Статистика критерия составила 6,03. Сравним это число с критическим значением. Для этого в вероятностном калькуляторе вычислим критическое значение для хи-квадрат распределения с 4 степенями свободы и уровнем значимости : .

Так как 6,03<9,488, то гипотеза о соответствии эмпирического распределения регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, нормальному принимается, как и предполагалось ранее. На рисунке 15 представлена гистограмма для анализируемого ряда вместе с теоретическим нормальным распределением.

 

Рис. 15. Гистограмма и расчетная кривая нормального распределения для показателя общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г.

 

На рисунке 16 приведены результаты расчета статистики критерия хи-квадрат для проверки гипотезы о соответствия распределения ряда общей площади жилых помещений, приходящейся в среднем на одного жителя, логнормальному распределению.

 

Рис. 16. Результаты проверки гипотезы о соответствии распределения ряда общей площади жилых помещений, приходящейся в среднем на одного жителя, логнормальному распределению с помощью критерия хи-квадрат

 

Статистика критерия составила 9,78. Сравним это число с критическим значением. Для этого в вероятностном калькуляторе вычислим критическое значение для хи-квадрат распределения с 3 степенями свободы и уровнем значимости : . Так как 9,78>7,815, то гипотеза о соответствии эмпирического распределения регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, логнормальному отвергается. Если взять уровень значимости , то и гипотеза о соответствии эмпирического распределения регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, логнормальному принимается (9,78<11,345).

На рисунке 17 представлена гистограмма для анализируемого ряда вместе с теоретическим логнормальным распределением.

Рис. 17. Гистограмма и расчетная кривая логнормального распределения для показателя общей площади жилых помещений, приходящейся в среднем на одного жителя, в 2005 г.

 

Таким образом, распределение регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, достаточно хорошо аппроксимируется нормальным распределением, логнормальное распределение является менее подходящим для данного ряда.

Заключение

 

Статистический анализ ряда распределения регионов РФ по общей площади жилых помещений, приходящейся в среднем на одного жителя, позволил получить следующие результаты и выводы.

Исходная совокупность содержала один выброс (Чеченская Республика), который был удален из рассмотрения на первоначальном этапе.

Минимальное значение общей площади жилых помещений, приходящейся в среднем на одного жителя, составило 12,4 квадратных метра для республики Ингушетия, а максимальное – 27,9 квадратных метра для Чукотского автономного округа. Разница между максимальным и минимальным значением общей площади жилых помещений, приходящейся в среднем на одного жителя, в выборке равна 15,5 квадратных метров.

Половина регионов, представленных в выборке, имеют общую площадь жилых помещений, приходящуюся в среднем на одного жителя, меньше 21 квадратного метра, половина – выше этого значения. Общую площадь жилых помещений, приходящуюся в среднем на одного жителя, от 19,7 квадратных метра до 23,1 квадратных метра имеет 50% регионов, представленных в выборке. При этом у 25% регионов РФ значение общей площади жилых помещений, приходящейся в среднем на одного жителя, не превосходит 19,7 квадратных метра и у 25% регионов – выше 23,1 квадратных метра.

Модальным интервалом в таблице частот для общей площади жилых помещений, приходящейся в среднем на одного жителя, является интервал [19,06; 21,28), в который попал 31 регион, что составляет 39,24% всех регионов.

Среднее значение общей площади жилых помещений, приходящейся в среднем на одного жителя, по всем регионам составило 21,13 квадратных метра.

Стандартное отклонение показывает, что общая площадь жилых помещений, приходящаяся в среднем на одного жителя, для отдельных регионов в среднем отличается от среднего арифметического по совокупности на 2,68 квадратных метра.

Коэффициент вариации составил 12,7%, что меньше 30%, следовательно, совокупность можно считать достаточно однородной.

Асимметрия для показателя общей площади жилых помещений, приходящейся в среднем на одного жителя, составила -0,59, является отрицательной величиной, поэтому распределению характерна незначительная левосторонняя асимметрия.

Эксцесс для показателя общей площади жилых помещений, приходящейся в среднем на одного жителя, составил 1,7. Степень остроты пика распределения существенно отличается от степени остроты пика нормального распределения, поскольку значение эксцесса превосходят утроенную стандартизованную ошибку.

Предположения о нормальном законе распределения, выдвинутые на основе гистограммы, были проверены с помощью критерия Хи-квадрат Пирсона. Гипотеза о соответствии эмпирического распределения регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, нормальному принимается на уровне значимости 0,05.

Гипотеза о соответствии эмпирического распределения регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, логнормальному отвергается на уровне значимости 0,05, но принимается на уровне значимости 0,01.

Таким образом, распределение регионов по общей площади жилых помещений, приходящейся в среднем на одного жителя, достаточно хорошо аппроксимируется нормальным распределением, логнормальное распределение является менее подходящим для данного ряда.

 



Поделиться:


Последнее изменение этой страницы: 2016-12-30; просмотров: 377; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.117.227.194 (0.013 с.)