Определение точечных оценок параметров совместного распределения признаков. Формирование выборочной корреляционной матрицы 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Определение точечных оценок параметров совместного распределения признаков. Формирование выборочной корреляционной матрицы



Исходные данные

объект наблюдаемые признаки
X -средняя продолжительность жизни женщин Y -уровень рождаемости (число родившихся на 1000 жителей) Z -уровень смертности (число умерших на 1000 жителей)
Беларусь 76 13 11
Босния 78 14 6
Болгария 75 13 12
Хорватия 77 11 11
Чехия 77 13 11
Эстония 76 14 12
Грузия 76 16 9
Венгрия 76 12 12
Латвия 75 14 10
Литва 77 15 10
Польша 77 14 10
Румыния 75 14 10
Россия 74 13 11
Украина 75 12 13

I. Корреляционный анализ

Постановка задачи

Требуется на основании указанных в приведенной таблице статистических данных для n=14 стран, отобранных случайным образом, исследовать стохастическую зависимость между социальными показателями X, Y, Z, полагая, что их совместное распределение подчинено трехмерному нормальному закону.

К вопросам анализа относятся:

- оценка тесноты связи между произвольными двумя наблюдаемыми признаками при фиксировании или исключении влияния третьего признака;

- оценка тесноты связи каждого из рассматриваемых признаков с совокупностью остальных признаков;

- проверка значимости коэффициентов связи;

- интервальное оценивание коэффициентов связи.

- построение модели корреляционной зависимости между признаками.

Определение точечных оценок параметров совместного распределения признаков. Формирование выборочной корреляционной матрицы

Признаки X, Y, Z образуют трехмерную нормально распределенную генеральную совокупность, которая определяется девятью параметрами:

• тремя математическими ожиданиями MX, MY, MZ;

• тремя дисперсиями DX, DY, DZ;

• тремя парными коэффициентами корреляции ρxy; ρxz; ρyz.

Выборочные средние

Выборочные средние квадратические отклонения

Выборочные парные коэффициенты корреляции

Матрица выборочных парных коэффициентов корреляции

q3=
  0,108 -0,531
0,108   -0,545
-0,531 -0,545  

 

Исследование парных коэффициентов корреляции

Парный коэффициент корреляции численно характеризует тесноту связи между произвольными двумя признаками, выбранными из совокупности рассматриваемых показателей, на фоне влияния третьего показателя, введенного в корреляционный анализ.

Проверка значимости парных коэффициентов корреляции

(при уровне значимости применяемого статистического критерия α= 0,05)

Проверяемые гипотезы:

H0: ρxy=0 H0: ρxz=0 H0: ρyz=0

Наблюдаемые значения статистики критерия:

Нахождение tкр - граничного значения области отвержения гипотезы

Способы:

Ø или из статистической таблицы 2 (Значения функции , где случайная величина Т распределена по закону Стьюдента с числом степеней свободы, равным ν) на основании уравнения:

,

Ø или с помощью статистической функции Microsoft Excel СТЬЮДРАСПОБР (вероятность; степени_свободы):

tкр = СТЬЮДРАСПОБР (α; n-2 ).

В данном случае

tкр=2,1788.

Условие отвержения гипотезы
о незначимости коэффициента корреляции

.

Результаты проверки гипотез:

v гипотеза H0: ρxy=0 не отвергается, парный коэффициент корреляции между X и Y не значим;

v гипотеза H0: ρxz=0 не отвергается, парный коэффициент корреляции между X и Z не значим;

v гипотеза H0: ρyz=0 отвергается, парный коэффициент корреляции между Y и Z значим.

Вывод

Между признаками Y, Z существует значимая обратная умеренная корреляционная зависимость.

Вывод

Доверительный интервал для парного коэффициента корреляции ρyz не содержит нуля, что подтверждает значимость данного коэффициента.

Исследование частных коэффициентов корреляции

Частный коэффициент корреляции позволяет численно оценить тесноту связи между любыми двумя признаками из числа рассматриваемых показателей, исключая при анализе их зависимости (в случае трехмерной корреляционной модели) влияние на эту зависимость третьего показателя.

Выборочные частные коэффициенты корреляции

;

;

.

Условие отвержения гипотезы о незначимости частного коэффициента корреляции

Результаты проверки гипотез:

v гипотеза H0: ρxy/z =0 не отвергается, частный коэффициент корреляции между X и Y не значим;

v гипотеза H0: ρxz/y=0 отвергается, частный коэффициент корреляции между X и Z значим;

v гипотеза H0: ρyz/x=0 отвергается, частный коэффициент корреляции между Y и Z значим.

Вывод

Доверительные интервалы для частных коэффициентов корреляции ρxz/y, ρyz/x не содержат нуля, что дополнительно подтверждает значимость этих коэффициентов.

Общий вывод

Результаты выполненного корреляционного анализа показывают, что признак Z имеет статистически значимую умеренную связь как с двумерным массивом признаков X, Y, так и с каждым из этих признаков в отдельности, что дает основание для перехода ко второму этапу статистического исследования - построению регрессионной модели, т.е. выявлению той конкретной математической зависимости переменной Z от переменных X, Y, которой наилучшим, в определенном смысле этого слова, образом отвечают имеющиеся статистические данные.

II. Регрессионный анализ

Постановка задачи

Требуется по указанным выше статистическим данным n=14 стран произвести регрессионный анализ зависимости уровня смертности от средней продолжительность жизни женщин и уровня рождаемости.

Исходные данные

объект наблюдаемые признаки
X -средняя продолжительность жизни женщин Y -уровень рождаемости (число родившихся на 1000 жителей) Z -уровень смертности (число умерших на 1000 жителей)
Беларусь 76 13 11
Босния 78 14 6
Болгария 75 13 12
Хорватия 77 11 11
Чехия 77 13 11
Эстония 76 14 12
Грузия 76 16 9
Венгрия 76 12 12
Латвия 75 14 10
Литва 77 15 10
Польша 77 14 10
Румыния 75 14 10
Россия 74 13 11
Украина 75 12 13

I. Корреляционный анализ

Постановка задачи

Требуется на основании указанных в приведенной таблице статистических данных для n=14 стран, отобранных случайным образом, исследовать стохастическую зависимость между социальными показателями X, Y, Z, полагая, что их совместное распределение подчинено трехмерному нормальному закону.

К вопросам анализа относятся:

- оценка тесноты связи между произвольными двумя наблюдаемыми признаками при фиксировании или исключении влияния третьего признака;

- оценка тесноты связи каждого из рассматриваемых признаков с совокупностью остальных признаков;

- проверка значимости коэффициентов связи;

- интервальное оценивание коэффициентов связи.

- построение модели корреляционной зависимости между признаками.

Определение точечных оценок параметров совместного распределения признаков. Формирование выборочной корреляционной матрицы

Признаки X, Y, Z образуют трехмерную нормально распределенную генеральную совокупность, которая определяется девятью параметрами:

• тремя математическими ожиданиями MX, MY, MZ;

• тремя дисперсиями DX, DY, DZ;

• тремя парными коэффициентами корреляции ρxy; ρxz; ρyz.

Выборочные средние



Поделиться:


Последнее изменение этой страницы: 2016-08-16; просмотров: 224; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.148.124 (0.02 с.)