Связь признаков, измеренных в номинальных шкалах 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Связь признаков, измеренных в номинальных шкалах



Ограничимся двумя признаками Х и .Пусть признак Х имеет r градаций (уровней) , признак градаций . Обозначим через частоту события Выборочные частоты представляют в виде таблиц, называемых таблицами сопряженности

 

 

По частотам вычисляют статистику (существуют различные методы) и определяют, зависимы или нет признаки Х и .

Понятие о многомерном анализе

И других статистических методах

На практике при обследовании некоторого объекта измеряется не один, а несколько его признаков. В таких опытах каждое наблюдение представляется некоторым конечным упорядоченным набором чисел. Часть математической статистики, которая исследует эксперименты с такими многомерными наблюдениями, называется многомерным статистическим анализом. Одномерный статистический анализ является частным случаем многомерного. При планировании эксперимента следует стремиться к тому, чтобы признаков было меньше, т. к. каждый признак, не несущий полезной информации (или несущий её малое количество), только создает помехи для анализа.

Факторный анализ

Одним из наиболее распространенных методов многомерного анализа является факторный анализ.

При исследовании сложных объектов и их систем (в психологии, биологии, социологии и т. д.) часто невозможно непосредственно измерить величины, определяющие свойства этих объектов (так называемые факторы), а иногда неизвестны даже количество и смысл факторов, поэтому производят измерения величин, зависящих от последних. Для обнаружения влияющих на измеряемые переменные факторов используются методы факторного анализа. Например, изучение различных свойств личности, которые не поддаются прямому измерению, происходит с помощью психологических тестов. Затем тестовые баллы подвергаются факторному анализу, который позволяет выявить личностные свойства, оказавшие влияние на поведение испытуемых.

Опишем в общих чертах схему факторного анализа. Вычисляют коэффициенты корреляции между всевозможными парами переменных и составляют из них интеркорреляционную матрицу (в ней справа и сверху цифрами обозначены изученные в эксперименте переменные, а внутри показаны их корреляции друг с другом; поскольку всевозможных пар в данном случае меньше, чем клеток матрицы, то заполняется только часть матрицы, расположенная выше её главной диагонали). Приведем пример:

 
 

 


 

Анализ корреляционной матрицы показывает, что переменная 1 значительно коррелирует с переменными 2 и 3; переменная 2 достоверно коррелирует с переменной 3, а переменная 3 – с переменной 4.

Задача факторного анализа является как бы обратной по отношению к задаче умножения двух матриц, одна из которых является столбцом, а другая – строкой. Она сводится к тому, чтобы по уже имеющейся матрице парных корреляций отыскать одинаковые, по включенным в них числам, столбец и строку, умножение которых друг на друга порождает корреляционную матрицу. Иллюстрация:

 
 

 


Здесь х 1, х 2, х 3 и х 4 – искомые числа. Для их определения существуют специальные математические процедуры и программы для ЭВМ.

Допустим, что мы уже нашли эти числа: х 1 = 0,45, х 2 = 0,36, х 3 = 1,12 и х 4 = 0,67. Совокупность найденных чисел и называется фактором, а сами эти числа – факторными весами ли нагрузками.

От факторов можно перейти к содержательной интерпретации обнаруженных статистических закономерностей. Фактор содержит в себе ту же самую информацию, что и вся корреляционная матрица, а факторные нагрузки соответствуют коэффициентам корреляции. В нашем примере переменная х 3 имеет наибольшую факторную нагрузку (1,12), а х 2 – наименьшую (0,36). Следовательно, влияние х 3 на все переменные является наиболее значимым, а влияние х 2 – наименее значимым. Из корреляционной матрицы видно, что связи переменной х 3 со всеми остальными являются наиболее сильными (от 0,40 до 0,75), а переменной х 2 – самыми слабыми (от 0,16 до 0,40).

 

 
 

 


Чаще всего в итоге факторного анализа определяются не один, а несколько факторов, по-разному объясняющих матрицу интеркорреляции переменных. В таком случае факторы делят на генеральные, общие и единичные. Генеральными называются факторы, все факторные нагрузки которых значительно отличаются от нуля (нуль нагрузки свидетельствует о том, что данная переменная никак не связана с остальными и не оказывает на них никакого влияния). Общие – это факторы, у которых часть факторных нагрузок отлична от нуля. Единичные – это факторы, у которых существенно отличается от нуля только одна из нагрузок. На рис. 3.8 схематически представлена структура факторного отображения переменных в факторах различной степени общности. Отрезки, соединяющие факторы с переменными, указывают на высокие факторные нагрузки.

 

Дискриминантный анализ

Предположим, что мы имеем совокупность объектов, разбитую на несколько групп (т. е. для каждого объекта мы можем сказать, к какой группе он относится). Пусть каждый объект имеет несколько количественных признаков. Нужно найти способ, как на основании значений признаков определить группу, к которой следует отнести определенный объект. Например, исследуемыми объектами могут быть пациенты – здоровые или больные той или иной болезнью, а характеристиками – результаты медицинских анализов.

Для решения поставленной задачи применяются методы дискриминантного анализа, которые позволяют строить функции от измеряемых признаков, значения которых и определяют разбиение объектов на группы. Желательно, чтобы этих функций (дискриминирующих признаков) было немного – в этом случае результаты анализа легче содержательно истолковать. Особую роль, благодаря своей простоте, играет линейный дискриминантный анализ, в котором классифицирующие признаки выбираются как линейные функции от первичных признаков.

 

Кластерный анализ

Кластерный анализ – это процедура, которая позволяет на основе множества признаков, характеризующих ряд объектов, сгруппировать их в классы (кластеры) так, чтобы объекты, входящие в один класс, были более однородными, чем объекты, входящие в другие классы. Группировка происходит на основе вычисления расстояний между объектами в различных метриках по числовым значениям признаков.

Большинство методов кластеризации (иерархической группировки) являются аггломеративными (объединительными) – они начинаются с создания элементарных кластеров, каждый из которых состоит ровно из одного исходного наблюдения (одной точки), а на каждом последующем шаге происходит объединение двух наиболее близких кластеров в один. Момент остановки этого процесса может задаваться исследователем (например, указанием требуемого числа кластеров или максимального расстояния, при котором допустимо объединение). Графическое изображение процесса объединения кластеров может быть получено с помощью дендрограммы – дерева объединения кластеров. Другие методы кластерного анализа являются дивизивными – они пытаются разбивать объекты на кластеры непосредственно.

Методы кластеризации довольно разнообразны, в них по-разному выбирается способ определения близости между кластерами (и между объектами), а также используются различные алгоритмы вычислений. Заметим, что результаты кластеризации зависят от выбранного метода, и эта зависимость тем сильнее, чем менее явно изучаемая совокупность разделяется на группы объектов. Поэтому результаты вычислительной кластеризации могут быть дискуссионными. Иногда результаты кластеризации можно обосновать с помощью методов дискриминантного анализа.

Методы одномерного и многомерного статистического анализа данных можно реализовать на компьютере с помощью универсальных статистических пакетов STADIA, STATGRAFICS, SYSTAT, а также специализированных пакетов, имеющих большие возможности как в смысле размерности многомерных методов, так и графические.

 

Упражнения для самопроверки

1. Записать в виде вариационного и статистического рядов выборку

27, 28, 31, 30, 26, 34, 39, 35, 28, 32, 30, 33, 30, 36, 36

значений признака Х.

Найти: 1) размах выборки; 2) относительные частоты; 3) моду; 4) медиану.

Построить: 1) график эмпирической функции распределения выборки; 2) полигон частот; 3) полигон относительных частот; 4) гистограмму частот.

Найти: 1) точечные оценки числовых характеристик признака Х; 2) интервальные оценки числовых характеристик признака Х при условии .

2. На уровне значимости проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты:

 

m(эмп)i            
M(теор)i            

 

3. Компания, производящая средства для потери веса, утверждает, что прием таблеток в сочетании со специальной диетой позволяет сбросить в среднем в неделю 400 г веса. Случайным образом отобраны 25 человек, использующих эту терапию, и обнаружено, что в среднем еженедельная потеря в весе составила 430 г со средним квадратическим отклонением 110 г. Проверьте гипотезу о том, что средняя потеря в весе составляет 400 г. Уровень значимости .

 

4. С помощью некоторой психолого-диагностической методики определена величина интереса к изучению некоторого предмета у 12 студентов:

5,3; 6,0; 7,1; 8,1; 4,3; 8,3; 7,4; 2,5; 9,0; 5,7; 3,6; 6,8.

Тестовые баллы этих же студентов на экзамене оказались соответственно равны:

12; 15; 17; 20; 10; 25; 16; 9; 23; 11; 14; 21.

Проверить гипотезу о статистической зависимости тестовых баллов студентов от их интереса к предмету.

 

 

ЗАКЛЮЧЕНИЕ

В пособии рассмотрены лишь основные понятия и теоремы теории вероятностей и математической статистики, многие утверждения и теоремы приведены без доказательства. Более широкое и подробное изложение курса читатель может найти в литературе, список которой прилагается.


БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Кремер Н. Ш. Теория вероятностей и математическая статистика: Учебник для вузов. – М.: ЮНИТИ-ДАНА, 2001. – 543 с.

2. Вентцель Е. С. Теория вероятностей: Учебник для вузов. – 7-е изд, стер. – М.: Высш. шк., 2001. – 575 с.

3. Вентцель Е. С., Овчаров Л. А. Теория вероятностей и ее инженерные приложения. Учеб. пособие для втузов. – 2-е изд., стер.– М.: Высш. шк., 2000.– 480 с.

4. Гмурман В. Е. Теория вероятностей и математическая статистика: Учеб. пособие для вузов. – Изд. 7-е, стер. – М.: Высш. шк., 2001. – 479 с.

5. Романовский Р. К., Романовская А. М. Элементы теории вероятностей и математической статистики (теория и задачи). – Омск: Издательство «Наследие», Диалог – Сибирь, 2003. – 172 с.

6. Немов Р. С. Психология: Учеб. для студ. высш. пед. заведений: В 3 кн. – М.: ВЛАДОС, 2000. – Кн. 3. – 640 с.

7. Ниворожкина Л. И., Морозова З. А., Герасимова И. А., Житникова И. В. Основы статистики с элементами теории вероятностей для экономистов: Руководство для решения задач.– Ростов н/Д: Феникс, 1999. – 320 с.

8. Тюрин Ю. Н., Макаров А. А. Анализ данных на компьютере / Под ред. В. Э. Фигурнова. – М.: ИНФРА-М, Финансы и статистика, 1995.– 384 с.

9. Красс М. С., Чупрынов Б. П. Основы математики и ее приложения в экономическом образовании: Учеб. – М.: Дело, 2000. – 688 с.

 

 


ПРИЛОЖЕНИЯ

 

1. Таблица значений функции Гаусса и её график

 
 

 

 


х 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,3989 0,3989 0,3989 0,3988 0,3986 0,3984 0,3982 0,3980 0,3977 0,3973
0,1                    
0,2                    
0,3                    
0,4                    
0,5 0,3521 0,3503 0,3485 0,3467 0,3448 0,3429 0,3410 0,3391 0,3372 0,3352
0,6                    
0,7                    
0,8                    
0,9                    
1,0 0.2420 0,2396 0,2371 0,2347 0,2323 0,2299 0,2275 0,2251 0,2227 0,2203
1,1                    
1,2                    
1,3                    
1,4                    
1,5 0,1295 0,1276 0,1257 0,1238 0,1219 0,1200 0,1182 0,1163 0,1145 0,1127
1,6                    
1,7                    
1,8                    
1,9                    
2,0 0,0540 0,0529 0,0519 0,0508 0,0498 0,0488 0,0478 0,0468 0,0459 0,0449
2,1                    
2,2                    
2,3                    
2,4                    
2,5 0,0175 0,0171 0,0167 0,0163 0,0158 0,0154 0,0151 0,0147 0,0143 0,0139
2,6                    
2,7                    
2,8                    
2,9                    

 

Окончание прил. 1
х 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
3,0 0,0044 0,0043 0,0042 0,0040 0,0039 0,0038 0,0037 0,0036 0,0035 0,0034
3,1                    
3,2                    
3,3                    
3,4                    
3,5 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007 0,0007 0,0007 0,0006
3,6                    
3,7                    
3,8                    
3,9                    
4,0 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
4,1                    
4,2                    

 


2. Таблица значений функции Лапласа

И её график

 
 


х 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0200 0,0239 0,0279 0,0319 0,0359
0,1                    
0,2                    
0,3                    
0,4                    
0,5 0,1915 0,1950 0,1985 0,2019 0,2058 0,2088 0,2123 0,2157 0,2190 0,2224
0,6                    
0,7                    
0,8                    
0,9                    
1,0 0,3413 0,3437 0,3461 0,3485 0,3508 0,3581 0,3554 0,3577 0,3599 0,3621
1,1                    
1,2                    
1,3                    
1,4                    
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6                    
1,7                    
1,8                    
1,9                    
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1                    
2,2                    
2,3                    
2,4                    
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6                    
2,7                    
2,8                    
2,9                    
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990  
Окончание прил. 2
х 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
3,1                    
3,2                    
3,3                    
3,4                    
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6                    
3,7                    
3,8                    
3,9                    
4,0                    
                                   

3. Таблица значений функции Пуассона

 

m 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
  0,9048 0,8187 0,7408 0,6703 0,6065 0,5488 0,4966   0,4066 0,3679
  0,0905 0,1637 0,2223 0,2681 0,3033 0,3293 0,3476 0,3595 0,3659 0,3679
  0,0045 0,0164 0,0333 0,0536 0,0758 0,0988 0,1216 0,1438 0,1647 0,1839
  0,0002 0,0011 0,0033 0,0072 0,0126 0,0198 0,0284 0,0383 0,0494 0,0613
  0,0000 0,0001 0,0003 0,0007 0,0016 0,0030 0,0050 0,0077 0,0111 0,0153
  0,0000 0,0000 0,0000 0,0001 0,0002 0,0003 0,0007 0,0012 0,0020 0,0031
  0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0003 0,0005
  0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001

 

 

m 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0
  0,1353 0,0498 0,0183 0,0067 0,0025 0,0009 0,0003 0,0001 0,0001
  0,2707 0,1494 0,0733 0,0337 0,0149 0,0064 0,0027 0,0011 0,0005
  0,2707 0,2240 0,1465 0,0842 0,0446 0,0223 0,0107 0,0050 0,0023
  0,1805 0,2240 0,1954 0,1404 0,0892 0,0521 0,0286 0,0150 0,0076
  0,0902 0,1681 0,1954 0,1755 0,1339 0,0912 0,0572 0,0337 0,0189
  0,0361 0,1008 0,1563 0,1755 0,1606 0,1277 0,0916 0,0607 0,0378
  0,0120 0,0504 0,1042 0,1462 0,1606 0,1490 0,1221 0,0911 0,0631
  0,0034 0,0216 0,0595 0,1045 0,1377 0,1490 0,1395 0,1171 0,0901
  0,0009 0,0081 0,0298 0,0653 0,1033 0,1304 0,1396 0,1318 0,1126
  0,0002 0,0027 0,0132 0,0363 0,0689 0,1014 0,1241 0,1318 0,1251
  0,0000 0,0008 0,0053 0,0181 0,0413 0,0710 0,0993 0,1186 0,1251
  0,0000 0,0002 0,0019 0,0082 0,0225 0,0452 0,0722 0,0970 0,1137
  0,0000 0,0001 0,0006 0,0034 0,0113 0,0264 0,0481 0,0728 0,0948
  0,0000 0,0000 0,0002 0,0013 0,0052 0,0142 0,0296 0,0504 0,0729
  0,0000 0,0000 0,0001 0,0005 0,0022 0,0071 0,0169 0,0324 0,0521
  0,0000 0,0000 0,0000 0,0002 0,0009 0,0033 0,0090 0,0194 0,0347
  0,0000 0,0000 0,0000 0,0000 0,0003 0,0015 0,0045 0,0109 0,0217
  0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0021 0,0058 0,0128
  0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0009 0,0029 0,0071
  0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0014 0,0037
  0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0006 0,0019
  0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0009
  0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004
  0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002
  0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
  0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

 


4. Таблица квантилей распределения

И график функции

 
 

 

 


p k 0,005 0,010 0,025 0,05 0,10 0,20 0,30 0,70
  0,04393 0,03157 0,03982 0,02393 0,0158 0,0642 0,148 1,07
  0,0100 0,0201 0,0506 0,103 0,211 0,446 0,713 2,41
  0,0717 0,115 0,216 0,352 0,584 1,00 1,42 3,67
  0,207 0,297 0,484 0,711 1,06 1,65 2,19 4,88
  0,412 0,554 0,831 1,15 1,61 2,34 3,00 6,06
  0,676 0,872 1,24 1,64 2,20 3,07 3,83 7,23
  0,989 1,24 1,69 2,17 2,83 3,82 4,67 8,38
  1,34 1,65 2,18 2,73 3,49 4,59 5,53 9,52
  1,73 2,09 2,70 3,33 4,17 5,38 6,39 10,7
  2,16 2,56 3,25 3,94 4,87 6,18 7,27 11,8
  2,60 3,05 3,82 4,57 5,58 6,99 8,15 12,9
  3,07 3,57 4,40 5,23 6,30 7,81 9,03 14,0
  3,57 4,11 5,01 5,89 7,04 8,63 9,93 15,1
  4,07 4,66 5,63 6,57 7,79 9,47 10,8 16,2
  4,60 5,23 6,26 7,26 8,55 10,3 11,7 17,3
  5,14 5,81 6,91 7,96 9,31 11,2 12,6 18,4
  5,70 6,41 7,56 8,67 10,1 12,0 13,5 19,5
  6,26 7,01 8,23 9,39 10,9 12,9 14,4 20,6
  6,84 7,63 8,91 10,1 11,7 13,7 15,4 21,7
  7,43 8,26 9,59 10,9 12,4 14,6 16,3 22,8
  8,03 8,90 10,3 11,6 13,2 15,4 17,2 23,9
  8,64 9,54 11,0 12,3 14,0 16,3 18,1 24,9
  9,26 10,2 11,7 13.1 14,8 17,2 19,0 26,0
  9,89 10,9 12,4 13,8 15,7 18,1 19,9 27,1
  10,5 11,5 13,1 14,6 16,5 18,9 20,9 28,2
  11,2 12,2 13,8 15,4 17,3 19,8 21,8 29,2
  11,8 12,9 14,6 16,2 18,1 20,7 22,7 30,3
  12,5 13,6 15,3 16,9 18,9 21,6 23,6 31,4
  13,1 14,3 16,0 17,7 19,8 22,5 24,6 32,5
  13,8 15,0 16,8 18,5 20,6 23,4 25,5 33,5
  17,2 18,2 20,6 22,5 24,8 27,8 30,2 38,9
  20,7 22,2 24,4 26,5 29,1 32,3 34,9 44,2
  24,3 25,9 28,4 30,6 33,4 36,9 39,6 49,5
  28,0 29,7 32,4 34,8 37,7 41,4 44,3 54,7
  47,2 49,5 52,9 56,1 59,8 64,5 68,1 80,9
  67,3 70,1 74,2 77,9 82,4 87,9 92,1 106,9

Окончание прил. 4



Поделиться:


Последнее изменение этой страницы: 2016-04-26; просмотров: 300; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.141.8.247 (0.039 с.)