ТОП 10:

ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ



ТЕОРИЯ И ПРАКТИКА

 

Рекомендовано редакционно-издательским советом университета

в качестве учебного пособия для студентов специальностей

220301, 230104, 230201 очной формы обучения

 

Кострома

ИЗДАТЕЛЬСТВО


ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Математические законы теории вероятностей не являются абстрактными, лишёнными физического содержания, они представляют собой математическое выражение реальных закономерностей, существующих в массовых случайных явлениях.

Каждое исследование случайных явлений, выполняемое методами теории вероятностей, опирается на экспериментальные данные.

Зарождение математической статистики было связано со сбором данных и графическим представлением полученных результатов (сводки рождаемости, бракосочетаний и т.д.). Это описательная статистика. Нужно было свести обширный материал к небольшому числу величин. Разработка методов сбора (регистрации), описания и анализа экспериментальных (статистических) данных, получаемых в результате наблюдения массовых, случайных явлений, составляет предмет математической статистики.

При этом можно выделить три этапа:

1) сбор данных;

2) обработка данных;

3) статистические выводы-прогнозы и решения.

Типичные задачи математической статистики:

- определение закона распределения случайной величины (или системы случайных величин) по статистическим данным;

- проверка правдоподобия гипотез;

- нахождение неизвестных параметров распределения.

Итак,задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

 

ГЕНЕРАЛЬНАЯ И ВЫБОРОЧНАЯ СОВОКУПНОСТЬ.

СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ВЫБОРКИ.

ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ РАСПРЕДЕЛЕНИЙ

Пусть требуется изучить статистическую совокупность относительно некоторого количественного признака X. Числовые значения признака будем обозначать через хi.

Из генеральной совокупности извлекается выборка объёма п.

I. Количественный признак Хдискретная случайная величина.

Наблюдаемые значения хi называют вариантами, а последовательность вариантов, записанных в возрастающем порядке, – вариационным рядом.

Пусть x1 наблюдалось n1 раз,

x2 наблюдалось n2 раз,

xk наблюдалось nk раз,

причем . Числа ni называют частотами, а их отношение к объёму выборки, т.е. , – относительными частотами(или частостями), причем .

Значение вариант и соответствующие им частоты или относительные частоты можно записать в виде таблиц 1 и 2.

Таблица 1

Варианта xi x1 x2 xk
Частота ni n1 n2 nk

 

Таблицу 1 называют дискретным статистическим рядом распределения (ДСР) частот,илитаблицей частот.

Таблица 2

Варианта xi x1 x2 xk
Относительная частота wi w1 w2 wk

Таблица 2 - ДСР относительных частот,илитаблица относительных частот.

: Определение. Модой называется наиболее часто встречающийся вариант, т.е. вариант с наибольшей частотой. Обозначается xмод.

 

: Определение. Медианойназывается такое значение признака, которое делит всю статистическую совокупность, представленную в виде вариационного ряда, на две равных по числу части. Обозначается .

Если n нечетно, т.е. n = 2m + 1, то = xm+1.

Если n четно, т.е. n = 2m, то .

 

Пример 3. По результатам наблюдений: 1, 7, 7, 2, 3, 2, 5, 5, 4, 6, 3, 4, 3, 5, 6, 6, 5, 5, 4, 4 построить ДСР относительных частот. Найти моду и медиану.

Решение. Объем выборки n = 20. Составим ранжированный ряд элементов выборки: 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 6, 7, 7. Выделим варианты и подсчитаем их частоты (в скобках): 1 (1), 2 (2), 3 (3),
4 (4), 5 (5), 6 (3), 7 (2). Строим таблицу:

xi
wi 1/20 2/20 3/20 4/20 5/20 3/20 2/20

Наиболее часто встречающийся вариант xi = 5. Следовательно, xмод = 5. Так как объем выборки n – четное число, то

Если на плоскости нанести точки и соединить их отрезками прямых, то получим полигон частот.

Если на плоскости нанести точки , то получим полигон относительных частот.

Пример 4. Построить полигон частот и полигон относительных частот по данному распределению выборки:

 

xi
ni
wi 2/20 4/20 5/20 6/20 3/20

Решение. На рисунке 2 показан полигон частот и на рисунке 3 – полигон относительных частот.

Рис. 2 Рис. 3

Замечание. Чем круче полигон, тем равномернее процесс.

 

II. Пусть количественный признак Xнепрерывная случайная величина, принимающая значения из интервала (а,b). Весь диапазон наблюдаемых данных делят на частичные интервалы [хi; xi+1), которые берут обычно одинаковыми по длине: = xi+1 xi (i = 0, 1, …, k). Для определения величины интервала можно использовать формулу Стерджеса:

 

 

где (xmax xmin)- разность между наибольшим и наименьшим значениями признака, k = 1 + log2 n - число интервалов (log2 n » 3,322 lg n). Если окажется, что h - дробное число, то за длину частичного интервала следует брать либо ближайшее целое число, либо ближайшую простую дробь. За начало первого интервала рекомендуется брать величину xнач = xmin . В каждом из частичных интервалов подсчитывают число наблюдаемых значений, т.е. частоту ni. По частотам находят относительные частоты . Полученные интервалы и соответствующие им частоты (или относительные частоты) записывают в виде таблицы 3. При этом правая граница последнего интервала тоже включается.

Таблица 3

Частичный интервал [xi,xi+1) [x0, x1) [x1, x2) [xk-1, xk]
Относительная частота wi w1 w2 wk

 

Таблица 3 называется интервальным статистическим рядом распределения (ИСР) относительных частот, который задаёт распределение выборки.Аналогично составляется ИСР частот.

Пример 5. Измерили рост (с точностью до см) 30 наудачу отобранных студентов. Результаты измерений таковы:

178, 160, 154, 183, 155, 153, 167, 186, 163, 155, 157, 175, 170, 166, 159,

173, 182, 167, 171, 169, 179, 165, 156, 179, 158, 171, 175, 173, 164, 172.

Построить интервальный статистический ряд относительных частот.

Решение.Для удобства проранжируем полученные данные:

153, 154, 155, 155, 156, 157, 158, 159, 160, 163, 164, 165, 166, 167, 167,

169, 170, 171, 171, 172, 173, 173, 175, 175, 178, 179, 179, 182, 183, 186.

Отметим, что Х - рост студента - непрерывная случайная величина. Как видим, xmin = 153, хmax = 186; по формуле Стерджеса, при n = 30, находим длину частичного интервала

Примем = 6. Тогда хнач = 153 – =150. Исходные данные разбиваем на шесть (k = 1 + log230 = 5,907 » 6) интервалов:

[150, 156), [156, 162), [162, 168), [168, 174), [174, 180), [180, 186].

Подсчитав число студентов ni, попавших в каждый из полученных промежутков, получим ИСР:

[xi,xi+1) [150, 156) [156, 162) [162, 168) [168, 174) [174,180) [180,186]
ni
wi 4/30 5/30 6/30 7/30 5/30 3/30

Первая и третья строчка таблицы образует ИСР относительных частот.

Замечание.При решении учебных задач на построение ИСР можно пользоваться следующими правилами.

1. Назначаются нижняя граница а и верхняя граница b для вариант так, чтобы отрезок [a; b] вместил всю выборку; часто полагают , , но иногда a и b назначают из соображений удобства, но не слишком далеко от и .

2. Находится число k равных по длине частичных интервалов варьирования, которое зависит от объема выборки и обычно 6 £ k £ 20; рассчитывается длина интервалов группирования .

Интервальный статистический ряд распределения, представленный графически, называется гистограммой.

Гистограмма относительных частот строится следующим образом: по оси абсцисс откладываются интервалы (хi; хi+1) и на каждом из них строится прямоугольник высотой


где ; .

Площадь i-го прямоугольника .

Площадь всей гистограммы .

Замечание: гистограмма на рисунке 4 – гистограмма относительных частот.

 

 

 

Рис. 4

Можно построить гистограмму частот, высоты прямоугольников которых равны .

Пример 6. Построить гистограмму частот по данному ИСР частот:

[xi; xi+1) [100; 120) [120; 140) [140; 160) [160; 180) [180; 200]
ni

Решение. По ИСР частот находим длину частичных интервалов
= 20 и высоты прямоугольников hi = . Результаты занесем в таблицу:

[xi; xi+1) [100; 120) [120; 140) [140; 160) [160; 180) [180; 200]
ni
hi 2,5 0,5

 

Искомая гистограмма частот изображена на рис. 5.

hi
xi
xi

Рис. 5

 

В теории вероятностей гистограмме относительных частот соответствует график плотности распределения вероятностей. Распределение выборки, задаваемое интервальным статистическим рядом (табл. 3) или таблицей относительных частот (табл. 2), называется эмпирическим распределением случайной величины.

По теореме Бернулли относительная частота wi, появление события в п независимых испытаниях сходится по вероятности к вероятности рi этого события . Значит во второй строке таблицы 3 и таблицы 2 стоят приближённые значения вероятностей рi следующих событий и , поэтому распределение выборки называют эмпирическим распределением случайной величины X.

Замечания.

1. Выборочные средние, найденные по нескольким выборкам достаточно большого объёма из некоторой генеральной совокупности, приближенно равны между собой.

2. Предполагали, что выборка повторная. Однако полученные выводы применимы и для бесповторной выборки, если её объём значительно меньше объема генеральной совокупности.

3. Эффективность или неэффективность зависит от вида закона распределения признака X. Если X распределена по нормальному закону, то будет минимально возможной, т.е. средняя выборочная является эффективной оценкой.

 

Решение.

; .

– доверительный интервал.

Если, например, , то (3,12; 5,08).

Смысл результата:если произведено достаточно большое число выборок, то 95% из них определяют такие доверительные интервалы, в которых неизвестное математическое ожидание а действительно заключено. Лишь в 5% случаев а может выйти за границы доверительного интервала.

Вычисление объема выборки при заданных и

Пусть требуется оценить математическое ожидание, если заданы доверительная вероятность и точность оценки .

Точность оценки . Тогда .

Значит, – минимальный объем выборки, который обеспечит заданную точность .

Замечание. Доверительный интервал для оценки математического ожидания нормального распределения при неизвестном .

X – количественный признак, распределён нормально. a, – неизвестны.

Требуется оценить a .

Можно доказать, что - доверительный интервал, покрывающий неизвестное математическое ожидание a с доверительной вероятностью , где – выборочная средняя; – исправленное среднее квадратическое отклонение; – квантиль распределения, который находят по таблице 3 по заданным и .

Решение.

.

Ответ: 0,6.

2. Выборочное уравнение парной регрессии имеет вид y = –3 + 2x. Тогда выборочный коэффициент корреляции может быть равен…

-3; 0,6; -0,6; 2.

Решение.

| |≤ 1 (всегда), = 2 (из условия), (всегда), следовательно, = 0,6.

ТЕОРИЯ И ПРАКТИКА

 

Рекомендовано редакционно-издательским советом университета

в качестве учебного пособия для студентов специальностей

220301, 230104, 230201 очной формы обучения

 

Кострома

ИЗДАТЕЛЬСТВО


ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Математические законы теории вероятностей не являются абстрактными, лишёнными физического содержания, они представляют собой математическое выражение реальных закономерностей, существующих в массовых случайных явлениях.

Каждое исследование случайных явлений, выполняемое методами теории вероятностей, опирается на экспериментальные данные.

Зарождение математической статистики было связано со сбором данных и графическим представлением полученных результатов (сводки рождаемости, бракосочетаний и т.д.). Это описательная статистика. Нужно было свести обширный материал к небольшому числу величин. Разработка методов сбора (регистрации), описания и анализа экспериментальных (статистических) данных, получаемых в результате наблюдения массовых, случайных явлений, составляет предмет математической статистики.

При этом можно выделить три этапа:

1) сбор данных;

2) обработка данных;

3) статистические выводы-прогнозы и решения.

Типичные задачи математической статистики:

- определение закона распределения случайной величины (или системы случайных величин) по статистическим данным;

- проверка правдоподобия гипотез;

- нахождение неизвестных параметров распределения.

Итак,задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

 







Последнее изменение этой страницы: 2016-04-19; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.232.125.29 (0.017 с.)