Решение типовых задач по математической статистике 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Решение типовых задач по математической статистике



 

Задача 1. В течение 300 дней фиксировалась цена акции ООО «Психолог». Затем была проведена случайная выборка объёмом n=20, и получены следующие результаты: 35,9; 35,3; 42,7; 45,3; 25,6; 35,3; 33,4; 27,0; 35,9; 38,8; 33,7; 38,6; 40,8; 35,5; 44,1; 37,4; 34,2; 30,8; 38,4; 31,3.

Требуется получить вариационный ряд и построить гистограмму относительных частот; найти основные выборочные характеристики: , , s, , ; с надежностью указать доверительный интервал для оценки генеральной средней.

Решение. Запишем исходные данные в виде ранжированного ряда, то есть, располагая их в порядке возрастания: 25,6; 27,0; 30,8; 31,3; 33,4; 33,7: 34,2; 35,3; 35,3; 35,5; 35,9; 35,9; 37,4; 38,4; 38,6; 38,8; 40,8; 42,7; 44,1; 45,3.

Максимальное значение признака составляет 45,3 ц, а минимальное –

25,6 ц. Разница между ними составляет 19,7 ц. Этот интервал надо разбить на определенное количество частей. При малом объеме выборки (20–40 вариант) намечают 4–7 интервалов. Возьмем длину интервала . Получаем пять интервалов: первый 25 – 30, второй 30 – 35, третий 35 – 40, четвертый 40 – 45, пятый 45 – 50. С помощью ранжированного ряда определим частоту попадания вариант выборки в каждый интервал. В первый интервал 25 – 30 попадают два значения: 25,6 и 27,0; поэтому . Во второй интервал попадают пять значений, поэтому . Аналогично, , , .

Теперь найдем относительные частоты попадания вариант выборки в каждый интервал:

; ; ;

; .

Для проверки вычисляем сумму относительных частот:

.

Тот факт, что в сумме получена единица, подтверждает правильность вычислений.

Вычислим плотности относительных частот вариант. Получаем

;

;

;

;

.

Полученные результаты сведем в таблицу 4.

Таблица 4.

Интервал значений 25–30 30–35 35–40 40–45 45–50
Частоты вариант          
Относительные частоты 0,10 0,25 0,45 0,15 0,05
Плотность относительных частот 0,02 0,05 0,09 0,03 0,01

 

Строим гистограмму относительных частот – ступенчатую фигуру, состоящую из прямоугольников, основаниями которых являются интервалы, а высотами соответствующие значения плотности относительных частот.

Рис.8. Гистограмма относительных частот.

Так как объем выборки небольшой () и почти все наблюдаемые значения различны, то для вычисления выборочных характеристик составим вспомогательную таблицу (таблица 5).

Основные выборочные характеристики вычисляются по формулам: – выборочная средняя; – «исправленная» дисперсия; – «исправленное» среднее квадратическое отклонение; – ошибка средней; – коэффициент вариации.

Таблица 5.

Результат обследования
  35,9 – 0,1 0,01
  35,3 – 0,7 0,49
  42,7 6,7 44,89
  45,3 9,3 86,49
  25,6 –10,4 108,16
  35,3 – 0,7 0,49
  33,4 – 2,6 6,76
  27,0 – 9,0 81,00
  35,9 – 0,1 0,01
  38,8 2,8 7,84
  33,7 – 2,3 5,29
  38,6 2,6 6,76
  40,8 4,8 23,04
  35,5 – 0,5 0,25
  44,1 8,1 65,61
  37,4 1,4 1,96
  34,2 – 1,8 3,24
  30,8 – 5,2 27,04
  38,4 2,4 5,76
  31,3 – 4,7 22,09
Σ 720,0   497,20

 

Подставляя полученные значения в формулы, получаем

;

;

;

;

.

Доверительный интервал для оценки генеральной средней имеет вид:

.

Вычисляем теперь точность оценки :

;

где значение находим по таблице приложения 3.

Таким образом, с надежностью 95% можно утверждать, что средняя цена акции за 300 дней заключена в пределах от ц. (гарантированный минимум) до ц. (возможный максимум).

Задача 2. Для определения средней урожайности сахарной свеклы в агрофирме на площади га была определена ее урожайность на 100 га. Результаты выборочного обследования представлены следующим распределением:

Урожайность, ц/га 23–25 25–27 27–29 29–31 31–33 33–35 35–37
Площадь, га              

 

Требуется найти:

1) величину, которую следует принять за среднюю урожайность на всем массиве;

2) величину, которую следует принять за среднее квадратическое отклонение урожайности на всем массиве;

3) доверительный интервал, в котором с вероятностью заключена средняя урожайность на всем массиве.

Решение. В качестве приближенного значения средней урожайности на всем массиве принимаем среднюю арифметическую данного распределения, то есть выборочную среднюю. За значения признака нужно принять середины интервалов. Получим:

= (24∙3+26∙10+28∙6+30 ∙16+32 ∙15+34∙30+36∙ 20)/100 =

= 3200/100 = 32.

Для оценки дисперсии генеральной совокупности вычисляем исправленное среднее квадратическое отклонение:

Отсюда можно найти среднее квадратическое отклонение урожайности на всем массиве

= = 3,4.

Найдем среднее квадратическое отклонение выборочной средней по формуле

ц.

Итак, оценка средней урожайности сахарной свеклы на всем массиве равна 32 ц со средней квадратической ошибкой 0,34 ц. Оценка среднего квадратического отклонения урожайности на всем массиве равна 3,4 ц.

Для вычисления доверительного интервала воспользуемся двойным неравенством:

.

Так как , то значение найдем из условия . По таблице приложения 2 находим значение и , следовательно, получаем:

.

Концы доверительного интервала:

и .

Таким образом, с вероятностью 0,95 средняя урожайность сахарной свеклы на всем массиве заключена в границах от 31,33 ц до 32,67 ц.

 

ЭЛЕМЕНТЫ ТЕОРИИ КОРРЕЛЯЦИИ

 

Определение 1. Зависимость двухслучайных величин называют корреляционной, если изменение одной случайной величины приводит к

изменению среднего значения другой случайной величины.

Основные задачи теории корреляции:

1. определить есть ли связь между случайными величинами, если есть, то найти уравнение зависимости (уравнение регрессии);

2. определить силу (тесноту) связи между случайными величинами.

Для определения самого факта связи между случайными величинами и тесноты связи служит коэффициент корреляции. Уравнение регрессии позволяет предсказать, какие изменения в среднем будет претерпевать признак при изменении другого признака.

Если уравнения регрессии являются линейными, то есть графиками будут прямые линии, то корреляционная зависимость называется линейной.

Пусть извлечена выборка объема и исследуются два количественных признака и . Результаты измерений занесены в таблицу.

Значения
Значения

 

Выборочный коэффициент корреляции находится по формуле:

.

Свойства выборочного коэффициента корреляции:

1. Значения коэффициента корреляции изменяются на отрезке [–1;1]:

.

2. Чем модуль больше и ближе к 1, тем теснее связь между изучаемыми признаками.

3. Если , то между признаками функциональная связь.

4. Если , то между изучаемыми признаками нет линейной корреляционной зависимости.

5. Если , то между признаками прямая (положительная) связь и если , то между признаками обратная (отрицательная) связь.

Выборочное уравнение прямой регрессии на имеет вид:

,

где , – выборочные средние. За приближенные значения и принимают соответственно и :

, .

Выборочное уравнение прямой регрессии на имеет вид:

.

Пример. Психологи провели тестирование среди пациентов психоневрологического диспансера. Возраст пациентов колебался от 14 до 34 лет. Затем была проведена случайная выборка объёмом n=10. Была поставлена задача: определить есть ли зависимость возраста испытуемого от значения показателя развития заболевания . Результаты этого измерения представлены в таблице 6:

 

Таблица 6.

                   
                   

 

Требуется вычислить выборочный коэффициент корреляции и найти выборочное уравнение прямой регрессии на .

Решение. Вычислим выборочный коэффициент корреляции по формуле:

.

 

Для вычисления величин, входящих в формулу, составим вспомогательную таблицу 7, в которой результаты измерений записаны столбцами. Внизу каждого из столбцов вычислены суммы для нахождения средних и . Далее расположены столбцы, в которых вычисляются разности и , их квадраты и произведения. Значения этих столбцов суммируются (последняя строка), чтобы получились величины, необходимые для подстановки в формулу. Отметим, что суммы в столбцах, в которых вычислены разности и будут всегда равны нулю.

Таблица 7.

    – 45 – 35 – 25 – 15 – 5   – 9 – 5 – 4 – 3    
             

 

Находим выборочные средние и (смотри данные в таблице, 1–2 столбцы):

= 700/10 = 70, = 230/10 = 23.

Выполнив все вычисления в таблице (3 – 7 столбцы), получаем:

,

,

.

Подставляя эти значения в соответствующую формулу, вычислим коэффициент корреляции:

Таким образом, выбранных пациентов имеет место очень сильная (т.к. значение близко к 1) и положительная (т.к. ) корреляция между возрастом испытуемого и значением показателя развития заболевания .

Найдем теперь выборочное уравнение прямой регрессии на .

,

где ,

.

Тогда

Подставляя в выборочное уравнение прямой регрессии на : , , , , получим или .

Окончательно,

искомое уравнение прямой регрессии на .



Поделиться:


Последнее изменение этой страницы: 2016-12-10; просмотров: 381; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.220.66.151 (0.04 с.)