Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Кафедра медицинской и биологической физики

Поиск

МИНИСТЕРСТВО ЗДРАВООХРАНЕНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ МЕДИЦИНСКИЙ УНИВЕРСИТЕТ

КАФЕДРА МЕДИЦИНСКОЙ И БИОЛОГИЧЕСКОЙ ФИЗИКИ

 

Н.И. Инсарова, В.Г. Лещенко

 

Элементы теории

Вероятностей и математической

Статистики

 

Минск 2003


УДК 534.7(075.8)

ББК 22.32 я 73

И 46

 

А в т о р ы – доценты кафедры медицинской и биологической физики Белорусского государственного медицинского университета Н.И. Инсарова, В.Г. Лещенко.

Р е ц е н з е н т ы: доцент кафедры инженерной математики Белорусского национального технического университета В.Я. Анисимов; заведующий кафедрой гистологии, цитологии и эмбриологии Белорусского государственного медицинского университета, профессор Б.А. Слука, доцент кафедры общественного здоровья и здравоохранения Белорусского государственного медицинского университета
М.В. Мальковец.

Утверждено Научно-методическим советом университета в качестве учебно-методического пособия 15.01.03., протокол № 4

Н.И. Инсарова, В.Г. Лещенко

 

И46 Элементы теории вероятностей и математической статистики: пособие для студентов медицинских ВУЗов/ Н.И. Инсарова, В.Г. Лещенко. – Мн.:БГМУ, 2003. – с. 77

 

ISBN

Рассматриваются основные идеи и понятия теории вероятностей, математической статистики и статистического анализа опытных данных. Их использование в современной медицине и биологии иллюстрируется многочисленными профессионально ориентированными примерами.

Предназначается для студентов первого курса медицинских вузов.

УДК 534.7(075.8)

ББК 22.32 я 73

Ó Белорусский государственный

медицинский университет, 2003


Учебное издание

Инсарова Наталия Ивановна

Лещенко Вячеслав Григорьевич

Элементы теории

вероятностей и математической

статистики

 

Ответственный за выпуск Н.И.Инсарова

Редактор Л.В.Харитонович

 

 

Подписано в печать _____________. Формат 60х84/16. Бумага писчая.

Гарнитура «Times». Усл.печ.л._____. Уч.-изд. л_____. Тираж ____ экз. Заказ______

Издатель и полиграфическое исполнение –

Белорусский государственный медицинский университет

 

220050, г.Минск, ул. Ленинградская, 6


Чтобы переварить знания, надо поглощать их с аппетитом.

Анатоль Франс

Введение

Пособие состоит из двух частей, логически связанных друг с другом.

В первой части (главы I и II) раскрывается суть основных понятий и теорем теории вероятностей, которая составляет основу математической статистики. Причем материал излагается не в строго формальной математической форме (это привлекательно только для математиков), а главным образом на общепонятийном уровне. Здесь обсуждаются такие понятия, как случайное событие и случайная величина, их вероятности, экспериментальная оценка этих вероятностей, основные числовые характеристики случайных величин, их законы распределения.

Во второй части (глава III) определены базовые понятия математической статистики, так как без них невозможно осмысленно применять методы статистического анализа данных. К таким понятиям относятся, прежде всего, генеральная совокупность, выборка, статистическая гипотеза. В этой части также рассматриваются стандартные приемы работы с выборкой, анализ нормальных выборок, исследование связи признаков, некоторые способы проверки согласия статистической гипотезы с данными опыта, т.е. собственно статистические методы анализа данных.

Более подробно и шире все эти вопросы отражены в источниках, указанных в списке литературы, приведенном в конце пособия.

Читателю, это пособие, несмотря на старания авторов, может показаться сложным и чрезмерно математизированным. Вместе с тем сегодняшние тенденции, определяющие политику в области здоровья и здравоохранения, развитие доказательной медицины, суть которой состоит в установлении связей между результатами и технологиями, обеспечивающими качество медицинской помощи, требуют достаточно глубоких знаний в области статистики. Это делает просто необходимым уже в самом начале получения медицинского образования обучать студентов "азам" теории вероятностей и математической статистики. Причем очень важно, чтобы будущий врач понимал, что каждый из методов, разрабатываемых этими науками, имеет свои возможности и ограниченную область применения. Только цель исследования и характер полученных данных определяют выбор математического аппарата для их обработки.

Авторы считают своим приятным долгом выразить благодарность рецензентам – профессору Б.А. Слуке и доценту М.В. Мальковец – за поддержку идеи этой работы, доценту В.Я. Анисимову, чьи советы и пожелания оказались весьма полезными при написании отдельных разделов пособия.

Нам хочется поблагодарить также всех тех, чья техническая помощь была очень важна при подготовке рукописи к печати.


Глава I. СЛУЧАЙНЫЕ СОБЫТИЯ. ВЕРОЯТНОСТЬ

Закономерность и случайность, случайная изменчивость в точных науках, в биологии и медицине

Теория вероятностей – область математики, изучающая закономерности в случайных явлениях. Случайное явление – это явление, которое при неоднократном воспроизведении одного и того же опыта может протекать каждый раз несколько по-иному.

Очевидно, что в природе нет ни одного явления, в котором не присутствовали бы в той или иной мере элементы случайности, но в различных ситуациях мы учитываем их по-разному. Так, в ряде практических задач ими можно пренебречь и рассматривать вместо реального явления его упрощенную схему – «модель», предполагая, что в данных условиях опыта явление протекает вполне определенным образом. При этом выделяются самые главные, решающие факторы, характеризующие явление. Именно такая схема изучения явлений чаще всего применяется в физике, технике, механике; именно так выявляется основная закономерность, свойственная данному явлению и дающая возможность предсказать результат опыта по заданным исходным условиям. А влияние случайных, второстепенных, факторов на результат опыта учитывается здесь случайными ошибками измерений (методику их расчета рассмотрим далее).

Однако описанная классическая схема так называемых точных наук плохо приспособлена для решения многих задач, в которых многочисленные, тесно переплетающиеся между собой случайные факторы играют заметную (часто определяющую) роль. Здесь на первый план выступает случайнаяприродаявления, которой уже нельзя пренебречь. Это явление необходимо изучать именно с точки зрения закономерностей, присущих ему как случайному явлению. В физике примерами таких явлений являются броуновское движение, радиоактивный распад, ряд квантово-механических процессов и др.

Предмет изучения биологов и медиков – живой организм, зарождение, развитие и существование которого определяется очень многими и разнообразными, часто случайными внешними и внутренними факторами. Именно поэтому явления и события живого мира во многом тоже случайны по своей природе.

Элементы неопределенности, сложности, многопричинности, присущие случайным явлениям, обусловливают необходимость создания специальных математических методов для изучения этих явлений. Разработка таких методов, установление специфических закономерностей, свойственных случайным явлениям, –главные задачи теориивероятностей. Характерно, что эти закономерности выполняются лишь при массовости случайных явлений. Причем индивидуальные особенности отдельных случаев как бы взаимно погашаются, а усредненныйрезультатдлямассыслучайных явлений оказывается уже не случайным, а вполнезакономерным. В значительной мере данное обстоятельство явилось причиной широкого распространения вероятностных методов исследования в биологии и медицине.

Рассмотрим основные понятия теории вероятностей.

Виды случайных событий. Основные теоремы теории вероятностей

Все случайные события можно разделить на:

¾ несовместные;

¾ независимые;

¾ зависимые.

Для каждого вида событий характерны свои особенности и теоремы теории вероятностей.

Формула Байеса

Если вероятность совместного появления зависимых событий А и В не зависит от того, в каком порядке они происходят, то Р (А и В) = Р (А) ∙Р (В/А) = Р (В) × Р (А/В). В этом случае условнуювероятность одного из событий можно найти, зная вероятности обоих событий и условную вероятность второго:

Р (В/А) = (11)

Обобщением данной формулы на случай многих событий является формула Байеса.

Пусть «n» несовместных случайных событий Н1, Н2, …, Нn, образуют полнуюгруппу событий. Вероятности этих событий – Р (Н1), Р (Н2), …, Р (Нn) известны и так как они образуют полную группу, то = 1.

Некоторое случайное событие А связано с событиями Н1, Н2, …, Нn, причем известны условные вероятности появления события А с каждым из событий Нi, т.е. известны Р (А/Н1), Р (А/Н2), …, Р (А/Нn). При этом сумма условных вероятностей Р (А/Нi) может быть не равна единице т.е. ≠ 1.

Тогда условная вероятность появления события Нi при реализации события А (т.е. при условии, что событие А произошло) определяется формулойБайеса:

= (12)

Причем для этих условных вероятностей .

Формула Байеса нашла широкое применение не только в математике, но и в медицине. Например, она используется для вычисления вероятностей тех или иных заболеваний. Так, если Н 1,…, Нn – предполагаемые диагнозы для данного пациента, А – некоторый признак, имеющий отношение к ним (симптом, определенный показатель анализа крови, мочи, деталь рентгенограммы и т.д.), а условные вероятности Р (А/Нi) проявления этого признака при каждом диагнозе Нi (i = 1,2,3,… n) заранее известны, то формула Байеса (12) позволяет вычислить условные вероятности заболеваний (диагнозов) Р (Нi) после того как установлено, что характерный признак А присутствует у пациента.

Пример1. При первичном осмотре больного предполагаются 3 диагноза Н 1, Н 2, Н 3. Их вероятности, по мнению врача, распределяются так: Р (Н 1) = 0,5; Р (Н 2) = 0,17; Р (Н 3) = 0,33. Следовательно, предварительно наиболее вероятным кажется первый диагноз. Для его уточнения назначается, например, анализ крови, в котором ожидается увеличение СОЭ (событие А). Заранее известно (на основании результатов исследований), что вероятности увеличения СОЭ при предполагаемых заболеваниях равны:

Р (А / Н 1) = 0,1; Р (А / Н 2) = 0,2; Р (А / Н 3) = 0,9.

В полученном анализе зафиксировано увеличение СОЭ (событие А произошло). Тогда расчет по формуле Байеса (12) дает значения вероятностей предполагаемых заболеваний при увеличенном значении СОЭ: Р (Н 1/ А) = 0,13; Р (Н 2/ А) = 0,09;
Р (Н 3/ А) = 0,78. Эти цифры показывают, что с учетом лабораторных данных наиболее реален не первый, а третий диагноз, вероятность которого теперь оказалась достаточно большой.

Приведенный пример – простейшая иллюстрация того, как с помощью формулы Байеса можно формализовать логику врача при постановке диагноза и благодаря этому создать методы компьютерной диагностики.

Пример 2. Определите вероятность, оценивающую степень риска перинатальной* смертности ребенка у женщин с анатомически узким тазом.

Решение: пусть событие Н 1 – благополучные роды. По данным клинических отчетов, Р (Н 1) = 0,975 = 97,5 %, тогда, если Н2 – факт перинатальной смертности, то Р (Н 2) = 1 – 0,975 = 0,025 = 2,5 %.

Обозначим А – факт наличия узкого таза у роженицы. Из проведенных исследований известны: а) Р (А / Н 1) – вероятность узкого таза при благоприятных родах, Р (А / Н 1) = 0,029, б) Р (А / Н 2) – вероятность узкого таза при перинатальной смертности,
Р (А / Н 2) = 0,051. Тогда искомая вероятность перинатальной смертности при узком тазе у роженицы рассчитывается по формуле Байса (12) и равна:

Таким образом, риск перинатальной смертности при анатомически узком тазе значительно выше (почти вдвое) среднего риска (4,4 % против 2,5 %).

Подобные расчеты, обычно выполняемые с помощью компьютера, лежат в основе методов формирования групп пациентов повышенного риска, связанного с наличием того или иного отягощающего фактора.

Формула Байеса очень полезна для оценки многих других медико-биологических ситуаций, что станет очевидным при решении приведенных в пособии задач.

Задачи

1. Все натуральные числа от 1 до 30 записаны на одинаковых карточках и помещены в урну. После тщательного перемешивания карточек из урны извлекается одна из них. Какова вероятность того, что число на этой карточке окажется кратным 5?

Ответ: 0,2.

2. Какова вероятность того, что в наудачу выбранном двузначном числе цифры одинаковы?

Ответ: 0,1.

3. Контролер, проверяя качество 400 изделий, установил, что 20 из них относятся ко второму сорту, а остальные – к первому. Найдите относительную частоту появления изделий 1) первого сорта; 2) второго сорта?

Ответ: 1) 0,95; 2)0,05.

4. В цехе работают 7 мужчин и 3 женщины. По табельным номерам наудачу отобраны 2 человека. Найдите вероятность того, что они окажутся мужчинами?

Ответ: 7/15.

5. Примерно 1 ребенок из 700 рождается с синдромом Дауна. В больнице большого города в год рождается 3500 детей. Каково ожидаемое число новорожденных с синдромом Дауна?

Ответ: 5.

6. Спортсмен стреляет по мишени, разделенной на 3 сектора. Вероятность попадания в первый сектор равна 0,4, во второй – 0,3. Какова вероятность попадания в первый либо во второй сектор?

Ответ: 0,7.

7. В большой популяции плодовой мушки у 25%
особей – мутация глаз, у остальных – мутация крыльев. Найдите вероятность того, что у особи, выбранной
наудачу, из этой популяции, окажется хотя бы одна из мутаций.

Ответ: 1.

8. Лечение определенного заболевания дает эффект (выздоровление) в 75 % случаев. Оно проводилось шести больным. Какова вероятность того, что: 1) выздоровят все шестеро; 2) не выздоровит ни один?

Ответ: 1) 18 %; 2) 0,025 %.

9. Операция пересадки кожи дает успех в 40 % всех случаев. Пациенту делают пересадку кожи несколько раз подряд до тех пор, пока она не удается. Какова вероятность того, что пересадка окажется успешной: 1) с первой попытки; 2) с третьей попытки?

Ответ: 1) 0,4 2) 0,144.

10. Студент пришел на экзамен, зная 40 из 50 вопросов программы. В билете 3 вопроса. Найдите вероятность того, что студент ответит на все 3 вопроса билета.

Ответ: 0,5.

11. На двух фермах А и В, насчитывающих по 1000 голов крупного рогатого скота, произошла вспышка заболевания ящуром. Доли зараженного скота составляют соответственно 1/5 и 1/4. Какова вероятность того, что выбранная случайным образом корова: 1) принадлежит ферме А и болеет? 2) принадлежит ферме В, болеет и старше одного года, если на каждой ферме 70 % зараженного скота младше одного года?

Ответ: 1) 1/10; 2) 3/80.

12. *Одна вакцина формирует иммунитет против краснухи в 95 % случаев. Предположим, что вакцинировалось 30 % популяции и, что вероятность заболеть краснухой у вакцинированного человека без иммунитета такая же, как и у не вакцинированного. Какова вероятность того, что человек, заболевший краснухой, был вакцинирован?

Ответ: 3/143.

13. *Некоторое заболевание, которое встречается у 5 % населения, с трудом поддается диагностике. Один грубый тест на это заболевание дает положительные результат (указывающий на наличие заболевания) в 60 % случаев, когда пациент действительно болен, и в 30 % случаев, когда у пациента этого заболевания нет. Пусть для конкретного пациента этот тест дает положительные результат. Какова вероятность того, что у него есть данное заболевание?

Ответ: 0,095.

14. *На одном производстве было установлено, что 3 % рабочих являются алкоголиками с показателем прогулов втрое выше, чем у остальных. Если случайно выбранный рабочий отсутствует на работе, то какова вероятность того, что он алкоголик?

Ответ: 0,085.

15. *Большая популяция разбита на две группы одинаковой численности. Одна группа придерживалась специальной диеты с высоким содержанием ненасыщенных жиров, а контрольная группа питалась по обычной диете, богатой насыщенными жирами. После 10 лет пребывания на этих диетах возникновение сердечно-сосудистых заболеваний в этих группах составило соответственно 31 % и 48 %. Случайно выбранный из популяции человек страдает сердечно-сосудистым заболеванием. Какова вероятность того, что он принадлежит к контрольной группе?

Ответ: 48/79 ≈ 0,61.

16. *Установлено, что курящие мужчины в возрасте свыше 40 лет умирают от рака легких в 10 раз чаще, чем не курящие. В предположении, что 60 % мужской популяции курит, найдите вероятность того, что мужчина, умерший от рака легких, был курящим?

Ответ: 15/16 ≈ 0,9375.

17. *Установлено, что в среднем один из 700 детей мужского пола рождается с лишней Y -хромосомой и что среди таких детей крайне агрессивное поведение встречается в 20 раз чаще. Опираясь на эти данные, представьте, что у мальчика крайне агрессивное поведение. Какова вероятность того, что ребенок имеет лишнюю Y -хромосому?

Ответ: 20/719 ≈ 0,.28.

 


Случайные величины, их виды

В математике величина – это общее название различных количественных характеристик предметов и явлений. Длина, площадь, температура, давление и т.д. – примеры разных величин.

Величина, которая принимает различные числовые значения под влиянием случайных обстоятельств, называется случайной величиной. Примеры случайных величин: число больных на приеме у врача; точные размеры внутренних органов людей и т.д.

Различаютдискретные инепрерывные случайные величины.

Случайная величина называется дискретной, если она принимает только определенные отделенные друг от друга значения, которые можно установить и перечислить.

Примерами дискретной случайной величиной являются:

– число студентов в аудитории – может быть только целым положительным числом: 0,1,2,3,4….. 20…..;

– цифра, которая появляется на верхней грани при бросании игральной кости – может принимать лишь целые значения от 1 до 6;

– относительная частота попадания в цель при 10 выстрелах – ее значения: 0; 0,1; 0,2; 0,3 …1

– число событий, происходящих за одинаковые промежутки времени: частота пульса, число вызовов скорой помощи за час, количество операций в месяц с летальным исходом и т.д.

Случайная величина называется непрерывной, если она может принимать любые значения внутри определенного интервала, который иногда имеет резко выраженные границы, а иногда – нет *. К непрерывным случайным величинам относятся, например, масса тела и рост взрослых людей, масса тела и объем мозга, количественное содержание ферментов у здоровых людей, размеры форменных элементов крови, р Н крови и т.п.

Понятие случайной величины играет определяющую роль в современной теории вероятностей, разработавшей специальные приемы перехода от случайных событий к случайным величинам.

Если случайная величина зависит от времени, то можно говорить о случайном процессе.

 

Задачи

1. Задают ли законы распределения дискретной случайной величины следующие таблицы?

1) 2)

Х           Х        
Р 0,1 0,4 0,3 0,2   Р 0,1 0,2 0,3 0,5

Ответ: закон распределения задает только первая таблица

2. Дискретная случайная величина Х имеет закон распределения:

Х          
Р Р 1 0,15 Р 3 0,25 0,35

1) Найдите вероятность р 1= Р (Х =3) и р 3= Р (Х =5), если известно, что р 3 в 4 раза больше р 1..

2) Получив ответ на первый вопрос, постройте многоугольник распределения.

Ответ: р 1=0,05; р 3=0,2

3. Плотность распределения случайной величины Х задана функцией

Найдите вероятность того, что значение случайной величины Х принадлежит интервалу (2, 3).

Ответ: 0,2

4.

 
 

График плотности распределения вероятностей случайной величины Х изображен на показанном ниже рисунке.

Запишите аналитическое выражение для плотности вероятностей.

Ответ: f (x) = 0 при | x | > 1
f (x) = x +1 при –1< x ≤0
f (x) = - x +1 при 0< x ≤1)

5. Найдите математическое ожидание дискретной случайной величины, закон распределения которой задан таблицей

Х          
Р 0,1 0,2 0,4 0,2 0,1

Ответ: 5

6. Плотность распределения вероятностей случайной величины Х задана функцией:

Найдите математическое ожидание случайной величины Х.

Ответ: 1,5.

7. Длительность жизненного цикла (в днях) для некоторого растения является случайной величиной Х с функцией плотности вероятности f(x) = при 0≤ х ≤ 200 и f (х) = 0 при любых других значениях х. Определите среднюю длительность жизненного цикла у этого растения.

Ответ: 133,3 дня.

8. Дискретная величина Х имеет закон распределения:

Х   0,4 0,6 0,8  
Р 0,1 0,2 0,4 Р4 0,1

Чему равна вероятность р 4?

Найдите математическое ожидание, дисперсию, стандартное отклонение и моду этой случайной величины.

Ответ: р 4=0,24; М (Х)=0,58; D (X)=0,068; s(Х)=0,26; Мо =0,6).

9. Экспериментальная операция длится не менее 4 мин., но для ее завершения никогда не требуется более 10 мин. Определим случайную величину Т как время, необходимое для выполнения операции и допустим, что функция плотности вероятности для Т имеет вид: f (t) = k (t –4) × (10 – t) на интервале 4 £ t £ 10. Найдите значение постоянной k для этой f (t).

Ответ: 1/36.

10. Найдите числовые характеристики М (Х), D (Х),s(Х) непрерывной случайной величины Х, заданной плотностью вероятности:

f (х) =

Ответ: М (Х) = 2/3; D (Х) = 1/18; s(Х)» 0,24.

11. Запишите плотность распределения для случайной величины Х, распределенной по нормальному закону, если М (Х) = 3, D (Х) = 4.

Ответ:

12. Случайная величина Х распределена нормально с математическим ожиданием М (Х) = 10. Вероятность попадания Х в интервал (10,20) равна 0,3. Чему равна вероятность попадания Х в интервал (0,10)?

Ответ: 0,3.

13. Длина интервала, симметричного относительно математического ожидания, в который с вероятностью 0,9973 попадают значения некоторой случайной величины, распределенной нормально, равна 30 ед. длины. Найдите стандартное отклонение.

Ответ: 5 ед. длины.

14. Диастолическое давления крови у женщин, страдающих гипертонической болезнью, в среднем равно 95 мм рт. ст., стандартное отклонение – 15 мм рт.ст. Определите интервал возможных значений этой величины, считая, что она распределена по нормальному закону.

Ответ: (50 – 140)мм рт.ст.

15. Считая, что случайная величина Х – диаметр лекарственной таблетки – распределена по нормальному закону с параметрами = 10 мм, s= 0,1 мм, найдите интервал, в котором с вероятностью 95,45 % будут заключены эти диаметры. Если в партии 3000 таблеток, то сколько из них окажется в этом интервале?

Ответ: (9,8 – 10,2)мм; 2864 табл.


Глава III

Математические законы теории вероятностей – это математическое выражение реальных закономерностей, которым подчиняются массовые случайные явления. При этом каждое исследование случайных явлений, выполняемое методами теории вероятностей, прямо или косвенно опирается на экспериментальные данные, на результаты испытаний и наблюдений.

Разработка методов получения, описания и анализа экспериментальных данных, определенных в результате исследования массовых случайных явлений, составляет предмет специальной науки – математической статистики. Эти данные принято называть статистическими. Статистические данные часто можно рассматривать как совокупность экспериментальных результатов, которые представляют собой набор возможных значений случайных однородных величин (роста, массы тела, длительности пребывания больного на койке, содержания сахара в крови и т.д.).

Фундаментальными понятиями математической статистики являются генеральная совокупность и выборочная совокупность (выборка). Существуют разные подходы к пониманию смысла этих величин. Мы определяем их так. Генеральная совокупностьэто множество подлежащих статистическому изучению однородных объектов, которые характеризуются определенными качественными или количественными признаками. Например, конечная и реально существующая генеральная совокупность – конкретно выбранная популяция: все жители Беларуси в фиксированный момент времени или только все мужчины, или женщины, или дети. Следующий пример: бесконечная и реально существующая генеральная совокупность – множество действительных чисел, лежащих между 0 и 1.

Чтобы изучить генеральную совокупность по какому-либо из ее количественных признаков Х (острота зрения, показатели анализа крови и т.д.), нужно определить закон распределения данного признака и основные характеристики этого распределения, например, математическое ожидание и дисперсию. Для этого следовало бы изучить все ее объекты и затем обработать полученный массив данных методами теории вероятностей. Однако на практике провести сплошное обследование объектов генеральной совокупности часто физически невозможно и экономически невыгодно. Поэтому обычно исследуется только часть объектов, так называемая выборка.

Совокупность «n» объектов, отобранных из интересующей нас генеральной совокупности для конкретного статистического исследования, называется выборочной совокупностью или выборкой.

Исследование выборки дает некоторое приближенное, оценочное значение интересующего нас параметра, принимающего различные значения для разных выборок. Таким образом, постоянная величина – значение нужной характеристики для генеральной совокупности – заменяется значением случайной величины, полученным по результатам выборки на основании некоторого правила. Поэтому главная цель выборочного метода, основного в математической статистике, – повычисленной характеристике выборки как можно точнее определить соответствующую характеристику генеральной совокупности. Это возможно лишь в том случае, когда отобранная для работы часть объектов репрезентативнацелому, т.е. типична, обладает теми же основными чертами, что и все целое. Иначе говоря, выборка должна быть представительной, т.е. по возможности полнее « представлять » свою генеральную совокупность. Это одно из важнейших требований, предъявляемых к выборке, несоблюдение которого ведет к грубым ошибкам и обесценивает результаты исследования. Например, если при изучении заболеваемости населения республики (генеральная совокупность) ишемической болезнью сердца в качестве выборки будет взята группа студентов, то результаты окажутся ошибочны, поскольку свойства выборки не будут соответствовать свойствам генеральной совокупности, как и в случае, когда в качестве выборки будут взяты только пациенты кардиологического диспансера. Репрезентативность выборки обеспечивается ее достаточным объемом и определенными правилами ее формирования, которые в данном пособии не рассматриваются.

Из многочисленных задач, решаемых математической статистикой, выделим следующие.

1. Определение статистических характеристик выборки (методы описательной статистики).

2. Определение параметров генеральной совокупности по данным выборки: точечные оценки и доверительные интервалы для параметров распределения.

3. Исследование статистической связи между двумя признаками выборочной совокупности (элементы корреляционного анализа).

4. Определение значимости различия между двумя выборочными совокупностями (введение в теорию статистических гипотез).

Таблица 4.

Номер интервала                    
Интервал, масса тела, кг 2,7–2,87 2,87–3,04 3,04–3,21 3,21–3,38 3,38–3,55 3,55–3,72 3,72–3,89 3,89–4,06 4,06–4,23 4,23–4,4
Частота m i                    
mi/n = pi * 0,04 0,08 0,12 0,16 0,21 0,15 0,11 0,07 0,04 0,02
mi/nh 0,235 0,47 0,7 0,94 1,235 0,88 0,65 0,41 0,235 0,118

Контроль: k =10, mi =4+8+12+16+21+15+11+7+4+2=100= n (объем выборки), = 0,04+0,08+0,12+0,16+0,21+0,15+0,11+0,07+0,04+0,02 = 1.

Обобщим изложенный выше материал.

1. Если выборка исследуется по количественному признаку Х, который представляет собой дискретную случайную величину, то статистическим распределением выборки является вариационным статистический ряд – полученные значения признака, записанные в упорядоченном виде с указанием их частот и относительных частот.

2. Если выборка исследуется по количественному признаку Х, который представляет собой непрерывную случайную величину, то статистическим распределением выборки является интервальный статистический ряд. Он включает в себя интервалы вариант, частоты попадания вариант в эти интервалы, относительные частоты, при необходимости – плотности относительных частот для этих интервалов.

В теории ошибок величину

S = (38)

называют средней квадратичной ошибкой прямо измеряемой величины х, величину D х (см. (36)) – её абсолютной ошибкой, а величину e = × 100 % – относительной ошибкой, оценивающей точность измерений.

При косвенных измерениях искомую величину Z вычисляют по некоторой формуле

Z = f(x, y),

где x и y – прямо измеряемые величины.

Число значений x и y, полученных при измерении каждого из них, равно n:

x1, х2, х3, …., хn;

у1, у2, у3, …, уn.

Теперь можно найти их средние арифметические значения:

= , = (39)

и средние квадратичные ошибки:

Sx = ; Sу = , (40)

Среднее арифметическое значение косвенно измеряемой величины вычисляют по формуле

= f (). (41)

Истинное значение ZZ ист. лежит в доверительном интервале:

D Z < Z ист. < + D Z или Zист.= ± DZ. (3.7.5)

Полуширина данного интервала для нормально распределенной величины Z рассчитывается по формуле:

D Z = t g , n . (43)

В (43) средняя квадратичная ошибка Sz косвенно измеряемой величины, равна:

= , (44)

где =Zx´ и =Zy´ – частные производные величины Z=f (x, y), соответственно, по x и по у, вычисляемые при их средних значениях, Sx и Sу – средние квадртичные ошибки величин х и у, значения которых получаются по формулам (40).

Окончательный результат обычно записывается в виде: Z ист. = ± D Z, с указанием выбранного значения g. Приводится так же относительная ошибка косвенно измеряемой величины:

e = × 100 %.

Пример. Рассчитаем случайную ошибку при косвенном измерении вязкости жидкости:

h = h0 ,

где h, r, t – вязкость, плотность и время истечения исследуемой жидкости из капилляра вискозиметра; h0, r0, t 0 – соответственно вязкость, плотность и время истечения эталонной жидкости (воды).

Величины h0, r0 и r считаем точно известными, t и t 0 измеряем секундомером, вязкость исследуемой жидкости – косвенно измеряемая величина.

1. Пять измерений времени истечения исследуемой жидкости и воды дали следующие результаты:

для исследуемой жидкости t = 79, 2с;80,4с;78,0с; 83,6с; 80,2 с;

для воды t 0 = 51,0с; 48,4с; 50,6с; 47,4с; 44,2с.

2. Найдем по (39) средние арифметические значения t и t 0:

= = 80,28 с,

= = 48,32 с.

Определим по (41) среднее арифметическое значение вязкости исследуемой жидкости при: r = 790 , r0 = 998,2 , h0 = 1,0 × 10-3 Па × с:

= h0 ; = 1,0 × 10-3 ×



Поделиться:


Познавательные статьи:




Последнее изменение этой страницы: 2016-09-19; просмотров: 301; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.227.140.100 (0.015 с.)