Вероятность и случайные величины 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Вероятность и случайные величины



Важнейший частный случай применения «вероятности» — вероятность получения в результате испытания или наблюдения того или иного числового значения некоторой измеряемой (наблюдаемой) величины. Предполагается, что до проведения испытания (наблюдения) точное значение этой величины неизвестно, то есть имеется явная неопределенность, связанная обычно (за исключением квантовой физики) с невозможностью учета всех факторов, влияющих на результат. Такие величины называют случайными. В современной теории вероятностей понятие случайной величины формализуется и она определяется как функция «случая» — функция на пространстве элементарных событий. При таком определении наблюдаются не сами элементарные события, а «реализации», конкретные значения случайной величины. Например, при подбрасывании монетки выпадает «решка» или «орел». Если ввести функцию, ставящую в соответствие «решке» — число 1, а «орлу» — 0, то получим случайную величину как функцию указанных исходов. При этом понятие случайной величины обобщается на функции, отображающие пространство элементарных событий в некоторое пространство произвольной природы, соответственно можно ввести понятия случайного вектора, случайного множества и т. д. Однако, обычно под случайной величиной подразумевают именно числовую функцию (величину).

Отвлекаясь от описанной формализации под пространством элементарных событий можно понимать множество возможных значений случайной величины. Сигма-алгеброй подмножеств являются произвольные интервалы на числовой оси, их всевозможные (счетные) объединения и пересечения. Вероятностную меру называют в данном случае распределением случайной величины. Достаточно задать вероятностную меру для интервалов вида , поскольку произвольный интервал можно представить как объединение или пересечение таких интервалов. Предполагается, что каждому интервалу вышеуказаного вида поставлена в соответствие некоторая вероятность , то есть некоторая функция возможных значений . Такую функцию называют интегральной, кумулятивной или просто функцией распределения случайной величины. В случае дифференцируемости этой функции (в этом случае соответствующие случайные величины называются непрерывными) вводится также аналитически часто более удобная функция — плотность распределения — производная функции распределения: . В случае дискретных случайных величин вместо плотности (она не существует в этом случае) можно использовать непосредственно ряд распределения — вероятность -го значения. Соответствующая функция распределения будет связана с рядом распределения как: . Вероятность того, что случайная величина окажется в некотором интервале определяется как разность значений функции распределения на концах этого интервала. Через плотность распределения — это соответствующий интеграл от плотности на данном интервале (для дискретной случайной величины — просто сумма вероятностей значений из этого интервала).

Доска Гальтона — демонстрирует нормальное распределение

Распределение случайной величины дает её полную характеристику. Однако, часто используют отдельные характеристики этого распределения. В первую очередь это математическое ожидание случайной величины — среднее ожидаемое значение случайной величины с учетом взвешивания по вероятностям появления тех или иных значений, и дисперсия или вариация — средний квадрат отклонения случайной величины от её математического ожидания. В некоторых случаях используются и иные характеристики, среди которых важное значение имеют асимметрия и эксцесс. Описанные показатели являются частными случаями так называемых моментов распределения.

Существуют некоторые стандартные законы распределения, часто используемые на практике. В первую очередь — это нормальное распределение (распределение Гаусса). Оно полностью характеризуется двумя параметрами — математическим ожиданием и дисперсией. Его широкое использование связано, в частности, с так называемыми предельными теоремами (см. ниже). При проверке гипотез часто возникают распределения Хи-квадрат, распределение Стьюдента, распределение Фишера. При анализе дискретных случайных величин рассматриваются биномиальное распределение, распределение Пуассона и др. Также часто рассматривается гамма-распределение, частным случаем которого является экспоненциальное распределение, а также указанное выше распределение Хи-квадрат Естественно, используемые на практике распределения не ограничиваются только этими распределениями.

Часто на практике исходя из априорных соображений делается предположение, что распределение вероятностей данной случайной величины относится к некоторому известному с точностью до параметров распределению. Например, к тому же нормальному распределению, но с неизвестным математическим ожиданием и дисперсией (эти два параметра однозначно определяют все нормальное распределение). Задачей статистических наук (математическая статистика, эконометрика и т. д.) в таком случае является оценка значений этих параметров наиболее эффективным (точным) способом. Существуют критерии, с помощью которых можно установить степень «истинности» соответствующих методов оценки. Обычно требуется как минимум состоятельность оценки, несмещенность и эффективность в некотором классе оценок.

На практике применяются также непараметрические методы оценки распределений.

ЧУВСТВИТЕЛЬНОСТЬ И СПЕЦИФИЧНОСТЬ (SENSITIVITY AND SPECIFICITY).
Чувствительность — это доля действительно болеющих людей в обследованной популяции, которые по результатам теста выявляются как больные. Чувствительность — это мера вероятности того, что любой случай болезни (состояния) будет идентифицирован с помощью теста. В клинике тест с высокой чувствительностью полезен для исключения диагноза, если результат отрицателен.
Специфичность — это доля тех, у которых тест отрицателен, среди всех людей, не имеющих болезни (состояния). Это мера вероятности правильной идентификации людей, не имеющих болезни, с помощью теста. В клинике тест с высокой специфичностью полезен для включения диагноза в число возможных в случае положительного результата. Отношения состояния и признака показаны в четырехпольной таблице:

Результаты теста Подлинный статус Всего


Больные Здоровые


Положительный а b a + b

Отрицательный c d c + d

Всего a + c b + d a + b + c + d

a. Больные, выявленные с помощью теста
(истинно положительные)
b. Здоровые, имеющие положительный результат теста
(ложно положительные)
c. Больные, не выявленные с помощью теста
(ложно отрицательные)
d. Здоровые, имеющие отрицательный результат теста
(подлинно отрицательные)


Чувствительность = а разделенное на (а+с)
Специфичность = d разделенное на (b+d)
Прогностичность положительного результата = а разделенное на (а+b)
Прогностичность отрицательного результата = d разделенное на (с+d)

Риск – это вероятность появления определенного исхода, например, болезни или травмы. Риск может принимать значения от 0 (вероятность наступления исхода отсутствует) до 1 (во всех случаях ожидается неблагоприятный исход). В медицинской статистике, как правило, изучаются изменения риска наступления исхода в зависимости от какого-либо фактора. Пациенты условно разделяются на 2 группы, на одну из которых фактор влияет, на другую – нет.

Относительный риск – это отношение частоты исходов среди исследуемых, на которых оказывал влияние изучаемый фактор, к частоте исходов среди исследуемых, не подвергавшихся влиянию этого фактора. В научной литературе часто используют сокращенное название показателя - ОР или RR (от англ. "relative risk").



Поделиться:


Последнее изменение этой страницы: 2016-08-10; просмотров: 350; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.119.135.202 (0.008 с.)