Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Еще раз об «ошибке измерения» и ее вычислении

Поиск

В заключение еще раз отметим, что расчет ошибок в малой выборке мало отличается от аналогичных вычислений в большой выборке. Различие заключается в том, что при малой выборке вероятность нашего утверждения несколько меньше, чем при большой выборке. Во многих случаях расхождения между найденными пределами могут достигать значительных размеров, что вряд ли удовлетво­ряет исследователей. Поэтому малую выборку следует применять в статистическом исследовании медицинских явлений с большой осторожностью, при соответствующем теоретическом и практическом обосновании.

Стандартная ошибка выборки дает некоторое представление об ошибке репрезентативности, т.e. об ошибке, с которой выборочная средняя представляет действительное значение генеральной средней. Именно она показывает, какова будет ошибка в среднем, если из одной и той же генеральной совокупности сделать много выборок одинакового объема. Однако в каждой конкретной выборке ошибка может существенно отличаться от стандартной ошибки. т.е. нет гарантии, что ошибка, которая действительно была допущена в конкретном выборочном исследовании, не превышает средней ошибки.

Поэтому гораздо полезнее было бы знать те границы, в которых «практически наверняка» находится действительная ошибка, допущенная в данной конкретной выборке. Эти границы (пределы) называют предельной ошибкой выборки (обозначим ее Δx). Предельная ошибка выборки показывает тот предел, которого практически наверняка не превосходит действительная ошибка. Иначе говоря, предельная ошибка Δx показывает действительно допущенную ошибку с избытком, с превышением (возможно, очень значительным) и тем самым гарантирует, что действительная ошибка не превосходит Δx.

Можно сказать, что ошибкой измерения будет являться разность между выборочным средним и математическим ожиданием а (истинным средним значением или средним в генеральной совокупности). Различие между ними = ç а - ç является ошибкой измерения истинного среднего. Величина такого интервала вычисляется по формуле Dх= tpk S `X. Т.о. для нахождения предельной ошибки измерения при заданной надежности (или уровне значимости) нужно стандартную ошибку умножить на критерий Стьюдента. Критерий Стьюдента может быть найден не только по таблице, но и с помощью модуля Вероятностный калькулятор пакета Statistica.

Формулу предельной ошибки можно записать и так:

Или :

Например, результат оценки истинного значения случайной величины «вес человека» по выборочным данным записывается таким образом:

а = 72,6 ± 1,2 (кг) с вероятностью 95 %.

 

При вычислении ошибки величина tp,k зависит от заданной доверительной вероятности. В медицине и биологии обычно используется достаточно высокая доверительная вероятность (надежность): 95 %, 99 % и 99,9 %.

Если при оценке вариабельности признака мы говорили, что 68% случайных величин накрывается σ-м интервалом, примерно 95% накрываются 2σ-м интервалом, а практически 99,8% накрываются 3σ-м интервалом, то в данном случае мы можем утверждать, что при превышении стандартной ошибки в 2 раза доверительный интервал будет с вероятностью 95% накрывать математическое ожидание СВ, а при превышении стандартной ошибки в 3 раза, доверительный интервал накрывает математическое ожидание (истинное значение) с надежностью в 99,8%.

Из анализа таблицы Стьюдента и приведенных примеров следует важный вывод: если проведено мало опытов n, то нельзя надеяться на высокую надежность результатов испытаний.
В настоящее время малая выборка используется более широко, чем раньше. Этот метод применяют при изучении рыночных структур, при выборочной проверке качества продукции, в научно-исследовательской работе, медицинских обследованиях и в ряде других случаев.

Распределение, отклоняемое от нормального, его числовые характеристики

Когда распределение интересующего нас признака не симметрично относительного среднего, в выборке существуют выбросы, то распределение признака нужно описывать с помощью медианы и процентилей. Рассмотрим основные понятия, по которым принимается строгое решение о том, является ли распределение нормальным или нет, а также числовые характеристики несимметричного распределения случайной величины.

Асимметрия (Skewness):

Коэффициент асимметрии является безразмерной величиной и равен нулю у симметричных распределений. Если распределение имеет длинную часть, расположенную справа от вершины, то асимметрию называют положительной, а распределение с длинной частью кривой плотности, расположенной слева от вершины, называют отрицательной асимметрией.

Эксцесс (Kurtosis):

Коэффициент эксцесса количественно характеризует островершинность распределения. Для нормального распределения он равен нулю. Кривые распределения с острой вершиной имеют положительный эксцесс, а с плоской – отрицательный.

Если величины указанных показателей близки к нулю (не более 0,5), то распределение можно считать нормальным. Также их сравнивают с собственными ошибками. Асимметрия и эксцесс не должны превышать более чем втрое свои ошибки репрезентативности. Т.е. они должны быть примерно одного порядка. При соблюдении этого требования, распределение можно считать нормальным

Квартили –это 3 точки значения признака, которые делят упорядоченное (по возрастанию) множества наблюдений на 4 равные по численности части. Первый квартиль соответствует 25-му процентилю, второй – 50-му процентилю или медиане, третий квартиль соответствует 75-му процентилю.

Рис. 1.13

Рис. 1.14

Максимум –это наибольшее значение в выборке.

Медиана – это значение признака, которое делит упорядоченное (ранжированное) множество данных пополам так, что одна половина всех значений оказывается меньше медианы, а другая - больше. Это второй квартиль (Рис. 1.13 и 1.14).

Минимум –это наименьшее значение в выборке.

Мода - единственный параметр положения для описания качественных номинальных признаков (Mo) - это такое числовое значение, которое встречается в выборке наиболее часто. Моде или модальному интервалу признака, соответствует наибольший подъем (вершина) графика распределения частот. Моду можно вычислять и для качественных порядковых признаков.

Процентили - это 99 точек - значений признака, которые делят упорядоченное (по возрастанию) множество наблюдений на 100 частей, равных по численности. Иначе говоря, первый квартиль - это 25-й процентиль, второй квартиль – это 50-й процентиль, а третий квартиль – это 75-й процентиль.

Размах (разброс) – это разность между максимальной и минимальной величинами конкретного вариационного ряда. Чем сильнее варьирует измеряемый признак, тем больше величина размаха, и наоборот.

Диаграмма размаха – этографическое представление несимметрично распределенных величин. Она выглядит так:

Изображённые на диаграмме варианты значения переменной (V) при определенных процентилях (квартилях) могут быть записаны следующим образом:

Значения медианы V0,5=1,3 (иногда пишут Me=1,3); значение 25-го процентиля V0,25=0,85; значение 75-го процентиля V0,75=1,6.



Поделиться:


Последнее изменение этой страницы: 2016-04-08; просмотров: 540; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.116.12.7 (0.007 с.)