Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности.



Ошибки регистрации возникают из-за неправильных или неточных сведений. Их источником является невнимательность регистратора, неправильное заполнение формуляров, описки или же непонимание существа исследуемого вопроса.

Ошибки репрезентативности возникают вследствие несоответствия структуры выборки структуре генеральной совокупности. Источником их существования является разная вариация признака у статистических единиц, в результате которой распределение единиц в выборочной совокупности отличается от распределения единиц в генеральной совокупности. Ошибки репрезентативности делятся на систематические и случайные.

Предположим, m — генеральная совокупность, обладает среднестатистической характеристикой xген Это может быть средний возраст, доход и количество испытывающих счастье. Предположим далее, что из генеральной совокупности m отобрана совокупность п — выборочная, которая обладает средней характеристикой хвы6 Ясно, что п < т. Тогда задача заключается в сопоставлении xген и хвы6 Отклонение выборочной средней от генеральной средней называется ошибкой выборки:

 

Систематические ошибки репрезентативности возникают из-за неправильного формирования выборки, при котором нарушается основной принцип научно организационной выборки – принцип случайности. На практике принцип случайности соблюсти очень сложно, а иногда просто невозможно, что приводит к появлению систематической ошибки, которые возникают «из-за неполной объективности выборки генеральной совокупности (недостаток информации о генеральной совокупности, отбор наиболее «удобных» для исследования элементов генеральной совокупности), а так же из-за несоответствия выборки целям и задачам исследования». Иногда такие ошибки называют ошибками смещения

Случайные ошибки репрезентативности означают, что даже при соблюдении принципа случайности отбора единиц, расхождения между характеристиками выборки и генеральной совокупности все же имеют место.

 

 

Оценочная функция

Величина, подсчитанная по специальной формуле, которая на основе наблюдений выборки оценивает (даёт приближённое значение) истинную величину некоторого параметра выборки.

Свойства оценок

Состоятельность

Любая оценка p (x) параметра p есть статистика, т.е. случайная величина. И как всякая случайная величина она обладает собственной функцией распределения, математическим ожиданием, дисперсией и т.д. Все эти характеристики позволяют сравнивать разные оценки, судить об их свойствах и качествах. Ниже следует краткий обзор основных свойств оценок.

Оценка p (x) называется состоятельной, если она сходится по вероятности к значению оцениваемого параметра p при безграничном возрастании объема выборки I. Точнее, статистика p (x) является состоятельной оценкой параметра p тогда и только тогда, когда для любого положительного числа ε справедливо

.

Большинство оценок, используемых в практических приложениях, являются состоятельными.

Содержание

Смещенность

Несмещённая оце́нка в математической статистике — это точечная оценка, математическое ожидание которой равно оцениваемому параметру.

Оценка p (x) называется несмещенной, если

E[ p (x)]= p.

Смещенные оценки часто встречаются в приложениях. Например, МП-оценка дисперсии нормального распределения (14) является смещенной

.

Для несмещенных оценок мерилом их точности является дисперсия V[ p (x)] – чем она меньше, тем лучше. Для смещенных оценок нужно использовать математическое ожидание квадрата смещения

d (x)= E[ p (x) – p)2].

Имеет место формула

d (x)= V[ p (x)]+{E[(p (x)] – p)}2 . (15)

Содержание

Эффективность

Несмещенная оценка называется эффективной, если она имеет наименьшую возможную дисперсию. Оценки (14) нормального распределения являются эффективными, но вот выборочная оценка медианы (см. раздел 3.7) таковой не является – она менее эффективно оценивает m, чем выборочное среднее.

Смещенные оценки могут оказаться более точными, чем несмещенные. Это означает, что часто можно построить такие смещенные оценки, для которых квадрат ошибки меньше, чем наименьшая эффективная дисперсия. На этом принципе основаны такие методы оценивания как PCR, PLS и др.

Содержание

Робастность

Под робастностью в статистике понимают нечувствительность к различным отклонениям и неоднородностям в выборке, связанным с теми или иными, в общем случае неизвестными, причинами [1][2]. Это могут быть ошибки детектора, регистрирующего наблюдения, чьи-то добросовестные или намеренные попытки «подогнать» выборку до того, как она попадёт к статистику, ошибки оформления, вкравшиеся опечатки и многое другое. Например, наиболее робастной оценкой параметра сдвига закона распределения является медиана, что на интуитивном уровне вполне очевидно (для строгого доказательства следует воспользоваться тем, что медиана является усечённой М-оценкой, см. ниже) [1]. Помимо непосредственно «бракованных» наблюдений также может присутствовать некоторое количество наблюдений, подчиняющихся другому распределению. Ввиду условности законов распределений, а это не более, чем модели описания, сама по себе выборка может содержать некоторые расхождения с идеалом.

 

Робастность оценки – это важная характеристика, которая, однако, плохо поддается формализации.

Оценка p (x) называется робастной, если она устойчива к наличию выбросов в выборке.

Как правило, эффективные оценки являются менее робастными, чем неэффективные. Выбирая более устойчивую оценку, мы расплачиваемся за это эффективностью.

Для нормального распределения робастной оценкой среднего значения является медиана.

 



Поделиться:


Последнее изменение этой страницы: 2016-08-10; просмотров: 912; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.116.36.192 (0.007 с.)