Дисперсия альтернативного признака 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Дисперсия альтернативного признака



У некоторых признаков вариация проявляется в наличие самого признака. Пример: наличие высшего образование у работника. Либо 1, либо 0.

Доля единиц, обладающих признаком p, не обладающих q.

p+q=1

Применив обычные формулы можно показать, что среднее будет p, а дисперсия p*q

Показатели формы распределения

Полигон распределения – это фактическая кривая распределения, в которой отражаются как общие, так и случайные факторы. Чем более массовым будет наблюдение, тем ближе полигон будет приближаться к кривой нормального распределения (кривая Гаусса – Лапласа).

 Сравнение фактического распределения с нормальным производится на асимметрию и эксцесс


1) Асимметрия Пирсона

2)


Если асимметрия <0.5, то незначительна и нетипично.

Помимо симметричности проводится сравнение фактического распределения с нормальным на островершинность. Чем больше острота, тем надежнее средняя величина

Показатели дифференциации

- характеризуют структуру вариационного ряда. Называются градиентами (квантили) и делят совокупность на равное заданное число частей.

1) на две части – медиана

2) на 4 части – квартили

3) на 10 частей – децили

Разница с медианой в коэффициенте Q3 – 0.75

Все остальные рассчитываются аналогично медиане.

Интерпретация градиентов

Q1 – первый квартиль: 25% имеют значения принципа меньше Q1, а 75 больше. Остальные по аналогии.

Пример:

В среднем зарплата каждого работника отклоняется от средней зарплаты на 11,4 тыс. руб.

Коэффициент вариации = 32,2% - данные однородны, среднее надежно.

Коэффициент асимметрии Пирсона

 

Выборочное наблюдение

Основные понятия теории выборочного метода:

Выборочное наблюдение – наблюдение, при котором обследуется часть единиц совокупности, отобранных случайным образом.

Совокупность из которой производится отбор называется генеральной.

Отобранные единиц формируют выборочную совокупность или выборку

  Генеральная совокупность Выборка
Объем совокупности N n
Число единиц, обладающих определенным признаком M m
Среднее квадратическое отклонение s
Средняя величина
Доля единиц, обладающих определенным признаком

Преимущества выборочных обследований:

1) Меньше стоимость

З(общ)=Зо + Зп*n

Зо – начальные затраты

Зп – затраты на единицу совокупности

Зо для выборки > Зо для сплошного наблюдения

Поэтому экономическая выгода от выборочных обследований имеет смысл только в случае их регулярного проведения.

2) Короче сроки проведения обследования и обработки результатов

3) Шире область применения

При решении ряда прикладных задач выборочное обследование является единственным возможным. (Пример: исследование спроса: ген. совокупность не известна в принципе)

4) Больше достоверности (тщательнее контроль собираемых данных)

 

Проблемы выборочных обследований:

1) Методологическая сложность. (Сложный мат. аппарат; затраты на хранение данных, программисты высокого уровня, подготовленный персонал, стоимость оборудования)

2) Полученные данные всегда содержат ошибку, о которой мы можем судить только с определенной вероятностью.

3) Психологические проблемы, связанные с негативным отношением к выборке со стороны заказчика.

 

Виды отбора единиц в выборку:

1) Собственно-случайный (простой)

Это отбор, при котором каждая единица имеет равную вероятность быть отобранной.

Может быть:

· Возвратным (повторным). Принцип равной вероятности

· Безвозвратным

Технически простую случайную выборку получают, используя генератор случайных чисел, либо используя механический отбор, когда отбирается каждая k-я единица (k – шаг отбора; k=N/n либо устанавливает исследователь)

2) Расслоенный (типический, стратифицированный)

Это отбор, основанный на группировке единиц по одному или нескольким признакам. Таким образом повышается репрезентативность выборки, то есть представительность пропорций ген. совокупности.

При проведение стратифицированной выборки встает вопрос сколько единиц в каждой группе нужно обследовать.

Три варианта:

· Равное: n1=n2=…=ni (Применяется, когда о ген. совокупности нет сведений)

· Пропорциональное: ni/n(общ)=Ni/N(общ)

· Оптимальное (Чупрова - Неймана)

Nj- численность группы в ген. совокупности

- среднее квадратическое отклонение по случайному порядку в группе

3) Серийный (гнездовой)

Состоит в выборке не отдельных единиц, а их групп (гнезд). Попавшая в выборку группа подвергается сплошному наблюдению. Пример: микроперепись населения (каждый 20-ый дом).

4) Комбинированные виды отбора:

· Многоступенчатый

· Многофазный

Ошибки выборки

Разница между ген. средней и выборочной средней

Ошибки:

· Регистрации

Присущи любому виду наблюдения. Выявляются только методами логического и арифметического контроля.

· Репрезентативности:

o Систематические (связаны с нарушением правила отбора единиц в выборку или некорректным проведением)

o Случайные

Средняя ошибка выборки

- расхождение между генеральным и выборочным параметром

Поскольку из ген. совокупности можно взять много выборок, рассчитывается средняя возможная ошибка выборки.

Формулы для определения средней ошибки выборки:

  Возвратный Безвозвратный
Для средней
Для доли

 

Предельная ошибка выборки

Поскольку в каждой отдельной выборке отклонение между ген. и выборочной средней может быть больше средней ошибки дополнительно рассчитывают предельную ошибку выборки, которая показывает в каких границах будет находится оцениваемый параметр.

Определяется по таблицам интеграла вероятностей Лапласа.

F(x) t
0,683 1
0,95 1,96
0,954 2
0,988 2,5
0,997 3

 

Таким образом, например, зная выборочную среднюю, можно утверждать, что отклонение средней в ген. совокупности с вероятностью 95,4 % не превысит среднюю ошибку.

Зная предельную ошибку выборки рассчитывают границы доверительных интервалов для оцениваемых параметров.

 <5% то удачная

Определение необходимой численности выборки – это основной вопрос при планировании выборки. Для расчета n используют формулу предельной ошибки выборки:


S^2 – используются данные предыдущего обследования или проводится пилотное обследование

дельта – допустимый размер ошибки


В случае доли берут максимально возможное значение дисперсии альтернативного признака (0,25)

Формулы для определения необходимой численности выборки

Оцениваемый параметр Возвратный Безвозвратный
Средняя
Доля

 



Поделиться:


Последнее изменение этой страницы: 2021-07-18; просмотров: 89; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.219.213.196 (0.018 с.)