Выборочный метод. Группировка данных 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Выборочный метод. Группировка данных



Для того чтобы получить наиболее полную информацию об изучаемом явлении, необходимо анализировать результаты не отдельных наблюдений, а множества однородных наблюдений. Результаты отдельных наблюдений могут оказаться случайными, неполно выражать сущность изучаемого явления. Очевидно, что наблюдаемые объекты обладают множеством признаков; однако, поставив своей задачей изучение лишь одного признака, мы тем самым полагаем, что в отношении остальных объекты равноправны, то есть множество объектов однородно.

Некоторое множество относительно однородных объектов, объединяемых по тому или иному признаку для совместного изучения, называется статистической совокупностью. Отдельные объекты статистической совокупности называются членами совокупности.

Генеральной совокупностью называется совокупность всех объектов, подлежащая изучению.

Выборочной совокупностью или выборкой называется совокупность случайно отобранных объектов из генеральной совокупности.

Объемом совокупности (выборочной или генеральной) называется число объектов этой совокупности (в дальнейшем, N — объем генеральной совокупности, n — объем выборки).

При формировании выборки объект, над которым производилось наблюдение, может быть возвращен либо не возвращен в генеральную совокупность. В соответствии с этим выборки делятся на повторные и бесповторные.

Выборка называется повторной, если отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.

Выборка называется бесповторной, если отобранный объект (перед отбором следующего) не возвращается в генеральную совокупность. На практике обычно пользуются бесповторным случайным отбором.

Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы свойства объектов выборки правильно отражали свойства объектов генеральной совокупности и структуру генеральной совокупности, т.е. выборка должна правильно представлять пропорции генеральной совокупности. Другими словами, выборка должна быть репрезентативной (представительной). Репрезентативность выборки достигается, если ее производят случайным образом (т.е. все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку).

Виды признаков

Способы обработки данных зависят от характера исследуемого признака. Признаки делятся на качественные и количественные. Отдельные значения качественного признака выражаются понятиями, наименованиями, свойствами (специальность, национальность, место работы, тип темперамента и т.п.), количественного – числами (возраст, стаж работы, размер заработной платы, время написания теста, уровень интеллекта и т.п.).

Количественный признак может быть дискретным и непрерывным. Дискретный признак принимает только отдельные изолированные значения, без промежуточных значений между ними, эти значения можно пронумеровать. Признак, который может принимать любые значения из некоторого числового промежутка, называется непрерывным.

В дальнейшем будем использовать обозначения:

Х – изучаемый признак или случайная величина,

– наблюдаемые значения признака или варианты.

Первичным результатом статистического исследования является простой статистический ряд. Он представляет собой перечень членов совокупности и соответствующих им значений признака.

Для группировки данных в случаеколичественного дискретного признака все варианты располагают в порядке возрастания и указывают частоты , с которыми они встречаются в данной совокупности. Частота варианты показывает, сколько раз варианта встречается в вариационном ряду.

Дискретным вариационным рядом называется последовательность вариант , расположенных в порядке возрастания ( < < … < ), и соответствующих им частот :

 

Варианта Частота
 

 

Отметим, что сумма всех частот вариационного ряда равна объему выборки n.

Относительной частотой р * варианты называется отношение ее частоты к объему выборки n:

 

.

 

Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительных частот.

Графическое изображение дискретного вариационного ряда называется полигоном. Полигон частот – ломаная, отрезки которой последовательно соединяют точки с координатами , , …, . Можно также строить полигон относительных частот.

При группировке данных в случае количественного непрерывного признака (или дискретного признака, когда число вариант велико) строят интервальный вариационный ряд. Интервальным вариационным рядом называется упорядоченная последовательность интервалов изменения признака вида и соответствующих им частот. Частотой интервала называется количество вариант, попавших в этот интервал. Для построения интервального вариационного ряда определяют ширину интервала, составляют шкалу интервалов и в соответствии с ней группируют результаты наблюдений. Для определения ширины интервала h используют формулу Стерджесса:

 

,

 

–максимальная варианта,

–минимальная варианта,

n – объем выборки.

 

За начало первого интервала рекомендуется принимать величину, равную . Левый конец каждого интервала равен правому концу предыдущего интервала. Максимальная варианта должна попасть в последний интервал.

 



Поделиться:


Последнее изменение этой страницы: 2016-12-30; просмотров: 708; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.173.112 (0.008 с.)