Тема 2. Описательная статистика 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема 2. Описательная статистика



Задача описательной статистики — «сжать» исходный массив, представить его небольшим набором числовых характеристик, которые концентрированно выражают свойства изучаемых совокупностей.

Как произвести группировку совокупности с определением числа групп k?

1. Выбор группировочного признака: в зависимости от вида группировочных признаков различают группировки по количественным и качественным признакам;

2. Определение числа групп:

· Если в основании группировки качественный признак, то количество групп = количеству значений этого признака;

· Если в основании группировки лежит количественный признак, то число групп определяют по формуле Стёрджеса.

Правило Стёрджеса - правило определения оптимального количества интервалов, на которые разбивается наблюдаемый диапазон изменения случайной величины.

𝑘 = 1 + log2𝑁 ≈ 1 + 1.44 𝑙𝑛𝑁 ≈ [1 + 3.322  lgN],

где k — число групп,

N — число единиц совокупности (кол-во наблюдений).

Статистический ряд —таблица соответствия элементов выборки частотам их появления.

Обозначения

N – число единиц совокупности (кол-во наблюдений);

k – число групп;

l – индекс группы;

 — граница полуинтервала, l = 0, 1,…,k;

 — частота признака (группы);

– — размер (длина) полуинтервала (в случае если полуинтервалы одинаковы);

– — относительная частота признака (оценка вероятности попадания значений признака в l-й полуинтервал);

– — плотность относительной частоты (оценка плотности вероятности);

=  =  — накопленная относительная частота (оценка вероятности того, что значение признака не превысит  , т.е. =P (x≤ )).

полигон
гистограмма
кумулята
f, F
1
z
Гистограмма, кумулята, полигон

Гистограмма — графическое изображение плотностей частоты  — график ступенчатой функции, т.к. плотности частот неизменны на каждом полуинтервале.

Кумулята — графическое изображение накопленных частот  — кусочно-линейная функция, т.к. накопленные частоты линейно растут на каждом полуинтервале.

Полигон — графический образ плотностей частоты  — образован отрезками, соединяющими середины «ступенек» гистограммы. При этом 1-й отрезок соединяет середину 1-й «ступеньки» с точкой  оси абсцисс, последний отрезок – середину последней «ступеньки» с точкой .

 

Рисунок 5. Графическое изображение плотностей частоты

Характеристики изучаемой величины

Квантиль (квантиль уровня F) ( ) — число, вероятность оказаться левее которого равна F. .

Пусть l -й полуинтервал такой, что , тогда в случае, если размеры полуинтервалов одинаковы

Квартили — делят совокупность на 4 равные части — x0.25, x0.5, x0.75;

Децили — x0.1,…, x0.9;

Процентили — x0.01,…, x0.99;

 

Моменты

Моментом q-го порядка относительно c признака x называют величину

m(q,c) =

Таблица 5

Виды моментов



Поделиться:


Последнее изменение этой страницы: 2021-05-12; просмотров: 79; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 13.59.100.42 (0.006 с.)