Распределение частот количественного признака. Гистограмма, кумулята, полигон. Характеристики центра распределения: среднее, медиана, мода. Квантили 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Распределение частот количественного признака. Гистограмма, кумулята, полигон. Характеристики центра распределения: среднее, медиана, мода. Квантили



Вопросы и задания

• В чем заключается задача описательной статистики?

• Как произвести группировку совокупности с определением числа групп k?

• При помощи каких характеристик можно описать ряд наблюдений?

• Чем отличается генеральная совокупность от выборочной?

• Чем отличаются гистограмма, кумулята и полигон?

• Что отличает медиану от моды и средней?

• В каком отношении находятся медиана, мода и среднее между собой?

• Перечислите основные виды квантилей.

Задачи

1. Для открытия магазина определить, какие товары завозить (дешевые или дорогие). Дана выборка о доходах одного члена семьи (20 семей) в усл.ед./мес. проживающих в этом районе.

1 2 3 4 5 6 7 8 9 10
Усл. ед. 550 600 600 700 720 810 750 780 830 840
  11 12 13 14 15 16 17 18 19 20
Усл. ед. 900 898 930 1010 1000 980 1100 1200 1300 1500

Провести анализ на основе описательной статистики данного ряда:

1. Построить статистический ряд.

2. Определить характеристики центра распределения (среднее арифметическое, моду и медиану, квантиль F = 0.3)

3. Построить графики гистограммы, полигона и кумуляты.

4. Построить гистограмму с помощью пакета Excel.

Решение:

1. Построим статистический ряд:

Пусть:  – минимальное значение

 – максимальное значение

Разделим совокупность на группы:

Ni

Доход по возрастанию

l

zl

(zl-1;zl ]

Nl

0

 

0

500

(0;500]

0

1

550

1

700

(500;700]

4

2

600

3

600

4

700

5

720

2

900

(700;900]

8

6

750

7

780

8

810

9

830

10

840

11

898

12

900

13

930

3

1100

(900;1100]

5

14

980

15

1000

16

1010

17

1100

18

1200

4

1300

(1100;1300]

2

19

1300

20

1500

5

1500

(1300;1500]

1

На основе данных совокупности построим статистический ряд, используя формулы:

 

l

zl

(zl-1;zl ]

Nl

α l

Fl

f l

0

500

(0;500]

0

0

0

0

1

700

(500;700]

4

0.2

0.2

0.001

2

900

(700;900]

8

0.4

0.6

0.002

3

1100

(900;1100]

5

0.25

0.85

0.00125

4

1300

(1100;1300]

2

0.1

0.95

0.0005

5

1500

(1300;1500]

1

0.05

1.00

0.00025

Δ l =200 N=20

2) Определим характеристики центра распределения:

продолжим таблицу статистического ряда, дополнив ее средним по группе l ( :

0

500

0

0

0

0

0

1

700

4

0.2

0.2

0.001

600

2

900

8

0.4

0.6

0.002

800

3

1100

5

0.25

0.85

0.00125

1000

4

1300

2

0.1

0.95

0.0005

1200

5

1500

1

0.05

1.00

0.00025

1400

20

880

Заполним таблицу характеристик центра распределения:

Характе-ристики

Формула

Расчет Примечание

Средне-взвешенная

 

Мода

Выбираем наибольший

Квантиль

Выбираем полуинтервал, в котором

Медиана

Выбираем полуинтервал, в котором

2. Дан ряд наблюдений за случайной величиной.

Построить статистический ряд без предварительной группировки. Найти среднее взвешенное, моду и медиану.

Решение:

Определим значения границ полуинтервалов по формулам:

где  вариационный ряд (ряд, упорядоченный по возрастанию элементов).

На основе данных совокупности построим статистический ряд, используя формулы:

0

0.5

0

1

1

1

1.5

1

0.2

0.2

0.17

1

0.17

2

2

2

3.5

3

0.5

0.7

0.25

2.5

1.25

2

5

3

5.5

1

0.2

0.8

0.08

4.5

0.75

2

6

4

6.5

1

0.2

1.0

0.17

6

1.00

5

6

3.17

6

Заполним таблицу характеристик центра распределения:

Характе-ристики

Формула

Расчет Примечание

Средне-взвешенная

 

Мода

Выбираем наибольший  

Медиана

Выбираем полуинтервал, в котором

3. Дан ряд наблюдений за случайной величиной.

Построить статистический ряд без предварительной группировки. Найти среднее взвешенное, моду и медиану.

4. Задан ряд наблюдений за переменной  Подсчитать основные статистики данного ряда. (Среднее арифметическое, медиану, моду)

 

5. Выведите формулу расчета медианы для эмпирического распределения случайной величины x:

,

Используя рисунок, приведенный ниже (через подобия треугольников).

 

6. В эмпирическом распределении z0 = 0, все дельты = 1,

F3 = 0.21, F4 = 0.4, F5 = 0.6, F6 = 0.77. Чему равны медиана и мода?

PS: , следовательно:

Ответ:

 

7. Дана функция распределения F (x) = . Найдите медиану и моду данного распределения.

Ответ:

 

8. Найдите значение 30%-го квантиля, если известно эмпирическое распределение:

Границы интервалов 10-15 15-20 20-25 25-30
Частоты 1 3 4 1

Ответ:

9. Дана достаточно большая выборка. Средняя и мода ее равны, соответственно, 10 и 4. Найдите значение медианы.

Решение

Согласно свойству, для больших выборок:

Согласно свойству, соответствующему правой асимметрии:

Следовательно, , т.к.

Ответ: .

10. Дана достаточно большая выборка. Медиана и мода ее равны, соответственно, 8 и 4. Найдите значение средней.

11. *Определить вид экономической деятельности для своего региона и для РФ, у которого численность занятых за 20**г будет иметь:

1. наибольшее значение;

2. наименьшее значение;

3. наиболее близкое к среднему значение;

4. медианное значение.

Построить 2 гистограммы численности занятых за 20**г по каждому виду экономической деятельности, 1-ю для своего региона, а 2-ю для РФ.

Данные искать на сайте ЕМИСС (https://www.fedstat.ru/).

В строку поиска ввести: Среднесписочная численность работников по полному кругу организаций.

Тест

1. Графический образ плотностей частоты называется

a) полигоном

b) асимметрией

c) кривой Гаусса

d) полуинтервалом

2. Какими правилами можно пользоваться при выборе размера полуинтервалов?

a) правилом Фридмена-Диакониса

b) правилом Скотта

c) правилом Кетле

d) правилом Синклера

3. В каких случаях вместо среднего значения лучше использовать моду или медиану в качестве центральной тенденции?

a) если распределение асимметрично

b) если распределение является симметричным и унимодальным

c) если присутствуют заметные выбросы

4. Какая детерминированная величина делит совокупность пополам?

a) дециль

b) мода

c) процентиль

d) медиана

5. Найдите верное высказывания о квантилях:

a) процентили делят совокупность на 10 равных частей

b) медиана является квантилем, делящим совокупность пополам

c) децили делят совокупность на 12 равных частей

d) квартили: x0.25, x0.5, x0.75 делят совокупность на 3 равные части

6. Характеристикой центра распределения признака не является:

a) мода

b) медиана

c) высота

d) среднее

7. Как называется квантиль x0.9?

a) процентиль

b) квартиль

c) дециль

Основные понятия

Ряд наблюдений (вариационный ряд)

Относительные частоты признака

Плотности относительной частоты

Накопленные относительные частоты

Гистограмма

Кумулята

Полигон

Меры центральной тенденции

Медиана

Мода

Квантили



Поделиться:


Читайте также:




Последнее изменение этой страницы: 2021-05-12; просмотров: 226; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 13.58.216.18 (0.119 с.)