Числові характеристики варіаційного ряду 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Числові характеристики варіаційного ряду



 

Види характеристик згруповані незгруповані
Вибіркова середня
Дисперсія чи
Виправлена дисперсія
Середнє квадратичне відхилення
Коефіцієнт варіації 5% - слабке, 6-10% - помірне 16-20% - значне, 21-50% - велике >50 - дуже велике (для малих вибірок < 33%)
Медіана - середина ранжированого ряду. Для інтервального ряду:
Мода - варіант, що має максимальну частоту. Для інтервального ряду: - частота модального інтервалу, - частота інтервалу, що передує модальному, - частота наступного інтервалу за модальним, - нижня межа модального інтервалу.
Асиметрія   правостороння скошеність лівостороння скошеність - значна - асиметрія незначна
Ексцес   Е>0 гостровершиність E<0 плоскавершиність Е=0 – нормальний закон розподілу При Е=-2 - дві самостійні вершини

Алгоритм вибіркового методу

1) Визначення розмаху вибірки: ;

2) побудова ранжированого ряду;

3) визначення кількості інтервалів:

формула Стерджеса

чи , (де n – обсяг вибірки)

4) обчислення кроку (довжини) інтервалів:

, де xmin , xmaх

5) побудова інтервального ряду розподілу, гістограми;

6) побудова дискретного ряду розподілу, полігона;

7) обчислення числових характеристик: середнього значення, дисперсії, середнього квадратичного відхилення, моди, медіани, коефіцієнта варіації, асиметрію, ексцес;

8) зробити висновок.

 

Приклад 15. Отримані вибіркові дані про врожайність зернових культур (ц/га) по господарствах Запорізької області за 2003 рік:

13,4 13,6 17,8 15,4 24,5
17,6 18,2 16,8 19,3 19,4
16,1 16,1 17,2 19,8 26,7
15,9 26,1 21,7 19,9 19,4
17,2 16,1 15,7 20,3 20,5

Використовуючи вибірковий метод:

1. визначити розмах вибірки;

побудувати:

2. ранжирований ряд;

3. інтервальний ряд, гістограму;

4. дискретний ряд, полігон;

5. обчислити числові характеристики: .

6. зробити висновок на підставі отриманих числових характеристик.

Розв'язання.

Обсяг вибірки (кількість елементів):

1. Визначимо максимальний і мінімальний варіант вибірки:

.

Розмах вибірки обчислимо за формулою:

2. Побудуємо ранжирований ряд, розташувавши значення вибірки в зростаючому чи спадному порядку:

13,4 16,1 17,2 19,4 20,5
13,6 16,1 17,6 19,4 21,7
15,4 16,1 17,8 19,8 24,5
15,7 16,8 18,2 19,9 26,1
15,9 17,2 19,3 20,3 26,7

3. Для побудови інтервального ряду розподілу визначимо кількість інтервалів розбивки за формулою:

Крок інтервалу визначаємо за формулою:

Складемо інтервальний ряд розподілу

 

13 – 15,8 15,8 – 18,6 18,6 – 21,4 21,4 – 24,2 24,2 - 27
4 10 7 1 3

 
 

Для отриманого ряду розподілу побудуємо гістограму відносних частот

4. Для переходу до дискретного ряду розподілу, припускаємо, що частоти згруповані в центрах інтервалів

14,4 17,2 20 22,8 25,6
4 10 7 1 3

 

Побудуємо полігон відносних частот (зобразимо на гістограмі).

1. Обчислимо числові характеристики вибірки даних, для чого побудуємо таблицю:

14,4 4 57,6 -4,37 76,3 -333,4 1456,1
17,2 10 172 -1,57 24,6 -38,6 60,4
20 7 140 1,23 10,6 13,1 16,1
22,8 1 22,8 4,03 16,3 65,5 264,3
25,6 3 76,8 6,83 140,0 956,7 6536,0
    469,2   267,8 663,4 8333,0

- середнє значення:

- дисперсію:

 

- виправлену дисперсію:

- середнє квадратичне відхилення:

- коефіцієнт варіації:

- моду:

- медіану:

- асиметрію:

- ексцес:

Висновок: У цілому по господарствах Запорізької області середня врожайність зернових культур складає 15,51-22,3 (ц/га), . Причому в більшій частині господарств отриманий урожай 17,67(ц/га), . У цілому по області розсіювання за результатами врожайності значне . Спостерігається незначна правобічна скошеність у даних, незначна пласковершіність.

 

Кореляційний аналіз

Функціональним називають зв'язок між ознаками, при якому кожному значенню однієї змінної відповідає чітко окреслене значення іншої змінної.

Кореляційним (статистичним) зв'язком називається такий зв'язок, при якому чисельному значенню однієї змінної відповідає кілька значень іншої.

Кореляційною залежністю y від x називається така залежність, при якій зміни випадкової величини x спричинюють зміни середнього значення змінної y (), тобто .

Вибірковим коефіцієнтом кореляції називається число:

,

де - вибіркові середні для і , тобто , .

- вибіркові середньоквадратичні відхилення для і

.

 

Властивості коефіцієнта кореляції:

a) абсолютна величина коефіцієнта кореляції не перевищує 1

b) якщо , то і зв'язані точним лінійним зв'язком: ;

c) якщо , то між і немає лінійного зв'язку, але криволінійна залежність можлива;

d) чим ближче до , тим сильніше лінійний зв'язок між і і, чим ближче до , тим він слабший;

e) якщо , зв'язок між і зростаючий, , зв'язок – спадний.

 
 

 


Рівняння лінійної регресії .

Параметри лінійної регресії дорівнюють:

, .

Перевірка гіпотези про значимість коефіцієнта кореляції.

Гіпотеза : лінійного кореляційного зв'язку для даної генеральної сукупності немає.

а) Визначають значення критерію, що спостерігається

.

б) по таблиці Стьюдента (Додаток 3) визначають .

в) при - нульову гіпотезу відкидають, при - приймають.

 

Метод найменших квадратів

Лінійна залежність

1) Обчислюють середні для

2) Визначають параметри:

,

Параболічна залежність

1) Складають систему рівнянь:

2) Методом Крамера обчислюють параметри параболи:

Для досліджуваних видів функцій обчислюють середню погрішність:

Точніше та функція, у якої середня погрішність менше.

Приклад 16. Задана залежність врожайності y (ц/га) від якості ґрунту x (у балах).

-1      
-1      

Знайти:

-коефіцієнт кореляції;

-рівняння лінійної регресії.

-перевірити коефіцієнт кореляції на значимість.

-рівняння лінійної, параболічної залежності (МНК), середню погрішність.

Розв'язання.

Для зручності обчислень складемо розрахункову таблицю:

-1 -1 1 1 1
0 2 0 0 4
1 0 0 1 0
4

2 8 16 4
         

Обчислимо середні значення для х і у:

; ; (n=4)

Обчислимо середні квадратичні відхилення для х і у:

; .

Обчислюємо коефіцієнт кореляції:

.

На підставі властивостей коефіцієнта кореляції робимо висновок.

Оскільки r=0,62 >0, то між x і y сильний, зростаючий лінійний кореляційний зв'язок.

Обчислюємо коефіцієнти лінійної регресії :

;


Рівняння лінійної регресії має вид:

Побудуємо на координатній площині задані пари точок і отримаєму пряму.

Перевіримо коефіцієнта кореляції на значимість (критерій Стьюдента).

- для даної генеральної сукупності лінійного кореляційного зв'язку немає.

а) Обчислюємо значення критерію, що спостерігається

,

б) по таблиці Сть’юдента (Додаток 3) визначаємо

.

Оскільки (1,12 < 4,30) нульову гіпотезу відкидаємо, тобто коефіцієнт кореляції для всієї генеральної сукупності не дорівнює нулю.

 

Метод найменших квадратів

Для зручності складаємо таблицю:

 

 

-1 -1 1 -1 1 -1 1
0 2 0 0 0 0 0
1 0 0 0 1 1 1
4 2 8 32 16 64 256
             

1. Обчислимо середні значення для х і у:

; ; (n=4)

2. Визначаємо параметри:

,

3. Складають систему рівнянь:

4. Обчислюють

 

4. Обчислюють параметри параболи:

Рівняння параболи має від:

Побудуємо графіки:

5. Обчислюють середню погрішність.

Для зручності складаємо таблицю:

 

пряма парабола
-1 -1 -0,11 0,79 -0,37 0,40
0 2 0,32 2,82 0,425 2,48
1 0 0,75 0,56 1,049 1,10
4 2 2,04 0,00 1,889 0,01
      4,18   3,99

Середня погрішність для прямій:

Середня погрішність для параболи:

Парабола точніше згладжує дані.

 

 



Поделиться:


Последнее изменение этой страницы: 2017-01-26; просмотров: 544; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 13.58.137.218 (0.091 с.)