Теоретичні основи аналізу простої лінійної кореляції 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Теоретичні основи аналізу простої лінійної кореляції



 

Важливим завданням статистики є розробка методів вивчення економічних, біологічних, технічних закономірностей, яким підпорядковане виробництво, їх кількісної та якісної сторін. Із цією метою широко використовують кількісні методи статистико-економічного аналізу, зокрема кореляційний. За допомогою кореляційного методу взаємозв’язок між явищами фіксують аналітично у вигляді математичних виразів, які відображають взаємозв’язки факторних і результативних ознак.

Кореляційний метод широко використовують в економічному аналізі різних галузей народного господарства; успішно він застосовується і в сільському господарстві.

Кореляційний метод дозволяє одержати кількісні характеристики ступеня зв’язку між двома або кількома ознаками, а тому дає більш розширене уявлення про зв’язок між ними. Водночас, слід відзначити, що кореляційний метод не встановлює причинних зв’язків між досліджуваними явищами, а констатує їх наявність чи відсутність.

Щоб зрозуміти суть явищ, необхідно розкрити їх взаємозв’язки, кількісно виміряти вплив тих чи інших об’єктивних та суб’єктивних факторів. До того ж будь-яке суспільне явище не можна усвідомити і зрозуміти без обґрунтування його зв’язків з іншими явищами або окремими їх ознаками. Ці зв’язки досить різноманітні. Причому одні ознаки виступають у ролі факторів, які діють на інші, зумовлюючи їх зміни, інші – в ролі результатів дії цих факторів. Перші з них називають факторними ознаками, другі – результативними.

Досить значна різноманітність зв’язків суспільних явищ потребує групування у певні типи та форми за їх істотними рисами і властивостями, тобто класифікації. У статистиці в основу класифікації зв’язків покладено принцип відмінності і подібності їх за такими особливостями: напрям, ступінь тісноти, аналітичний вираз, одиничність і множинність факторів та наслідків. Виходячи з цього розрізняють зв’язки функціональні (повні) і кореляційні (нерівні); прямі та обернені; прямолінійні і криволінійні; однофакторні і багатофакторні (множинні).

Кореляція – це залежність між випадковими величинами, що не має суворого функціонального характеру, при якій зміна однієї випадкової величини зумовлює зміну математичного очікування іншої.

Кореляційний зв’язок – це такий зв’язок між ознаками суспільно-економічних явищ, при якому на величину результативної ознаки, крім факторної, впливають багато інших ознак, що діють у різних напрямах одночасно або послідовно. Кореляційний зв’язок виявити лише у вигляді загальної тенденції при масовому зіставлення факторів. Його особливістю є те, що кожному значенні факторної ознаки відповідає не одне певне значення результативної, а ціла їх сукупність.

Кореляційний аналіз (кореляційний метод) – метод дослідження взаємозалежності ознак у генеральній сукупності, які є випадковими величинами з нормальним характером розподілу. Кореляційний аналіз вирішує такі завдання:

оцінку параметрів нормально розподіленої генеральної сукупності (генеральних середніх, дисперсій, парних коефіцієнтів кореляції, множинних і окремих коефіцієнтів кореляції);

перевірку істотності оцінюваних параметрів та одержання інтервальних оцінок для визначення істотних серед них;

виявлення структури взаємозалежності ознак.

Крім завдань існує декілька передумов кореляційного аналізу:

чітке уявлення про причинно-наслідкові зв’язки досліджуваних ознак;

достатня варіація досліджуваних ознак, оскільки без варіації не можна виявити зв’язків;

однорідність досліджуваної сукупності;

ознаки повинні мати кількісний або числовий вираз, навіть для атрибутивних ознак.

Вивчення взаємозв’язків кореляційного типу має велике значення, особливо при аналізі явищ, які складаються під впливом значної кількості факторів.

За математичними особливостями кореляційні залежності можуть бути додатними і від’ємними, прямолінійними та криволінійними, простими і множинними.

За формою кореляційна залежність буває прямолінійною і криволінійною, а за напрямом – прямою (додатною) та оберненою (від’ємною). Коли визначається зв’язок між двома ознаками, кореляція називається простою (парною); якщо ж ознака розглядається як результат впливу кількох факторів – множинною.

Під прямолінійним розуміють зв’язок, який описується рівнянням прямої лінії. Криволінійним називають зв’язок, що описується рівнянням будь-якої кривої лінії (парабола, гіпербола, логарифмічна крива та ін.).

Прямим називають такий зв’язок, при якому зі збільшенням (чи зменшенням) факторної ознаки збільшується (чи зменшується) результативна.

Оберненим називають зв’язок, при якому значення результативної ознаки змінюється в протилежному напрямі щодо зміни значень факторної: зі збільшенням останньої значення результативної ознаки зменшується і навпаки.

Залежно від форми зв'язку між факторною і результативною ознаками вибирають тип математичного рівняння, за допомогою якого визначають характеристики кореляційного аналізу. Прямолінійну форму зв'язку визначають рівнянням прямої лінії


 

,

 

де ух — теоретичні (обчислені за рівнянням регресії) значення результативної ознаки;

а0 — початок відліку, або значення yx при умові, що х = 0;

а1 — коефіцієнт регресії (коефіцієнт пропорційності), який показує, як змінюється ух при кожній зміні х на одиницю;

х — значення факторної ознаки.

При прямому зв'язку між корелюючими ознаками коефіцієнт регресії має додатне значення, при зворотному — від'ємне.

Параметри а0 і а1 рівняння регресії обчислюють способом найменших квадратів. Суть цього способу в знаходженні таких параметрів рівняння зв'язку, при яких залишкова сума квадратів відхилень фактичних значень результативної ознаки (y) від її теоретичних (обчислених за рівнянням зв'язку) значень () буде мінімальною

(у - yх)2 =min.

 

Спосіб найменших квадратів зводиться до складання і розв'язання системи двох рівнянь з двома невідомими:

 

S y = na0 + a1 S x;

S xy = a0 S x + a1 S x2,

 

де n — кількість спостережень.

Розв'язавши що систему рівнянь, дістанемо

 

; .

Підставивши у рівняння регресії конкретні значення x, дістанемо теоретичні рівні надою у кожному господарстві.

Aналіз регресії

 

Таблиця 1. Вихідні і розрахункові дані для обчислення параметрів рівняння зв’язку між урожайністю зернових культур та внесеними мінеральними добривами

п/п

Урожайність зернових, ц Внесено добрив, ц д.р.

Розрахункові величини

Y X2 X22 Y2 X2*Y Y(x) (Y-Yx)2
1

20,33

1,84

3,39 413,31 37,41 22,53 4,85
2

26,46

2,65

7,02 700,13 70,12 29,65 10,20
3

23,40

1,93

3,72 547,56 45,16 23,32 0,01
4

26,37

2,24

5,02 695,38 59,07 26,05 0,10
5

18,60

1,61

2,59 345,96 29,95 20,51 3,65
6

32,03

2,70

7,29 1025,92 86,48 30,09 3,75
7

31,17

2,27

5,15 971,57 70,76 26,31 23,59
8

22,77

1,96

3,84 518,47 44,63 23,59 0,67
9

19,82

1,60

2,56 392,83 31,71 20,42 0,36
10

25,08

2,50

6,25 629,01 62,70 28,33 10,59
11

16,72

1,01

1,02 279,56 16,89 15,24 2,20
12

30,83

2,00

4,00 950,49 61,66 23,94 47,48
13

28,83

2,10

4,41 831,17 60,54 24,82 16,09
14

20,37

1,77

3,13 414,94 36,05 21,92 2,40
15

23,68

2,05

4,20 560,74 48,54 24,38 0,49
16

20,00

1,63

2,66 400,00 32,60 20,69 0,47
17

30,08

2,80

7,84 904,81 84,22 30,97 0,79
18

19,98

1,70

2,89 399,20 33,97 21,30 1,75
19

23,65

2,05

4,20 559,32 48,48 24,38 0,53
20

20,00

1,76

3,10 400,00 35,20 21,83 3,35
Разом 480,17 40,17 84,29 11940,36 996,14 480,28 133,33

Середне

24,01

2,01

4,21

597,02

49,81

24,01

6,67

 

За формулами вказаними вище розрахуємо коефіцієнти a0 та a1:


 

 

Отже, рівняння кореляційного зв’язку між урожайністю зернових культур та внесеними мінеральними добривами має такий вигляд:

 

 

Економічний зміст цього рівняння такий: коефіцієнт регресії (a1) показує, що в досліджуваній сукупності господарств зі збільшенням внесення мінеральних добрив на 1ц, урожайність зростає в середньому на 8,79 ц. Параметр a0, як вільний член рівняння має тільки розрахункове значення і не інтерпретується.

 

 


 

Таблиця 2. Вихідні і розрахункові дані для обчислення параметрів рівняння зв’язку між урожайністю зернових культур та якістю ґрунту

Урожайність зернових, ц Якість грунту, балів

Розрахункові величини

Y X1 X12 Y2 X1*Y Y(x) (Y-Yx)2
1

20,33

58

3364,00 413,31 1179,14 21,49 1,35
2

26,46

82

6724,00 700,13 2169,72 29,32 8,16
3

23,40

70

4900,00 547,56 1638,00 25,41 4,02
4

26,37

80

6400,00 695,38 2109,60 28,67 5,27
5

18,60

52

2704,00 345,96 967,20 19,54 0,88
6

32,03

80

6400,00 1025,92 2562,40 28,67 11,32
7

31,17

80

6400,00 971,57 2493,60 28,67 6,28
8

22,77

48

2304,00 518,47 1092,96 18,23 20,58
9

19,82

59

3481,00 392,83 1169,38 21,82 4,00
10

25,08

72

5184,00 629,01 1805,76 26,06 0,95
11

16,72

46

2116,00 279,56 769,12 17,58 0,74
12

30,83

75

5625,00 950,49 2312,25 27,04 14,40
13

28,83

69

4761,00 831,17 1989,27 25,08 14,07
14

20,37

48

2304,00 414,94 977,76 18,23 4,57
15

23,68

71

5041,00 560,74 1681,28 25,73 4,21
16

20,00

58

3364,00 400,00 1160,00 21,49 2,23
17

30,08

81

6561,00 904,81 2436,48 28,99 1,19
18

19,98

58

3364,00 399,20 1158,84 21,49 2,29
19

23,65

71

5041,00 559,32 1679,15 25,73 4,33
20

20,00

57

3249,00 400,00 1140,00 21,17 1,36
Разом 480,17 1315,00 89287,00 11940,36 32491,91 480,39 112,20

Середне

24,01

65,75

4464,35

597,02

1624,60

24,02

5,61

 

За формулами вказаними вище розрахуємо коефіцієнти a0 та a1:

 

 


 

Отже, рівняння кореляційного зв’язку між урожайністю зернових культур та якістю ґрунту має такий вигляд:

 

 

Економічний зміст цього рівняння такий: коефіцієнт регресії (a1) показує, що в досліджуваній сукупності господарств зі збільшенням якості ґрунту на 1 бал, урожайність зростає в середньому на 2,585 ц. Параметр a0, як вільний член рівняння має тільки розрахункове значення і не інтерпретується.

 

 

Таблиця 3. Вихідні і розрахункові дані для обчислення показників варіації

№ п/п

Урожайність зернових, ц

Середні величини

Х-Хср

(Х-Хср)2

1

2

3

4

1

20,33

3,68

13,53

2

26,46

2,45

6,01

3

23,40

0,61

0,37

4

26,37

2,36

5,58

5

18,60

5,41

29,25

6

32,03

8,02

64,34

7

31,17

7,16

51,29

8

22,77

1,24

1,53

9

19,82

4,19

17,54

10

25,08

1,07

1,15

11

16,72

7,29

53,12

12

30,83

6,82

46,53

13

28,83

4,82

23,25

14

20,37

3,64

13,24

15

23,68

0,33

0,11

16

20,00

4,01

16,07

17

30,08

6,07

36,86

18

19,98

4,03

16,23

19

23,65

0,36

0,13

20

20,00

4,01

16,07

Ʃ

480,17

77,57

412,20

 

Оцінка тісноти зв’язку

Показниками щільності зв’язку при кореляції є коефіцієнт кореляції і коефіцієнт детермінації.

Коефіцієнти кореляції використовують для вимірювання щільності зв’язку між двома досліджуваними ознаками без урахування їх взаємодії з іншими ознаками.

У нашому випадку коефіцієнти кореляції дорівнюватимуть

1) між урожайністю зернових культур та кількістю внесених добрив:

 

 

2) між урожайністю зернових культур та якістю ґрунту:

 

 

Обчислені парні коефіцієнти кореляції показують, що урожайність зернових культур перебуває у щільному зв’язку як з кількістю внесених мінеральних добрив (0,8297), так і з якістю ґрунту (0,8528).

Коефіцієнт детермінації показує, яка частка варіації досліджуваного результативного показника зумовлена впливом факторa, включеного у рівняння регресії.

Коефіцієнт детермінації визначається за формулою:

 

 



Поделиться:


Последнее изменение этой страницы: 2020-12-09; просмотров: 63; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.118.171.20 (0.15 с.)