Факторний аналіз витрат відвідувачів 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Факторний аналіз витрат відвідувачів



 

Усі явища, процеси в економіці, туризмі взаємопов’язані. Жодне явище не може бути повністю пізнане, якщо його досліджувати ізольовано від інших процесів. Лише при вивченні причинно-наслідкових зв’язків між явищами можна дати їм об’єктивну оцінку та прогнозувати їх розвиток. Тому одним з важливих напрямків аналізу витрат відвідувачів є дослідження чинників, які на ці витрати впливають. У даному параграфі розглянемо методи відповідного аналізу при кореляційному зв’язку, коли із зміною факторної ознаки змінюється середня величина умовних розподілів витрат. Нагадаємо, що основними методами вивчення кореляційних зв’язків, є:

 

– метод аналітичних групувань та дисперсійний аналіз;

 

– кореляційно-регресійний аналіз.

 

За даними вибіркового обстеження 14 іноземних відвідувачів проведемо аналіз впливу терміну їх перебування в країні (факторна незалежна ознака) на їх одноденні витрати (результативна залежна ознака) (табл. 1).

 

Характеристикою кореляційного зв’язка є лінія регресії. Лінія регресії розглядається в двох моделях: аналітичного групування та регресійного аналізу.


Таблиця 1

 

  Результати анкетування іноземних туристів    
           
  Термін Одноденні      
  витрати, дол.      
перебування, днів      
США      
  х      
  y      
         
           
           
           
           
           
           
           
           
           
           
           
           
           
           
Усього          

 

 

Почнемо аналіз з методу аналітичного групування. Він не тільки має самостійне значення у вивченні кореляційних зв’язків, але й є основою для застосування ще одного методу їх дослідження – дисперсійного аналізу. Для побудови аналітичного групування необхідно розподілити одиниці сукупності за факторною ознакою, а далі для кожної – ї групи обчислити середню величину результативної ознаки ().

 

У моделі аналітичного групування характеристикою кореляційного зв’язку є емпірична лінія регресії, що утворюється з групових середніх значень результативної ознаки для кожного інтервалу. Якщо між ознаками є прямий зв'язок, то зростання значень факторної ознаки призводить до зростання середніх значень результативної ознаки. Якщо при зростанні значень факторної ознаки зменшуються середні значення результативної ознаки, констатуємо зворотній зв'язок. Відсутність систематичності у зміні середніх значень

 


результативної ознаки зі зміною значень факторної ознаки свідчить про відсутність зв’язку між ними.

 

Якщо факторна та результативна ознаки обрані, процес реалізації методу аналітичного групування та дисперсійного аналізу на його основі включає такі етапи:

 

– визначення числа груп та їх меж;

 

– оцінка лінії регресії;

 

– виявлення наявності, напряму і характеру зв’язку між досліджуваними ознаками;

 

– перевірка достовірності зв’язку.

 

Здійснимо аналітичне групування. Розподілимо відвідувачів за факторною ознакою – терміном перебування – на чотири групи, а далі – для кожної групи розрахуємо середні одноденні витрати туриста. Для наших даних ширина інтервалу становитиме:

 

.

 

 

Рекомендується формувати групи с приблизно однаковою чисельністю

 

одиниць для рівної надійності групових середніх.

 

Для зручності розрахунку середньої величини результативної ознаки

 

побудуємо робочу табл. 2, за результатами якої складемо табл. 3.

 

Побудоване аналітичне групування (табл. 3) свідчить про зворотній зв'язок між терміном перебування та середніми одноденними витратами відвідувачів, бо зі зростанням факторної ознаки середній рівень результативної зменшується.

 

За даними аналітичного групування визначаємо ефект (силу) впливу

 

факторної ознаки на результативну ( ), який показує, на скільки одиниць у  
середньому змінюється зі зміною на одиницю власного виміру:  
        (6.7)  
         
У випадку прямого зв’язку зворотного –  

 

 


              Таблиця 2  
      Робоча таблиця          
               
Групи за терміном   № туриста   Одноденні витрати,  
перебування, днів. (кількість туристів, осіб)   дол. США  
               
               
2 – 9              
               
               
Разом              
               
10 – 16              
               
Разом              
17 – 23              
             
           
Разом              
               
24 – 30              
             
           
               
Разом              
Усього              
              Таблиця 3  
  Залежність одноденних витрат відвідувачів      
  від тривалості перебування в країні      
                 
Групи за Кількість Середні одноденні          
терміном витрати туриста,          
туристів, осіб          
перебування дол. США          
             
                 
2 – 9     216,0          
10 – 16     180,0          
17 – 23     165,0   -65      
24 – 30     142,5   -37,5      
Усього     180,0   -      
(у середньому)        
               

 

 

Ефект впливу можна визначити для будь-яких груп. У випадку лінійного зв’язку між ознаками визначається середня сила зв’язку:

 


(6.8)

 

 

де – середні значення результативної ознаки в останній та в першій групах,

 

– середні значення факторної ознаки в останній та в першій

 

групах.

 

За даними нашого групування:

 

.

 

 

Величина даного показника свідчить про те, що в цілому за сукупністю відвідувачів із збільшенням тривалості перебування на один день їх одноденні

 

витрати в середньому зменшуються на.

 

Для кількісної оцінки щільності зв’язку та перевірки його істотності використовуємо дисперсійний аналіз.

 

Оцінка щільності зв’язку ґрунтується на правилі складання дисперсій. У моделі аналітичного групування мірою щільності зв’язку є відношення міжгрупової дисперсії до загальної, яке називають емпіричним коефіцієнтом детермінації (:

 

  , (6.9)  
   

 

де – загальна дисперсія, яка вимірює варіацію результативної ознаки

 

, зумовлену впливом усіх можливих факторів;

 

– міжгрупова дисперсія, яка вимірює варіацію результативної ознаки за рахунок впливу тільки факторної ознаки х, тобто характеризує варіацію

 

групових середніх () навколо загальної середньої.    
Загальна дисперсія розраховується за формулою:    
      , (6.10)  
     
  або (6.11)  
де – кількість одиниць сукупності.    
Міжгрупова дисперсія обсчислюється:    
         

, (6.12)

 

 

 

де – частота j –ї группы.

 

Окремо для кожної j –ї групи розраховується внутрішньогрупова дисперсія:

 

. (6.13)

 

 

 

Узагальнюючою характеристикою внутрішньогрупової варіації є середня з групових дисперсій:

 

        (6.14)  
         
Емпіричній коефіцієнт детермінації коливається від 0 до 1. При  
відсутності зв’язку , при функціональному зв’язку - . Зв’язок тим  
сильніший, чим ближче до одиниці.    
За первинними даними розрахуємо загальну дисперсію:    

 

.

 

Проміжні розрахунки для міжгрупової дисперсії надано в таблиці 3. За її даними міжгрупова дисперсія дорівнює:

 

.

 

 

Таким чином, емпіричний коефіцієнт детермінації дорівнюватиме:

 

.

 

 

Це означає, що варіація одноденних витрат туристів на пояснюється варіацією тривалості перебування в Україні та на 33,9 % - впливом інших факторів.

 

Разом з цим, досить тісний зв’язок, який демонструє коефіцієнт детермінації, може виникнути випадково. Необхідно перевірити істотність,


 

невипадковість зв’язку.

 

Перевірка істотності зв’язку – це порівняння фактичного значення


 

з

 


 


його критичним значенням для певного рівня істотності та числа

 

ступенів свободи та, де – кількість груп, – обсяг

 

сукупності. Якщо, то зв’язок визначається істотним.

 

Критичні значення емпіричного коефіцієнта детермінації наведено в

 

спеціальних таблицях. Здійснимо аналіз для.

 

У нашому прикладі

 

 

Так як то зв’язок визнається істотним з імовірністю

 

0,95 (95 %).

 

У програмі Excel у процесі визначення дисперсій використовуються не середні квадрати відхилень, а сумі квадратів відхилень, які називають девіатами

(SS). Тоді правило додавання дисперсій можна записати таким чином:

 

, (6.15)

 

де – відповідно загальна, міжгрупова та залишкова девіати.

 

Таким чином, у програмі Excel загальна девіата визначається як сума

 

квадратів відхилень фактичних значень результативної ознаки () від загальної

 

середньої величини ():

 

(6.16)

 

Міжгрупова девіата визначається як сума квадратів відхилень групових середніх () від загальної середньої величини результативної ознаки, зважених за відповідними частотами:

 

(6.17)

 

Залишкова девіата визначається як різниця між загальною девіатою та

 

міжгруповою ().

 

Тоді емпіричний коефіцієнт детермінації можна розрахувати співвідношенням відповідних девіат.

 

 


(6.18)

 

 

На основі вбудованого блоку «Однофакторный дисперсионный анализ» редактора Excel розраховуються девіати та здійснюється перевірка істотності зв’язку між факторною та результативною ознаками (табл. 4).

 

              Таблиця 4
Результати дисперсійного аналізу одноденних витрат  
               
Дисперсионный анализ            
Источник вариации   SS df MS F P-Значение F критическое
Между группами         6,493405741 0,010291177 3,708264819
Внутри групп       644,5      
               
Итого              

 

Числа ступенів свободи вказуються в графі df.

 

Графа MS являє собою скориговані на число ступенів свободи квадрати відхилень:

 

,

 

 

.

 

 

Фактичне значення F -критерію розраховується:

 

        .    
         
Порівнюємо фактичне значення F -критерію з критичним ( ) (табл. 4).  
Переконуємося, що , таким чином розбіжності між груповими  

 

середніми не є випадковими. Це підтверджує, що зв’язок між ознаками є істотним.

 

Вище відзначалося, що характеристикою кореляційного зв’язку є лінія регресії. У моделі регресійного аналізу характеристикою кореляційного зв’язку є теоретична лінія регресії. Теоретична лінія регресії описується функцією

 

, яка називається рівнянням регресії.

 

На основі рівняння регресії визначають середні значення результативної ознаки для кожного значення факторної ознаки х. Їх позначають та називають теоретичними значеннями на відміну від фактичних значень у.


Важливою вимогою, яка забезпечує надійність регресійно-кореляційного аналізу, є наявність достатнього обсягу сукупності. Вважають, що кількість одиниць сукупності має бути в 5-6 разів більше, ніж кількість факторів.

 

Досліджувана сукупність має бути якісно однорідною.

 

Необхідною є також перевірка кількісної однорідності, критерієм якої є коефіцієнт варіації, не більший за 33 %.

 

Крім того, слід враховувати, що факторні та результативні ознаки мають підпорядковуватися нормальному розподілу.

 

Розрахуємо коефіцієнт варіації одноденних витрат нашої сукупності туристів. Для цього визначимо за допомогою редактора Excel середнє значення

 

та середнє квадратичне відхилення одноденних витрат (дол., дол.) та підрахуємо коефіцієнт варіації:

 

 

Величина коефіцієнта варіації () свідчить про кількісну

 

однорідність сукупності туристів.

 

Залежно від характеру зв’язку використовують:

 

– лінійні рівняння, коли зі зміною ознака у змінюється більш-

 

менш рівномірно;

 

– нелінійні рівняння, коли зміна взаємопов’язаних ознак відбувається нерівномірно (з прискоренням, уповільненням або зі змінним напрямком

 

зв’язку), зокрема: параболічне , гіперболічне   ,  
   
степеневе тощо.        
Частіше застосовуються лінійні рівняння. У лінійному рівнянні  
параметр – коефіцієнт регресії вказує, на скільки одиниць у середньому  

 

змінюється результативна ознака зі зміною факторної ознаки на одиниці. Він

 

 

має одиниці виміру результативної ознаки. У випадку прямого зв’язку – величина додатна, а при зворотному – від’ємна. Параметр – вільний член рівняння регресії, тобто це значення при. Якщо не набуває нульових значень, цей параметр не має інтерпретації.


Параметри функцій визначаються методом найменших квадратів, згідно з яким сума квадратів відхилень емпіричних значень у від теоретичних

 

мінімальна: Відповідно до умови мінімізації параметри обчислюються на основі системи нормальних рівнянь:

 

(6.19)

 

Сучасний підхід до вивчення кореляційних зв’язків дозволяє отримати значення необхідних коефіцієнтів на основі вбудованого блоку РКА редактора Excel без здійснення трудомістких розрахунків (табл. 5).

 

Значення коефіцієнтів регресії розташовані в нижній лівій частині табл. 5 у стовпчику Коэффициенты. У ряді У-пересечение розташоване значення, а

 

в ряді Переменная Х1 Таким чином, отримаємо таку регресійну модель:

 

.

 

Знак коефіцієнта відповідає напрямку зв’язку між ознаками.

 

Таблиця 5

 

Результати РКА одноденних витрат

 

ВЫВОД ИТОГОВ            
             
Регрессионная статистика          
Множественный R 0,871308487          
R-квадрат 0,759178479          
Нормированный R 0,739110019          
Стандартная ошиб 19,52692351          
Наблюдения            
             
Дисперсионный анализ          
  df SS MS F Значимость F  
Регрессия   14424,3911 14424,3911 37,82943362 4,94207E-05  
Остаток   4575,608901 381,3007418      
Итого            
             
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 231,2703697 9,834769283 23,5155867 2,09016E-11 209,8422482 252,6984912
Переменная X 1 -3,434378833 0,558384403 -6,150563683 4,94207E-05 -4,650993935 -2,217763731

 

Можна зробити висновок, що зі збільшенням тривалості відвідання України на 1 день одноденні витрати іноземних туристів скорочуються в середньому на 3,43 дол. США.

 

 


Коефіцієнти регресії у невеликих за обсягом сукупностях схильні до випадкових коливань. Тому здійснюється перевірка його істотності за допомогою -критерію Стьюдента:

 

, (6.20)

 

 

де – коефіцієнти регресії, (j = 0, 1),

 

– стандартна похибка коефіцієнтів регресії, яка розраховується для відповідно за формулами:

 

(6.21)

 

 

, (6.22)

 

 

де - залишкова дисперсия,

 

- дисперсія факторної ознаки.

 

За результатами РКА (табл. 5) стандартні похибки для нашої сукупності

 

склали и . У тій же таблиці наведені
значення:   .    
Сучасний підхід перевірки гіпотез передбачає, що для кожного з
урахуванням числа ступенів вільності ( ) визначається -значущість, яка
порівнюється з обраним рівнем значущості (частіше всього беруть ).

 

Якщо -значущість обох коефіцієнтів потрапляє у критичну область, тобто

 

, можна стверджувати, що коефіцієнти регресії суттєво відрізняються від нуля, є значущими та надійними.

 

У табл. 5 наведено -значущість:

 

.

 

Ми бачимо, що,.

 

Таким чином, коефіцієнти регресії є істотними та надійними, тому вплив тривалості перебування на одноденні витрати з великою ймовірністю визначається істотним.

 

Для коефіцієнтів регресії визначаються також довірчі межі.

 


У табл. 5 у графах Нижние 95 %, Верхние 95 % наводять значення 95 %-х довірчих меж інтервалів коефіцієнтів регресії:

 

Характеристикою відносної зміни результативної ознаки за рахунок факторної є коефіцієнт еластичності (). Він характеризує, на скільки відсотків у середньому змінюється результативна ознака зі зміною факторної на 1 %. Розраховується даний показник за формулою:

 

    (6.23)  
     
Для нашої сукупності:     .  
   
           

 

Таким чином, із збільшенням тривалості перебування в країни на 1 % добові витрати туристів зменшуються в середньому на 0,3 %.

 

Для з’ясування наявності лінійної кореляційної залежності між результативною та факторною ознакою використовують коефіцієнт парної

 

кореляції. Формули його розрахунку такі:    
                  (6.24)  
                   
      або     (6.25)  
         
де та – відповідно середнє квадратичне відхилення в ряду та в  
ряду.                    

 

Коефіцієнт парної кореляції приймає значення від -1 до +1, включаючи і

 

0. Від’ємна величина вказує на зворотний зв'язок між ознаками, позитивна – на

 

прямий зв'язок. При зв'язок є функціональним.      
Для якісної характеристики щільності зв’язку можна використовувати  
так звану шкалу Чеддока:              
                 
Оцінка           Значний Дуже  
щільності Слабкий Помірний   Середній    
    (сильний) сильний  
зв’язку            
               
Значення 0,1 – 0,3 0,3 – 0,5   0,5 – 0,7   0,7 – 0,9 0,9 – 0,99  
                 
               

Мірою щільності як лінійного, так і нелінійного зв’язку є коефіцієнт детермінації. Методика його розрахунку базується на правилі розкладання дисперсії.

 

Варіація результативної ознаки оцінюється, перш за все, за допомогою загальної дисперсії. Загальна дисперсія являє собою середній квадрат відхилень фактичних значень результативно ознаки від загальної середньої:

 

(6.26)

 

 

Варіація результативної ознаки, що пов’язана зі зміною факторної ознаки х,вимірюється факторною дисперсією.Факторна дисперсія()являє собоюсередній квадрат відхилень теоретичних значень результативної ознаки від загальної середньої:


 

Варіація, що пов’язана з впливом вимірюється залишковою дисперсією. середній квадрат відхилень фактичних теоретичних:


 

 

(6.27)

 

 

інших факторів, крім фактора х, Залишкова дисперсія являє собою значень результативної ознаки від

 


(6.28)

 

 

Сума факторної та залишкової дисперсій дорівнює загальній дисперсії.

 

У програмі Excel при здійсненні РКА, як і при дисперсійному аналізі,

 

замість дисперсій визначаються девіати. Підхід до їх розрахунку аналогічний.

 

Загальна девіата () визначається:

 

(6.29)

 

За даними табл. 5:.

 

Залишкова девіата розраховується:

 

(6.30)

 

У нашому випадку.

 

Факторна девіата визначається як різниця між загальною та залишковою девіатою:

 


    (6.31)  
Для аналізованої сукупності туристів .  
Тоді коефіцієнт детермінації можна розраховувати за формулами:  
        (6.32)  
         
        (6.33)  
         
        (6.34)  
       
        (6.35)  
       
                 

 

Коефіцієнт детермінації показує, яку питому вагу в загальній дисперсії результативної ознаки займає дисперсія, що викликана варіацією фактора х.

 

Якщо та відповідно це означає повну залежність від.

 

Якщо та відповідно це означає, що варіація нияк не впливає

 

на варіацію.

 

Корінь квадратний з коефіцієнта детермінації має назву коефіцієнт кореляції. Таким чином, показником щільності зв’язку прибудь-якій моделі зв’язку є коефіцієнт множинної кореляції R. Для парної лінійної моделі R =.

 

У табл. 5 R – перший показник у розділі Регрессионная статистика. Його значення, а, таким чином, й значення коефіцієнта парної кореляції, – 0,871308487 свідчить сильний кореляційний зв’язок між тривалістю перебування в Україні та одноденними витратами туристів.

 

Абсолютною мірою точності побудованої парної моделі є середня квадратична (стандартна) похибка регресії:

 

 

(6.36)

 

 

У табл. 5 величина похибки надана в готовому вигляді: стандартна похибка дорівнює 19,52692351. Дійсно:

 

 

.

 

 

Чим стандартна похибка менша, тим модель точніша.

 

 


Відносною характеристикою точності регресійної моделі є коефіцієнт

 

детермінації. Для парної лінійної моделі. Він характеризує частку

 

варіації результативної ознаки, яка пояснюється варіацією факторної ознаки.

 

Розраховується автоматично (табл. 5) і дорівнює Продемонструємо розрахунок на основі девіат:

 

.

 

 

Таким чином, варіації одноденних витрат пояснюється варіацією тривалості перебування в країні, а 24,1 % зміни витрат можна пояснити іншими факторами.

 

У розділі Регрессионная статистика (табл. 5) відображено також величину Нормированный коэффициент детерминации (). Він

розраховується для малих вибірок та його значення завжди нижче. Даний

 

показник ураховує співвідношення кількості спостережень і число коефіцієнтів

 

рівняння регресії. Для нашого прикладу. Таким чином, з

 

урахуванням особливостей малої вибірки модель усе рівно є точною. 73,9 % варіації одноденних витрат можна пояснити варіацією тривалості перебування.

 

Перевірка статистичної значущості моделі в цілому здійснюється за допомогою тих самих критеріїв, що й у дисперсійному аналізі. Для визначення

 

кількості ступенів вільності зберігаються аналогічні формули: и

 

, де – кількість параметрів у рівнянні регресії.

 

Фактичне значення F - критерію розраховується:

 

.

 

 

Сучасний підхід до використання даного критерію передбачає використання вбудованого блоку РКА (табл. 5). У графі Значимость F надаються розрахункові значення F – критерію та його р -значущість (4,94207E-05). Відповідно зі схемою перевірки гіпотез остання величина

 

порівнюється з рівнем значущості. Так як 4,94207E-05, можна стверджувати, що модель значуща, надійна. Цей висновок співпадає з висновком про значущість коефіцієнта парної кореляції.


Контрольні запитання та завдання:

 

1. Опишіть, у рамках якої системи міжнародні статистичні організації пропонують вивчати вплив туризму на економіку регіону.

 

2. Сформулюйте проблеми, які виникають при визначенні частки доданої вартості туризму у валовому внутрішньому продукті.

 

3. Висвітліть значення допоміжного (сателітного) рахунку туризму.

 

4. Опишіть, як визначає туристські витрати Всесвітня туристична організація.

 

5. Розкажіть, які витрати належать до витрат, що оплачені або компенсовані відвідувачам іншими особами.

 

6. Висвітліть, які платежі, що здійснюють відвідувачі не належать до туристських витрат.

 

7. Розкажіть, як співвідносяться категорі



Поделиться:


Последнее изменение этой страницы: 2017-01-19; просмотров: 295; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.118.195.162 (0.281 с.)