Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения



Для измерения тесноты и силы связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .

Эмпирический коэффициент детерминации оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле

, (9)

где – общая дисперсия признака Y,

– межгрупповая (факторная) дисперсия признака Y.

Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство = 0, а при наличии функциональной связи между ними - равенство = 1.

Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле

, (10)

где yi – индивидуальные значения результативного признака;

– общая средняя значений результативного признака;

n – число единиц совокупности.

Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:

(11)

или как средняя взвешенная по частоте групп интервального ряда:

(12)

Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.

Расчет по формуле (11):

Для расчета общей дисперсии применяется вспомогательная таблица 12.

Таблица 12

Вспомогательная таблица для расчета общей дисперсии

Номер банка п/п Прибыль, млн руб.  
         
  45,1 -11,803 139,3187 2034,01
  6,2 -50,703 2570,8280 38,44
  67,0 10,097 101,9427 4489,00
  27,3 -29,603 876,3573 745,29
  62,5 5,597 31,3227 3906,25
  60,0 3,097 9,5893 3600,00
  16,9 -40,003 1600,2667 285,61
  20,9 -36,003 1296,2400 436,81
  65,0 8,097 65,5560 4225,00
  16,0 -40,903 1673,0827 256,00
  69,0 12,097 146,3293 4761,00
  35,0 -21,903 479,7560 1225,00
  53,4 -3,503 12,2733 2851,56
  66,2 9,297 86,4280 4382,44
  56,0 -0,903 0,8160 3136,00
  58,0 1,097 1,2027 3364,00
  47,0 -9,903 98,0760 2209,00
  64,7 7,797 60,7880 4186,09
  46,2 -10,703 114,5613 2134,44
  53,7 -3,203 10,2613 2883,69
  67,0 10,097 101,9427 4489,00
  68,0 11,097 123,1360 4624,00
  70,0 13,097 171,5227 4900,00
  80,1 23,197 538,0853 6416,01
  67,7 10,797 116,5680 4583,29
  72,0 15,097 227,9093 5184,00
  84,0 27,097 734,2293 7056,00
  87,0 30,097 905,8093 7569,00
  90,2 33,297 1108,6680 8136,04
  85,0 28,097 789,4227 7225,00
Итого 1707,1 1650,197 14192,2897 111331,97

 

Расчет общей дисперсии по формуле (10):

Общая дисперсия может быть также рассчитана по формуле

,

где – средняя из квадратов значений результативного признака,

– квадрат средней величины значений результативного признака.

Для демонстрационного примера

Тогда

Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле

, (13)

где –групповые средние,

– общая средняя,

–число единиц в j-ой группе,

k – число групп.

Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).

Таблица 13

Вспомогательная таблица для расчета межгрупповой дисперсии

Группы банков по размеру кредитных вложений, млн руб. Число банков, Среднее значение в группе
         
40 – 90   16,800 -40,103 4824,8320
90 – 140   40,216 -16,687 1670,6690
140 – 190   59,283 2,380 67,9728
190 – 240   78,222 21,319 4090,4552
Итого       10653,9291

Расчет межгрупповой дисперсии по формуле (11):

Расчет эмпирического коэффициента детерминации по формуле (9):

или 75,1%

Вывод. 75,1% вариации суммы прибыли банков обусловлено вариацией объема кредитных вложений, а 24,9% – влиянием прочих неучтенных факторов.

Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле

(14)

Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):

 

 

Таблица 14

Шкала Чэддока

h 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99
Характеристика силы связи Слабая Умеренная Заметная Тесная Весьма тесная

Расчет эмпирического корреляционного отношения по формуле (14):

Вывод. Согласно шкале Чэддока связь между объемом кредитных вложений и суммой прибыли банков является тесной.

3. Оценка статистической значимости коэффициента детерминации .

Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.

Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле

,

где n – число единиц выборочной совокупности,

m – количество групп,

– межгрупповая дисперсия,

– дисперсия j-ой группы (j=1,2,…,m),

– средняя арифметическая групповых дисперсий.

Величина рассчитывается, исходя из правила сложения дисперсий:

,

где – общая дисперсия.

Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m: k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).

Если Fрасч>Fтабл, коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.

Если Fрасч<Fтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.

Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:

 

  k2
k1                        
  3,01 2,99 2,98 2,96 2,95 2,93 2,92 2,91 2,90 2,89 2,88 2,87
  2,78 2,76 2,74 2,73 2,71 2,70 2,69 2,68 2,67 2,66 2,65 2,64
  2,62 2,60 2,59 2,57 2,56 2,55 2,53 2,52 2,51 2,50 2,49 2,48

 

Расчет дисперсионного F-критерия Фишера для оценки =75,1%, полученной при =473,0763, =355,1310:

Fрас ч

Табличное значение F-критерия при = 0,05:

n m k1=m-1 k2=n-m Fтабл (,4, 26)
        2,74

 

Вывод: поскольку Fрасч>Fтабл, то величина коэффициента детерминации =75,1% признается значимой (неслучайной) с уровнем надежности 95% и, следовательно, найденные характеристики связи между признаками Объем кредитных вложений банков и Сумма прибыли банков правомерны не только для выборки, но и для всей генеральной совокупности банков.

Задание 3

По результатам выполнения Задания 1 с вероятностью 0,954 необходимо определить:

1) ошибку выборки средней величины объема кредитных вложений банков и границы, в которых будет находиться генеральная средняя.

2) ошибку выборки доли банков с объемом кредитных вложений 175 млн руб. и выше, а также границы, в которых будет находиться генеральная доля.

3) необходимый объем выборки при заданной предельной ошибке выборки, равной 10 млн руб.

Выполнение Задания 3

Целью выполнения данного Задания является определение для генеральной совокупности коммерческих банков региона границ, в которых будут находиться величина среднего объема кредитных вложений банков и доля банков с объемом кредитных вложений не менее 175 млн руб.

 

 



Поделиться:


Последнее изменение этой страницы: 2016-08-15; просмотров: 654; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.141.193.158 (0.028 с.)