Какие характеристики используются для оценки связи между переменными? Метод, используемый для оценки связи, зависит от переменной 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Какие характеристики используются для оценки связи между переменными? Метод, используемый для оценки связи, зависит от переменной



Какие характеристики используются для оценки связи между переменными? Метод, используемый для оценки связи, зависит от переменной

Если переменная количественная, то для оценки линейной связи мы используем коэффициент корреляции, для оценки нелинейной связи корреляционное отношение

Если переменная порядковая то мы используем коэффициент Спирмана, коэффициент Кендела.

Если переменная классификационная, то используется коэффициент x2 и коэффициент Крамера.

 

10. Определение оценки математического ожидания (формула). хср= 1/n*сумму х

11. Определение оценки коэффициента корреляции (формула). r =сумм((xi-xср)*(yi-yср))/корень(сумм(xi-xср)^2*сумм(yi-yср)^2)

 

13. Определение корреляционного отношения. Корреляционное отношение показывает наличие любой зависимости (строится по сгруппированным данным.

В чем заключается отличие корреляционного отношения от коэффициента корреляции?

Коэффициент корреляции строится по всему ряду значений

Корреляционное отношение - строится по сгруппированным данным.

коэффициент корреляции характеризует линейную зависимость

В случае нелинейной зависимости тесноту связи между величинами оценивают по величине корреляционного отношения

Корреляционное отношение показывает наличие любой зависимости (строится по сгруппированным данным.

 

Как устроена матрица сопряженности и для чего она используется?

Значимость, т.е. наличие связи, т.е. когда мы проверяем гипотезу о значимости, мы проверяем реально ли она описывает исходные данные.

Что такое коэффициент Крамера, и как он изменяется?

Нужен для тесноты связи м/д качеств. перем. Изменяется от 0 до 1. Если близок к 0 => признание независимой, если 1, то связь есть и она сильная.

 

Что такое коэффициент Х2, и как он изменяется?

Хар-ка Х2 изменяется [0,?) Если близко к 0, то связь слабая, 6 вопрос

Если к? - сильная.

 

Что показывают коэффициенты Спирмена и Кенделла и когда они применяются?

Показывают зависимость м/у порядковыми переменными

18. Как убедиться в наличии или отсутствии связи между двумя переменными? Исп-ся проверка значимости.значение оценки к-та корр-ции [-1:1] <0.5-слабая,>0.8- сильная. в ост - средняя

 

Постановка задачи построения парной линейной регрессии.

Исходные данные для построения регрессии: есть 2 переменные(x и y), есть наблюдения: x-y, x1-y1, x2-y2,…, xn-yn. Шаги: 1) построение корреляционного поля, 2) проверка значимости или наличия связи м/д перем., 3) построение оценок коэф-тов регрессии

 

Модель парной линейной регрессии.

Y=a0+a1*X+Е

 

Оценки коэффициентов парной линейной регрессии (формулы).

Для проверки значимости регрессии, для оценки качества регрессии D=ESS(Сумм кв отклонений, объясн регрессией)/TSS(общ сумма квадратов отклонений)

24. Определение коэффициента детерминации (определение + формула). Хар-ет долю дисперсий эндогенной переменной, объясняющей регрессию.

 

Для чего применяется коэффициент детерминации?

Для проверки значимости регрессии, для оценки качества регрессии

 

Что означает остаточная случайная составляющая парной регрессии?

E(круглая E)-латентная (случайная) составляющая, отражает влияние неучтенных факторов или ошибок измерения.

 

Что такое доверительный интервал для коэффициентов парной регрессии?

Доверительный интервал – это пределы, в которых могут изменяться коэффициенты. Если изменить исходные данные, то коэффициенты будут изменяться в этих пределах.

29. Определение коэффициента эластичности (определение + формула). Показывает на сколько % изменится эндогенная переменная, если экзогенная изменится на 1 % Э=fштрих(х)*х/f(х)

 

Что представляет собой корреляционная матрица?

Корреляционная матрица - это квадратная матрица размерности (1+р)*(1+р),

элементами которой являются парные коэффициенты корреляции

rij - парный коэффициент корреляции между i-той и j-той переменной

Индекс 0 означает переменную y

r0j - коэффициент корреляции между y и j-той переменной

rii =1 (по диагонали стоят 1)

rij = rji (корреляционная матрица симметрична относительно главной диагонали)

 

Свойства корреляционной матрицы.

1. каждый элемент r – парный коэф-т корреляции, след-но, принимает значения [-1;1]

2. rii=1 (по главной диагонали)

3. rij=rji, т.е R симметричная.

 

Определение частного коэффициента корреляции.

Частные коэф-ты (или индексы) корреляции характеризует тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии. (значение остальных переменных зафиксировано на среднем уровне)

 

Постановка задачи построения классической множественной линейной регрессии.

Модель классической множественной линейной регрессии.

Постановка задачи построения классической множественной линейной регрессии.

yi=a0+a1*xi(1)+a2*xi(2)+…+ap*xi(p)+Еi, i=1, n

M(Еi)=0 i=1, n т.е. остатки=0

M(Еi*Еj)= Е2, i=j Еi - остатки 0, i<>j

Все остатки независимы и имеют одинаковую дисперсию (гомоскедастичность)

D(Еi)= Е2Е

rank(x) = p+1 < n

 

Постановка задачи построения классической множественной линейной регрессии в матричной форме.

Модель классической множественной линейной регрессии в матричной форме.

y = x*A + E

M(E) = 0n – нулевой столбец

M(E * ET) = сигма2E* En – единичная матрица

rank(x) = p + 1 < n

 

Формулировка метода наименьших квадратов.

МНК основан на минимизации суммы квадратов остатков

 

Определение частного уравнения регрессии.

Частное уравнение регрессии связывает результативный (эндогенный) факторY с объясняющим фактором Xi при фиксировании остальных экзогенных (Хj, j?i) переменных на среднем уровне

 

Определение гетероскедастичности.

Дисперсии не равны, а остатки зависят от 1-ой из объясняющих переменных

 

Определение гомоскедастичности.

Дисперсия остатков одинакова для всех, остатки независимы друг от друга

 

Определение мультиколлинеарности (причина возникновения).

Возникает когда между объясняющими переменными существует тесная линейная зависимость

 

Признаки мультиколлинеарности.

1. Небольшое изменение исходных данных (например, добавление новых наблюдений)

приводит к существенному изменению оценок коэффициентов модели.

2. Оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой (высокое значение коэффициента детерминации и соответствующей F-статистики).

3. Оценки коэффициентов имеют неправильные с точки зрения теории знаки или неоправданно большие значения

 

Методы устранения мультиколлинеарности.

1) при обнаружении мультиколлинеарности можно отбросить наименее значимые факторы и повторить расчеты==> получим снижение размерности

2) Вторая группа методов

2.1) метод всех возможных регрессий

• Придется перебрать большое число регрессий (Cn1+ Cn2+ Cn3+…+Cnn)

Cnm = n!

m! (n-m)!

• для каждой регрессии потребуется найти коэффициенты детерминации

• и из них выбрать максимальный

2.2) метод пошагового набора переменных (метод главных компонент)

 

Сущность метода главных компонент.

Сущность метода заключается в том, что от исходных переменных Х мы переходим к новым переменным Z, которые являются линейными комбинациями исходных переменных

 

Определение системы одновременных уравнений.

При статистическом моделировании экономических ситуаций часто необходимо построение систем уравнений, когда одни и те же переменные в различных регрессионных уравнениях могут одновременно выступать, с одной стороны, в роли результирующих, объясняемых переменных, а с другой стороны - в роли объясняющих переменных. Такие системы уравнений принято называть системами одновременных уравнений. При этом в соотношения могут входить переменные, относящиеся не только к текущему периоду t, но и к предшествующим периодам. Такие переменные называются лаговыми. Переменные за предшествующие годы обычно выступают в качестве объясняющих переменных.

 

Определение приведенной формы системы одновременных уравнений.

Приведенная форма модели – система линейных функций эндогенных

переменных от экзогенных:

Y1=δ11x1 +δ12x2 +…+ δ1mxm;

Y2=δ21x1 +δ 22x2 +…+ δ2mxm;

………………………………..

Yn=δn1x1 + δn2x2 +…+ δnmxm.

Где δij – коэффициенты приведенной формы модели.

Буквы и цифры-коэф.внизу

 

Какие характеристики используются для оценки связи между переменными? Метод, используемый для оценки связи, зависит от переменной

Если переменная количественная, то для оценки линейной связи мы используем коэффициент корреляции, для оценки нелинейной связи корреляционное отношение

Если переменная порядковая то мы используем коэффициент Спирмана, коэффициент Кендела.

Если переменная классификационная, то используется коэффициент x2 и коэффициент Крамера.

 

10. Определение оценки математического ожидания (формула). хср= 1/n*сумму х

11. Определение оценки коэффициента корреляции (формула). r =сумм((xi-xср)*(yi-yср))/корень(сумм(xi-xср)^2*сумм(yi-yср)^2)

 

13. Определение корреляционного отношения. Корреляционное отношение показывает наличие любой зависимости (строится по сгруппированным данным.



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 830; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.133.108.241 (0.036 с.)