Статистические методы изучения взаимосвязей в массовых явлениях: виды; уравнения парной и множественной корреляция на основе мнк. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистические методы изучения взаимосвязей в массовых явлениях: виды; уравнения парной и множественной корреляция на основе мнк.



 

Корреляционно-регрессионная связь для условий парной корреляции имеет вид: ухi = f(хi) + ξ (ξ – случайные факторы). В данной связи из-за влияния случайных факторов (ξ) управленческие решения принимаются в условиях неопределенности и риска. Показатель корреляции (коэффициент r) характеризует наличие, величину тесноты и характеристику силы связи между факторным (х) и результирующим (у) признаками. Регрессия – это графическая форма и аналитическая зависимость (математическая формула) среднего значения результативного признака (ухi) от факторного признака (хi). Прямолинейная модель регрессии для парной (однофакторной) корреляции имеет вид: ух0 + а1х. При множественной корреляции результирующий признак зависит от нескольких факторных признаков и суммы случайных факторов ух=f(х1, х2, …….хn) + ∑ ξ.

Модель прямолинейной регрессии для двухфакторной корреляции имеет вид (уравнение плоскости): ух1х2 = а0 + а1х1 + а2 х2.

 

Корреляционная связь и корреляционный анализ выявляет наличие и величину тесноты связей и взаимозависимости между двумя или несколькими признаками изучаемых процессов и их моделей и характеризуется изменением среднего значения результативного признака под влиянием факторов с переменной величиной признака.

Регрессионная связь и регрессионный анализ выявляют форму и аналитическое выражение (уравнение) корреляционной связи, в котором изменение результативного признака (ух) обусловлено влиянием одной или нескольких независимых (хn).

Исходной информацией и материальной основой корреляционно-регрессионного анализа являются данные статистического наблюдения изучаемых массовых явлений и процессов в виде фактических эмпирических (из данных наблюдения) параллельных (в пространстве и во времени) рядов численных значений результирующего (уфi=1,n) и факторного (хфi=1, n) признаков (уфi: уф1, уф2, уф 3 …. уфn; хфi: хф1, хф2, хф3 ….. хфn ), по координатам которых на графике строится эмпирическая ломаная линия уф. Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических единиц (совокупностей) взаимосвязанных массовых явлений или процессов.

Однофакторная (парная) корреляция.

Для осуществления корреляционного анализа (выявления корреляционной связи и величины ее тесноты между уфi. и хфi) и регрессионного анализа, необходимо по виду фактической (эмпирической) ломаной линии (уфллi) на графике подобрать вид теоретической типовой линии (уттлi), имеющей аналитическое выражение, которая после подстановки в нее фактических значений факторного признака (хфi) становится теоретической аналоговой линией (уттлi) и наилучшим образом заменяет и описывает (аппроксимирует) закономерность и основную тенденцию (тренд) развития изучаемого массового экономического процесса – зависимости капитальных затрат на ремонт технологического оборудования от срока его эксплуатации.. При выборе и замене ломаной линии прямой линией, имеющей вид ух = а0 + а1х (1) и подстановки в нее фактических значений переменного факторного признака (хфi), она становится теоретической аналоговой линией аппроксимации утхi = а0 + а1 хфi (2), т.е. математической моделью регрессии изучаемого массового процесса. Для практического применения уравнения (2) в прогнозировании, планировании, интерполяции и экстраполяции во всем диапазоне возможного существования изучаемого массового процесса, необходимо определить его параметры а0 и а1, используя метод наименьших квадратов (МНК), математическое выражение которого имеет вид Fy=Σ(уiт – уiф)2 →min (3). Подставим в (3) выражение уiт из (2): Fy = Σ(а0 + а1хiф – уiф)2 →min (4). Функция (4) будет иметь наименьшее значение при условии равенства «нулю» ее частных производных по а0 а1.

В связи с тем, что функция (4) является сложной функцией Fy [(у (х)] (5), для вывода формул расчета а0 и а1 необходимо использовать правила дифференцирования шести видов производных (I-VI). Производная «сложной функции» (5) имеет вид (I) dF / dy * dy / dx = 0 (6). Произведем замену в выражении (4):

0 + а1хi – уi) = z (6), при этом а0 , а1 и z становятся (являются, как искомые) переменными величинами, а х и у – постоянными. Тогда выражение (4) при замене переменных будет иметь вид Fy = Σ(а0 + а1хi – уi)2 = Σ(z)2 (7), а сложная функция (5) примет значение Fy [z (а01)] (7). Дифференцирование сложной функции (7) дает систему производных 2-х сложных функций:

а) dF / dz * dz / dа0 = 0, б) dF / dz * dz / dа1= 0 (8).

Проведем последовательно дифференцирование в системе (8).

Для выражения dF / dz = '[Σ(z)2] = 0 применим правило производной от «переменной в степени» (II): '(zn) = n zn–1. При n = 2 получим: '(z2) = 2 z2–1 или 2 z = 0 (9). Разделим левую и правую части выражения (9) на «2» и получим z = 0 (10) или с учетом произведенной замены (6)

dF / dz = '[Σ(z)2] = '[Σ(а0 + а1х – у)2] = Σ(а0 + а1х – у) = 0 (11).

Для выражения dz / dа0 = '[а0 + а1х – у ](dао) = 0 применим правила: производной от «алгебраической суммы» (III) '[а0 + а1х – у](dао) = '(а0)+'(а1x) + '(y) =0 (12); производной от «переменной величины» ('х = 1) (IV) - '(а0) = 1; производной от «постоянной величины» ('С = 0) (V) - '(а1x) =0 и '(y) =0 (а1, x и y - постоянные).

Тогда dz / dа0 = '[а0 + а1х – у ](dао) = 1 + 0 + 0 = 1, а выражение (8а) будет иметь вид dF / dz * dz / dа0 = Σ(а0 + а1х – у) * 1 = Σ(а0 + а1х – у) = 0 или

Σа0 + а1Σх – Σу = 0, откуда (при Σа0 = n а0) n а0 + а1 Σх = Σу (13).

Для выражения dz / dа1 = '[а0 + а1х – у ](dа1) = 0 применим правила дифференцирования в уравнениях (12) и (13) (а0, x и y - постоянные), а также правило производной от «переменной (а1) с постоянным множителем (х)» (VI) -

'(а1x) = '(а1) * x = 1 * х, тогда '(а0)+'(а1x) + '(y) = 0 + 1 * х + 0 = х, а выражение (8б) будет иметь вид dF / dz * dz / dа1= Σ(а0 + а1х – у) * х = 0 или

а0 Σ + а1Σх2 = Σху (14). Таким образом выражения (13) и (14) представляют собой систему совместных уравнений 0 1Σх =Σу и а0 Σ х+ а1Σх2 = Σху (15).

Формулы для расчета параметров (а0, а1) уравнения регрессии (2) можно получить из (15), используя метод подстановок соответствующих сумм по фактическим данным из таблицы или метод определителей Крамера (∆0, ∆а0, ∆а1: а0 = ∆а0 /∆0; а1 = ∆а1 / ∆0). Пронумеруем элементы системы (15) без параметров a0 и а1:

(1) n + (2) Σх = (3) Σу и (4) Σх + (5) Σх2= (6) Σху (7а).

По правилам определителей получим: ∆0 = (1 * 5) – (2 * 4) = n Σх2 – Σх Σх;

а0 = (3 * 5) – (2 * 6) = Σу Σх2 - Σх Σху; ∆а1 = (1 * 6) – (3 * 4) = n Σху - Σх Σу,

откуда ; (8).

Уравнение (7) можно решить и методом подстановки в него соответствующих сумм из аналитической таблицы расчетных данных.

Обоснованием типичности, значимости и возможности практического использования синтезированной (построенной) модели (2) и ее параметров a0, а1, необходима их оценка по условию t-критерия Стьюдента (по его табличному значению tа0 > t кр таб < tа1), по коэффициенту корреляции r, определяющего тесноту корреляционной связи между уфi. и хфi, по коэффициенту детерминации r2, характеризующего долю (%) вариации уфi от влияния хфi с учетом влияния суммы случайных величин на основе уравнения ухi = f(хi) + ξ [ухi = f (r2 + ξ)].



Поделиться:


Последнее изменение этой страницы: 2016-08-12; просмотров: 116; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.138.125.2 (0.006 с.)