Глава 9. Статистическое изучение взаимосвязи социально-экономических явлений



Мы поможем в написании ваших работ!


Мы поможем в написании ваших работ!



Мы поможем в написании ваших работ!


ЗНАЕТЕ ЛИ ВЫ?

Глава 9. Статистическое изучение взаимосвязи социально-экономических явлений



 

Основные понятия

Все социально-экономические явления взаимосвязаны. Связь между ними носит причинно-следственный характер. Признаки, характеризующие причины и условия связи, называются факторными (х), а те, которые характеризуют последствия связи, - результативными (у). Между признаками х и у возникают разные по природе и характеру связи, в частности функциональные и стохастические. При функциональной связи каждому значению признака х отвечает одно четко определенное значение у. Эта связь проявляется однозначно в каждом конкретном случае. При стохастической связи каждому значению признака х отвечает определенное множество значений у, которые образовывают так называемое условное распределение. Как закон эта связь проявляется только в массе случаев и характеризуется изменением условных распределений у. Если заменить условные распределения средней величиной у, то образуется разновидность стохастической связи – корреляционная. В случае корреляционной связи каждому значению признака х отвечает среднее значение результативного признака у.

Примером стохастической и, в частности, корреляционной связи является распределение проданных на бирже недвижимости однокомнатных квартир по их стоимости у и размеру общей площади х (табл. 9.1).

 

Таблица 9.1 – Распределение проданных на бирже недвижимости однокомнатных квартир по их стоимости и размеру на 1.01.2010 г.

Размер общей площади, м2, x Количество квартир стоимостью тыс. усл. ед. Средняя стоимость квартиры. тыс. усл. ед.
9–11 11–13 13–15 15–17 17–19 Всего,
До 25 10,8
25–30 13,2
30–35 15,2
35 и более 18,0
Всего: 13,0

 

Каждой группе по факторному признаку отвечает свое распределение у, которое отличается от других групп и от безусловного итогового распределения. Следовательно, наблюдается стохастическая связь между признаками.

Условные распределения можно заменить средними значениями результативного признака, которые вычисляют как среднюю арифметическую взвешенную.

Постепенное изменение средних от одной группы к другой свидетельствует о наличии корреляционной связи между признаками.

Характеристикой корреляционной связи является линия регрессии, которую рассматривают в двух моделях - аналитической группировки и регрессионного анализа. В модели аналитической группировки это эмпирическая линия регрессии, которая образовывается из групповых средних значений результативного признака для каждого значения (интервала) .

Эффекты воздействия х на у определяют как отношение приростов средних групповых значений:

, где

.

По данным таблицы 9.1 приросты во всех группах одинаковы – 5 м², а средняя стоимость проданных квартир увеличивается по группам следующим образом:

тыс. усл. ед.;

Следовательно, с увеличением размера общей площади квартир на 1 м² их стоимость в среднем растет соответственно на:

тыс. усл. ед. и на 0,4 и 0,56.

Оценка плотности связи основывается на правиле сложения дисперсий. В модели аналитической группировки мерой плотности связи выступает отношение межгрупповой дисперсии к общей, которое называется корреляционным отношением:

,

где – общая дисперсия, которая измеряет вариацию результативного признака у, обусловленную воздействием всех возможных факторов;

– межгрупповая дисперсия, которая измеряет вариацию результативного признака у под воздействием только группировочного признака х.

Корреляционное отношение колеблется от нуля до единицы, а если выразить в процентах, то от 0 до 100 %. При отсутствии связи , а при условии функциональной связи Чем больше приближается к единице, тем более плотная связь.

По данным таблицы 9.1 общая дисперсия стоимости проданных квартир будет равна:

В таблице 9.2 приведена аналитическая группировка проданных квартир, которая описывает зависимость их стоимости от общей площади. Там же дан расчет межгрупповой дисперсии.

 

Таблица 9.2 – Аналитическая группировка проданных на бирже квартир

Общая площадь квартиры , м² Количество квартир Средняя стоимость квартиры , тыс. усл. ед.
До 25 10,8 -2,2 193,6
25÷30 13,2 0,2 1,2
30÷35 15,2 2,2 116,2
35 и более 18,0 5,0 150,0
Итого 13,0 - 461,0

 

Корреляционное отношение

следовательно, вариация стоимости проданных квартир на 66 % объясняется вариацией их общей площади и на 34 % - вариацией других факторов, т.е. связь между признаками достаточно плотная.

Однако плотная связь может возникнуть случайно, поэтому необходимо проверить ее тесноту, т.е. доказать неслучайность связи. Проверка тесноты связи – это сравнение фактического значения с его критическим значением для определенного уровня тесноты α и числа степеней свободы и , где - число групп, - объем совокупности. Если > , то связь признается существенной. Критические значения корреляционного отношения для приведены в специальных таблицах.

В нашем примере Из-за отсутствия в таблице критических значений используем ближайшее ( ), тогда .

Поскольку то связь признается существенной с вероятностью 0,95.

В модели регрессивного анализа характеристикой корреляционной связи является теоретическая линия регрессии, описываемая функцией которая называется уравнением регрессии. В зависимости от характера связи используют:

- линейные уравнения когда с изменением х признак у изменяется более или менее равномерно;

- нелинейные уравнения, когда изменение взаимосвязанных признаков происходит неравномерно (с ускорением, замедлением или с переменным направлением связи), в частности: степенное гиперболическое параболическое и т.п.

Чаще применяют линейные уравнения или приведенные к линейному виду. В линейном уравнении параметр b - коэффициент регрессии указывает, на сколько единиц в среднем изменится у с изменением х на единицу. Он имеет единицу измерения результативного признака. В случае прямой связи b – величина положительная, а при обратной - отрицательная. Параметр a – свободный член уравнения регрессии, т.е. это значение Y при х = 0. Если х не приобретает нулевые значения, то данный параметр имеет только расчетное значение. Параметры определяются методомнаименьших квадратов, согласно которому сумма квадратов отклонений эмпирических значений у от Y минимальна: В соответствии с условием минимизации параметры линейного уравнения регрессии вычисляют на основании системы нормальных уравнений:

Отсюда

Для расчета параметров уравнения параболы второго порядка методом наименьших квадратов система нормальных уравнений имеет следующий вид:

Коэффициент регрессии в небольших по объему совокупностях подвержен случайным колебаниям. Поэтому проверяют его существенность с помощью t критерия (Стьюдента):

где b – коэффициент регрессии;

- стандартная погрешность, которую рассчитывают по формуле:

где соответственно остаточная и факторная дисперсии;

n – объем совокупности.

Характеристикой относительного изменения у вследствие изменения х есть коэффициент эластичности:

который показывает, на сколько процентов в среднем меняется результативный признак с изменением факторного на 1 %.

На основании уравнения регрессии определяют теоретические значения Y, т.е. значение результативного признака при условии воздействия только фактора х при неизменном уровне других факторов.

Отклонения эмпирических значений у от теоретических Y называют остаточными. Они характеризуют воздействие на результативный признак всех других факторов, кроме х. Средний размер этих отклонений определяет остаточная дисперсия

.

Вариацию у, обусловленную воздействием только фактора х, называют факторной дисперсией:

Доля факторной дисперсии в общей характеризует плотность связи и называется коэффициентом детерминации:

Он имеет такой же смысл, интерпретацию и цифровые границы, что и

Плотность связи оценивается также индексом корреляции , однако интерпретируется только Для линейной связи используют линейный коэффициент корреляции (Пирсона) r:

который принимает значения в границах , поэтому характеризует не только плотность, но и направление связи. Положительное значение свидетельствует о прямой связи, а отрицательное – об обратной.

Абсолютное значение r равно индексу корреляции:

Однако для интерпретации r необходимо перейти к уравнению Проверка существенности связи выполняется таким же образом, как и в модели аналитической группировки, путем сравнения и Отличия касаются только определения , в которых m – число параметров уравнения регрессии.

Проверка существенности связи в обеих моделях может определяться также по критерию Фишера, который функционально связан с и :

или

поэтому процедура проверки и выводы идентичны.

 

Тест

Выберите правильный ответ:

1. По направлению связи бывают:

а) умеренные;

б) прямые;

в) прямолинейные.

2. Функциональной является связь:

а) между двумя признаками;

б) при которой определенному значению факторного признака соответствует несколько значений результативного признака;

в) при которой определенному значению факторного признака соответствует одно значение результативного признака.

3. Математическое выражение коэффициента линейной корреляции имеет следующий вид:

а) ; б) ; в)

4. С помощью корреляционно-регрессионного анализа изучают следующие типы взаимосвязей между явлениями:

а) компонентные;

б) факторные;

в) балансовые.

5. Факторный признак – это:

а) признак, обуславливающий изменение другого, связанного с ним;

б) признак, изменяющийся под воздействием другого.

6. Зависимость между результативным и одним факторным признаком при фиксированном значении других признаков – это:

а) множественная корреляция;

б) частная корреляция;

в) парная корреляция.

7. Изменение тесноты, направления связи и установление аналитического выражения связи носит название:

а) корреляционного анализа;

б) корреляционно-регрессионного анализа;

в) регрессионного анализа.

8. Коэффициент детерминации (d) выражается следующим образом:

а) ; б) ; в) .

9. Косвенные связи имеют место в случае:

а) когда факторы взаимодействуют между собой непосредственно;

б) когда связь устанавливается формально, подтверждаясь только количественными оценками;

в) когда связь характеризуется участием какой-либо переменной, опосредующей связь между изучаемыми признаками.

10. Установление формы зависимости, определение функции регрессии, использование уравнения для оценки значений зависимой переменной – это задачи:

а) регрессионного анализа;

б) корреляционного анализа;

в) корреляционно-регрессионного анализа.

11. Анализ тесноты и направления связей двух признаков осуществляется на основе:

а) парного коэффициента корреляции;

б) частного коэффициента корреляции;

в) множественного коэффициента детерминации.

12. Для проверки типичности параметров уравнения регрессии используется:

а) критерий Фишера;

б) среднее квадратическое отклонение;

в) критерий Стьюдента.

13. Аналитическое выражение связи определяется с помощью методов анализа:

а) корреляционного;

б) регрессионного;

в) группировок.

14. Показателем, показывающим, какая часть общей вариации результативного признака объясняется изучаемым признаком - фактором, является:

а) коэффициент детерминации;

б) индекс корреляции;

в) индекс регрессии.

15. Коэффициент эластичности определяется следующим образом:

а) ; б) ; в) .

16. Для расчета коэффициента множественной корреляции применяется формула:

а) ;

б) ;

в) .

Задачи

Примеры решения задач

Пример 1.При проверке веса импортируемого груза на таможне методом случайной повторной выборки было отобрано 200 изделий. В результате был установлен средний вес изделия 30 г при среднем квадратическом отклонении 4 г. С вероятностью 0,997 определите пределы, в которых находится средний вес изделий в генеральной совокупности.

Решение:

Сначала рассчитаем предельную ошибку выборки.

Так, при р = 0,997, t = 3. При случайном повторном отборе предельная ошибка выборки определяется по формуле:

Определим пределы генеральной средней:

.

30 – 0,84 30 +0,84, или 29,16 30,84.

Следовательно, с вероятностью 0,997 можно утверждать, что средний вес изделий в генеральной совокупности находится в пределах от 29,16 до 30,84 г.

Пример 2.В городе проживает 250 тыс. семей. Для определения среднего числа детей в семье была организована 2 %-я случайная бесповторная выборка семей. По её результатам было получено следующее распределение семей по числу детей (табл. 9.1).

Таблица 9.1 – Распределение семей по числу детей

в городе в 2010 г.

Число детей в семье, чел. Количество детей, чел.
1 000
2 000
1 200

 

С вероятностью 0,954 найдите пределы, в которых будет находиться среднее число детей в генеральной совокупности.

Решение: вначале на основе имеющегося распределения семей определим выборочную среднюю и дисперсию. Для удобства расчет оформим в виде таблицы 9.2.

 

Таблица 9.2 – Вспомогательные расчеты для определения дисперсии и выборочной средней

Число детей в семье Количество семей
-1,5 2,25
-0,5 0,25
0,5 0,25
1,5 2,25
2,5 6,25
3,5 12,25
Итого:

 

чел.;

Вычислим теперь предельную ошибку выборки (с учетом того, что p = 0,954 и t = 2). Для случайной бесповторной выборки предельная ошибка вычисляется по формуле:

Следовательно, пределы генеральной средней:

Таким образом, с вероятностью 0,954 можно утверждать, что в среднем на каждые две семьи приходятся три ребенка.

Пример 3. С целью определения доли сотрудников коммерческих банков области в возрасте старше 40 лет предполагается организовать типическую выборку пропорционально численности сотрудников мужского и женского пола с механическим отбором внутри групп. Общее число сотрудников банков составляет 12 тыс. человек, в том числе 7 тыс. мужчин и 5 тыс. женщин.

На основании предыдущих обследований было известно, что средняя из внутригрупповых дисперсий составляет 1600. Определите необходимый объем выборки при вероятности 0,997 (t = 3) и ошибке 5 %.

Решение: рассчитаем общую численность типической бесповторной выборки:

человек.

Вычислим объем отдельных типических групп:

человек;

человек.

Таким образом, необходимый объем выборочной совокупности сотрудников коммерческих банков составляет 550 человек, в том числе 321 мужчина и 231 женщина.

 

Задачи

1. В акционерном обществе 200 бригад рабочих. Планируется проведение выборочного обследования с целью определения удельного веса рабочих, имеющих профессиональные заболевания. Известно, что межсерийная дисперсия доли равна 225. С вероятностью 0,954 (t = 2) рассчитайте необходимое количество бригад для обследования рабочих, если ошибка выборки не должна превышать 5 %.

 

2. Каким должен быть объём случайной бесповторной выборки из генеральной совокупности численностью 10000 единиц при среднем квадратическом отклонении не более 20, предельной ошибке, не превышающей 5 %, и вероятности 0,997 (t = 3).

 

3. Из партии импортируемой продукции на посту таможни было взято в порядке случайной бесповторной выборки 20 проб продукта А. В результате проверки установлена средняя влажность продукта А в выборке, которая оказалась равной 6 % при среднем квадратическом отклонении 1 %. С вероятностью 0,683 (t = 1) определите пределы средней влажности продукта во всей партии импортируемой продукции.

 

4. С целью определения средних затрат времени при поездках на работу населением города планируется выборочное обследование на основе случайного повторного отбора. Сколько людей должно быть обследовано, чтобы с вероятностью 0,954 (t = 2) ошибка выборочной средней не превышала 1 мин. при среднем квадратическом отклонении 15 мин.

 

5. В одном из лесничеств области методом случайной выборки обследовано 1000 деревьев с целью установления их среднего диаметра, который оказался равным 210 мм при мм. С вероятностью 0,683 (t = 1) определите пределы среднего диаметра деревьев в генеральной совокупности.

 

6. Из партии в 1 млн шт. мелкокалиберных патронов путем случайного отбора взято для определения дальности боя 1000 шт. Результаты испытаний представлены в таблице 9.3.

 

Таблица 9.3 – Распределение мелкокалиберных

патронов по дальности боя

Дальность боя, м Число патронов, шт.
Итого:

 

С вероятностью 0,954 (t = 2) определите среднюю дальность боя по выборке, ошибку выборки и возможные пределы средней дальности боя всей партии патронов.

 

7. В порядке механической выборки обследован возраст 100 студентов вуза из общего числа 2000 человек. Результаты обработки материалов наблюдения приведены в таблице 9.4.

Таблица 9.4 – Распределение студентов вуза

по возрасту на 15.09.10 г.

Возраст студентов, лет Число студентов, чел.

 

Установите:

а) средний возраст студентов вуза по выборке;

б) величину ошибки при определении возраста студентов на основании выборки;

в) вероятные пределы колебания возраста для всех студентов при вероятности 0,997 (t = 3).

 

8. С целью определения средней фактической продолжительности рабочего дня в государственном учреждении с численностью служащих 480 человек в июне 2010 г. была проведена 25 %-я механическая выборка. По результатам наблюдения оказалось, что у 10 % обследованных потери времени достигали более 45 мин. в день. С вероятностью 0,683 (t = 1) установите пределы, в которых находится генеральная доля служащих с потерями рабочего времени более 45 мин. в день.

 

9. В области, состоящей их 20 районов, проводилось выборочное обследование урожайности на основе отбора серий (районов). Выборочные средние по районам составили соответственно 14,5; 16; 15,5 и 14 ц/га. С вероятностью 0,954 (t = 2) найдите пределы урожайности во всей области.

 

10. В 100 туристических агентствах города предполагалось провести обследование среднемесячного количества реализованных путевок методом механического отбора. Какова должна быть численность выборки, чтобы с вероятностью 0,683 ошибка не превышала три путевки, если по данным пробного обследования дисперсия составляет 225?


РАЗДЕЛ 3



Последнее изменение этой страницы: 2016-04-20; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 35.172.136.29 (0.04 с.)