Показатели, характеризующие вариации вокруг центральной тенденции 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Показатели, характеризующие вариации вокруг центральной тенденции



 

В §12 указывалось, что к показателям, характеризующим вариации вокруг центральной тенденции, относятся размах вариации, дисперсия, среднеквадратичное отклонение от среднего и коэффициент вариации.

О п р е д е л е н и е. Дисперсия выборки ("рассеивание") — это величина, характеризующая разброс ее значений вокруг среднего. Обозначается Д(Х).

Чем больше дисперсия, тем "случайнее" изучаемый процесс. Дисперсия определяет степень правдоподобия прогноза развития изучаемого процесса. Рассмотрим пример. Допустим, вариационный ряд имеет следующий вид: 42635445362264435. Нетрудно убедиться, что математическое ожидание для этой выборки равно 4. Это значит, как указывалось выше, что варианта 4 отражает центральную тенденцию ряда, т.е. является типичной для него и поэтому, если пытаться оценить значение восемнадцатой варианты, самое вероятное значение- это 4. При этом следует помнить, что 100%-ых прогнозов не существует, а можно говорить лишь о более или менее вероятных значениях. Теперь рассмотрим другой вариационный ряд: 43553444355533435. И здесь математическое ожидание выборки равно 4, а значит, для прогноза значения восемнадцатой варианты тоже стоит выбрать число 4. Возникает сразу ряд вопросов: в каком из этих двух случаев прогноз более состоятелен, т.е. в каком случае вероятность ошибиться меньше, с чем это связано? Забегая вперед, ответим. Во втором случае процесс менее случаен, у него суммарная степень отклонения вариант от математического ожидания меньше или, как говорят, меньше разброс. А значит, вероятность того, что значение восемнадцатой варианты равно 4, во втором случае выше, чем для первой выборки. То есть, для первой выборки значение дисперсии выше, чем для второй.

Рассмотрим, как вычисляется дисперсия.

Для точечного распределения имеем

Д(Х)= (х1 - М(Х))² р1 + (х2 - М(Х))² р2 +...+(хn -М(Х))² рn,

 

где хi — значения вариант, рi — значения соответствующих относительных частот.

Для примера 3 вычислим дисперсию. Напомним, что М(Х)=9,7. По формуле:

Д(Х)= (2-9,7)² ·1/20+ (6-9,7)² ·5/20+ (10-9,7)² ·7/20+ (12-9,7)² ·3/20+

+ (14-9,7)²·4/20=10,91.

 

С дисперсией связана другая характеристика — с р е д н е к в а д р а т и ч н о е о т к л о н е н и е (или стандарт):

σ² = Д(Х).

 

Если для некоторой выборки мы имеем М(Х) и σ, то это дает нам ориентировочное представление о том, в каких пределах могут лежать наиболее вероятные значения интересующего нас признака: [M(X)- σ, M(X)+σ].

Для примера 3 σ ≈3,3 и, значит, соответствующий интервал для выборки из примера 3 будет [6,4; 13]. Нетрудно видеть, что при большом значении дисперсии интервал прогноза будет большим, а значит, такой прогноз для исследователя не очень интересен, и он лишний раз свидетельствует о том, что интересующий процесс «весьма случаен».

Вычислим дисперсию в случае интервального распределения изучаемого признака. Каждый интервал мы заменяем его средним значением, а далее пользуемся формулой, которая использовалась для точечного распределения:

 

Д(Х) =1/n Σ (zк –М(Х))² nк =1/n Σ (zо +kh-zо - k h)² nk =h² /n Σ (k- k)² nk =

= h ²(1/n Σ k² n - к ²),

 

где k =1/n Σ knk и суммирование по k.

Проиллюстрируем описанные вычислительные процедуры, рассмотрев случай интервального распределения выборочных данных. Обратимся опять к примеру 4. Для упрощения вычислений дополним таблицу:

 

Итервалы (классы) 20-25 25-30 30-35 35-40 40-45 45-50  
Ni             S = 40
Ki -4 -3 -2 -1      
Niki -8 -9 -12 -10     S=-37
niki²             S=95

Для данного примера

Д(Х)= 5²· (1/ 40·95- (37/40)²)≈37,98; σ ≈6,16.

Следующая характеристика, также свидетельствующая об уровне вариации вокруг центральной тенденции — размах вариации.

О п р е д е л е н и е. Размах вариации — это числовая характеристика, равная по величине разности между максимальным и минимальным значениями вариант:

 

V(Х)= хmax-хmin.

 

От величины размаха вариации зависит величина дисперсии. Чем больше размах вариации, тем больше будет значение дисперсии.

О п р е д е л е н и е. Коэффициент вариации — это числовая характеристика выборки, которая показывает соотношение между математическим ожиданием выборки и ее дисперсией:

 

R(Х)=М(Х)/Д(Х)·100%.

 

Контрольные вопросы.

1. На какие группы можно разбить числовые показатели ряда?

2. С какой целью исследователь исчисляет числовые характеристики?

3. Для чего служат показатели, характеризующие центральную тенденцию ряда?

4. Для чего служат показатели, характеризующие вариации вокруг центральной тенденции ряда?

5. Что такое математическое ожидание, мода и медиана?

6. Что такое дисперсия, коэффициент вариации, размах вариации?

 

Контрольные задания

Задача 1.

Имеются данные распределения населения в Санкт- Петербурге по возрастным группам (1999г., в %):

Возрастная группа Численность населения в %
0-10 8.2
10-20  
20-30 14.3
30-40 15.4
40-50 16.5
50-60 11.1
60-70 11.1
70 и старше 9.4
всего  

Задание: рассчитать средний возраст населения.

 

Задача 2.

Рассчитать средний возраст населения Ленинградской области (на 1.01.1999г.)

Возрастная группа мужчины Женщины
0-10 9.8 9.0
10-20 17.7 13.6
20-30 15.3 12.3
30-40 16.1 14.3
40-50 17.8 16.9
50-60 9.4 9.9
60-70 9.2 12.4
70 и старше 4.7 11.6
Всего    

 

Задача 3.

По следующим данным рассчитать среднюю заработную плату населения, занятого в экономике Санкт- Петербурга в 1998 г. (декабрь):

 

Отрасль Средняя заработная плата Доля занятых в отраслях экономики, в %
промышленность   23.0
сельское хозяйство   1.0
Транспорт   10.0
строительство   10.0
торговля, общественное питание   13.0
здравоохранение, физкультура и социальное обеспечение   7.0
жилищно-коммунальное хозяйство и бытовое обслуживание населения   6.0
образование   10.0
наука и научное обслуживание   7.0
финансы, кредит, страхование, пенсионное обеспечение   6.0
управление   5.0
Другие   2.0
     

 

Задача 4.

По следующим данным рассчитать средний возраст умерших мужчин и женщин в Санкт- Петербурге в 1990 и в 1997 г. (в %):

Возрастные группы Мужчины,1990 Женщины, 1990 Мужчины,1997 Женщины, 1997  
0-10 3.9 1.6 1.1 0.6
10-20 1.1 0.4 1.0 0.3
20-30 2.8 0.7 3.5 0.9
30-40 5.3 1.6 5.8 1.7
40-50 8.7 2.8 11.8 4.2
50-60   20.2 7.1 17.4 6.7
60-70 24.7 17.8 26.9 15.6
70 и старше 34.3 68.0 32.3 69.8

 

Задача 5.

По следующим данным рассчитать средний возраст разводящихся супругов в Санкт- Петербурге в 1990 и 1997 годах (в %):

 

Возрастные группы Мужчины, 1990 Женщины, 1990 Мужчины, 1997 Женщины, 1997
18-25 10.5 17.3 7.8 13.9
25-40 58.2 57.1 57.2 56.0
40-50 18.6 15.9 22.0 20.2
50-60 9.6 7.4 8.0 6.2
60 и старше 3.1 2.3 5.0 3.7

Указание: следует учесть, что приведенные возрастные группы имеют разную длину, поэтому следует эти данные свести к данным, имеющим точечное распределение.

Задача 6.

На основе выборочного обследования получены данные о распределении семей по числу детей (в %):

 

Количество детей 1 район 2 район 3 район
       
       
       
       
       
       
6 и более      

 

Определите для каждого района:

среднее число детей в семье,

моду, медиану,

дисперсию, среднеквадратичное отклонение,

коэффициент вариации.

 

Задача 7.

На основе данных, характеризующих повозрастной состав молодежи в регионах Северо-Запада в 2000г., вычислите все числовые характерстики.

 

Возраст, лет Численность населения на 1.01.2000 в тыс. чел.
  Санкт-Петербург Ленинградская область Новгородская область Псковская Область
5-10        
10-15        
15-20        

 

Задача 8.

Для следующих данных рассчитать показатели, характеризующие центральную тенденцию и вариации вокруг центральной тенденции:

 

Сроки лишения свободы, в годах Число осужденных
До 2  
2-4  
4-6  
6-8  
8-10  
10-12  

 

Задача 9.

Для следующих данных рассчитать показатели, характеризующие центральную тенденцию ряда:

Распределение населения России по возрастным группам (1996г.)

Возраст 0-10 10-20 20-30 30-40 40-50 50-60 60-70 70 и ст.
Кол-во чел. (в млн.) 19.2 22.8 20.3 24.1 22.2   14.5  

 

Задача 10.

Для следующих данных рассчитать все числовые показатели.

Распределение населения России по возрастным группам (1998г.)

Возраст 0-10 10-20 20-30 30-40 40-50 50-60 60-70 70 и ст.
Кол-во чел. (в млн.) 16.7 23.5 20.4     14.4 14.6 11.2

Задача 11.

Для следующих данных рассчитать все числовые показатели.

Распределение населения России по возрастным группам (1999г.)

Возраст 0-10 10-20 20-30 30-40 40-50 50-60 60-70 70 и ст.
Кол-во чел. (в млн.) 15.6 23.7 20.7   23.6   14.7 11.7

 

 


ВЫВОДЫ ПО ЭКСПЕРИМЕНТУ

 

Одна из труднейших задач проведения эксперимента — подведение его итогов. Выводы по эксперименту, прежде всего, должны быть ориентированы на выдвинутую с самого начала гипотезу. Они должны подтверждать гипотезу или противоречить ей. В первом случае следует очень кратко воспроизвести основные данные, свидетельствующие в ее пользу, во втором случае - дать объяснение, попытаться выявить причину основных расхождений, и в случае принятия объективных данных, опровергающих гипотезу, изменить ее в соответствии с ними. Второе, что очень важно учесть при поведении итогов, - требование о том, чтобы выводы были соизмеримыми с экспериментальной базой и собранными данными, т.е., чтобы выводы не были «глобальными», выходящими за пределы поставленных задач и области конкретных исследований

Хотя исследователя важно предупредить о необходимости избегать развернутых выводов, тем не менее, нельзя не отметить, что при подлинно научной экспериментальной проверке какой-либо исследовательской проблемы с учетом связи ее с рядом других факторов, в эксперимент оказываются втянутыми и эти факторы, и ряд дополнительных связей. Поэтому данные и выводы по эксперименту в известной степени могут и должны затрагивать и их. Исследователь поэтому может высказать некоторые предположения о связи данной области с пограничными зонами, но все же больше он должен говорить о необходимости продолжения дальнейших исследований в этих областях с изучением дополнительных влияний или влияния тех факторов, которые были учтены еще в недостаточной мере. Делая выводы, исследователь должен еще раз оговорить условия эксперимента, которые могли повлиять на степень надежности тех данных, по которым делаются выводы, и подчеркнуть, что эксперимент не универсальный и не единственный метод, которым следует пользоваться для разработки данного аспекта, и дать оценку его роли и места в системе других методов, использовавшихся им при ведении исследований по проблеме. Если результаты эксперимента (и данные, полученные с помощью других методов ведения исследования) свидетельствуют о том, что следует ставить вопрос о необходимости внедрения тех или иных проверявшихся средств, методов и приемов обучения, исследователь, завершая свое исследование, может наметить некоторые пути осуществления этого внедрения.

Таким образом, заключительный этап обработки данных эксперимента включает:

1. Соотнесение выводов с общей и частной гипотезой.

2. Четкое ограничение области, на которую могут быть распространены полученные выводы.

3. Высказывание предположений о возможности их распространения на некоторые пограничные области и указание основных направлений дальнейших исследований в этой и смежной областях.

4. Оценку степени важности выводов в зависимости от чистоты условий эксперимента.

5. Оценку роли и места эксперимента в системе других применявшихся в данном исследовании методов.

6. Практические предположения о внедрении в практику результатов проведенного исследования.

Контрольные вопросы.

1. На что в первую очередь ориентированы выводы из эксперимента?

2. Какая информация должна быть отражена в выводах?



Поделиться:


Последнее изменение этой страницы: 2017-02-05; просмотров: 544; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.142.119.241 (0.03 с.)