Сложение дисперсий изучаемого признака. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Сложение дисперсий изучаемого признака.



Ряды распределения.

План:

1. Задачи сводки и ее содержание.

2. Метод группировки.

3. Ряды распределения.

 

1. Задачи сводки и ее содержание.

На основе информации, собранной в ходе статистического наблюдения, как правило, нельзя непосредственно выявить и охарактеризовать закономерности социально-экономических явлений. Это связа с тем, что наблюдение дает сведения по каждой единице исследуемой статистической совокупности. Полученые данные не являются обобщающими показателями. С их помощью нельзя сделать выводы в целом об объекте исследований без предварительной обработки данных.  

Поэтому цель следующего этапа статистического исследования состоит в систематизации первичных данных и получений на этой основе сводной характеристики всего объекта при помощи обобщающих статистических показателей.

Сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присующих изучаемому явлению в целом.

Результатом сводки является данные, отражающие (характеризующие) в целом всю совокупность. 

По глубине обработки материала сводка бывает простая и сложная.

Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюденения.

Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчету итогов по каждой группе и всему объекту и предстаывление результатов группировки в виде статистических таблиц.

 

Метод группировки.

Под группировкой понимают расчленение единиц изучаемой статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику таких групп системой показателей.

С помощью метода группировок решаются следующие задачи:

*  выделение социально-экономических типов явлений;

*  изучение структуры явления и структурных сдвигов, происходящих в нем;

*  выявление связи и зависимости между явлениями.

Статистические группировки по задачам, решаемым с их помощью, делятся на: типологические, структурные и аналитические.

Типологическая группировка - это разделение иследуемой качественно разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки. Примером типологической группировки является группировка промышленных предприятий по формам собственности.

Структурной называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку. С помощью таких группировок могут изучаться: состав предприятий по численности занятых, стоимости основных фондов и т. д.

Аналитической группировкой называется группировка, которая выявляет взаимосвязи между изучаемыми явлениями и их признаками.

Группировка, в которой группы образованы по одному признаку, называется простой. Для характеристики явления бывает недостаточно разбить совокупность на группы по какому-то одному признаку. В этом случае строят сложные группировки.

Сложной называется группировка, в которой разделение совокупности на группы производится по двум и более признакам, взятым в сочетании.

Признак, на основе которого производится разбивка единиц совокупности на отдельные группы, называется группировочным признаком или основанием группировки.  

В основание группировки могут быть положены как качественные, так количественные признаки.

При группировке по атрибутивному признаку число групп определяется количеством соотвествующих наименований, если число этих наименований не очень велико.

Если признак имеет большое количество разновидностей, то при группировке ряд наименований объединяют в одну группу. Для обосновния объединения их в группы разрабатываются классификации.   

 При группировке по количественному признаку число групп определяется в зависимости от хакрактера изменения признака и задач исследования.

Если количественный признак меняется дискретно, то число групп соответствует количеству значений признака.

Если количественныйпризнак меняется непрерывно, то группы образуют с помощью интервалов.

Интервал - это значения варьирующего признака, лежащие в определенных границах.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака.

Величина интервала - разность между верхней и нижней границами интервала.

Интервалы группировки могут быть закрытыми и открытыми.

Закрытые интервалы - это интервалы, имеющие как нижние, так и верхние границы. 

Открытые интервалы - это интервалы, имеющие какую-либо одну границу - верхнюю или нижнюю.

На практике используется два вида интервалов: равные, неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Равные интервалы используются в случае если признак меняется более или менене равномерно.

Величина равного интервала определяется по формуле:

,

где xmax , xmin - соответственно максимальное и минимальное значение признака в совокупности;

m - число групп.

Число групп может быть приближенно определено с помощью формулы Стерджесса:

,

где n - общее число единиц совокупности (объем совокупности).

Величину интервала обычно округляют до целого (всегда большего) числа.  

Нижнюю границу первого интервала принимают равной минимальному значению признака(чаще всего его предварительно округляют до целого числа); верхняя граница первого интервала определяется как: (xmin+h). Для последующих групп границы определяются аналогично, т. е. последовательно прибавляется величина интервала. 

Неравные интервалы применяются в статистике, когда значения признака меняются неравномерно и в значительных размерах. Неравные интервалы могут быть прогрессивно возрастающими или убывающими в арифметической или геометрической прогрессии.

 Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических таблиц и рядов распределения.

Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. Для того, чтобв привести такие группировки к сопоставиму виду, используется метод вторичной группировки. Суть метода состоит в перегруппировке единиц объекта без обращения к первичным данным.

Вторичная группировка - операция по образованию новых групп на основе ранее построенной группировки.

Применяют два способа образования новых групп.

Метод объединения первоначальных интервалов, является наиболее простым и распространенным методом, и применяется в случае перехода от мелких к более крупным интервалам, когда границы новых и старых интервалов совпвадают.

Метод долевой перегруппировки состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности.    

 

Ряды распределения.

 

Ряд распределения представляет собой упорядоченное расположение единиц изучаемой совокупности по группам в соответствии с выбранным группировочным признаком.

Основная цель построения рядов распределения заключается в выявлении основных свойств и закономерностей статистической совокупности.

Ряды распределения характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта.

В зависимости от того, является ли признак взятый за основу группировки, качественным или количественным, различают соответственно два типа рядов распределения: атрибутивные и вариационные.

В зависимости от характера признака, положенного в основу группировки вариационные ряды подразделяют на дискретные и интервальные. Способы построения дискретного и интервального вариационных рядов различны.

В общем виде вариационный ряд распределения представляет собой таблицу, которая состоит из двух основных граф: варианты и частоты.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота - количество той или иной варианты встречающейся в изучаемой совокупности.

В случае построения дискретного вариационного ряда распределения в первой графе указываются конкретные значения признака, во второй графе - численность единиц с определенным значением признака (т. е. частоту).

Для признака, имеющего непрерывное изменение, строится интервальный вариационный ряд. При его построении в первой графе отдельные значения признака указываются в интервалах “от - до”, во второй графе число единиц, входящих в интервал. Интервалы образуются, как правило, равные и закрытые.

В случае построения атрибутивного ряда распределения в первой графе указывают значения качественного признака, а во второй - число элементов совокупности, имеющих то или иное значение признака.

В ряде случаев, в зависимости от целей исследования, вариационный ряд распределения, состоящий из двух граф, иногда дополняется другими графами, необходимыми для вычисления отдельных статистических показателей. Достаточно часто в ряд вводится графа, в которой подсчитываются накопленные частоты (S).

Накопленные частоты - показывают, сколько единиц изучаемой совокупности имеют значение признака не больше, чем данное значение, и вычисляются путем последовательного прибавления к частоте первого интервала частот последующих интервалов.

Частоты ряда (f) могут быть заменены частостями (w), которые представляют собой частоты, выраженные в относительных числах (долях или процентах) и рассчитанные путем деления частоты каждого интервала на их общую сумму (или, что тоже самое, на объем совокупности):

.

Замена частот частостями позволяет сопоставить вариационные ряды с различным числом наблюдений.

Если вариационный ряд дан с неравными интервалами, то для правильного представления о характере распределения необходимо произвести расчет абсолютной или относительной плотности распределения.

Абсолютная плотность распределения (р) представляет собой величину частоту, приходящейся на единицу размера интервала отдельной группы ряда:

.

Относительная плотность распределения (р’) - частное от деления частости отдельной группы на размер ее интервала:

.

При изучении рядов распределения часто прибегают к их графическому изображению. Такое представление ряда распределения облегчает его анализ и позволяет судить о форме распределения.

Дискретный вариационный ряд изображается в виде полигона распределения частот. Для изображения интервального ряда применяются полигон распределения частот и гистограмма частот. В случае неравенства интервалов гистограмма строится не по частотам или частостям, а по плотности распределения.

Графики строятся в прямоугольной системе координат.

В ряде случаев для изображения вариационных рядов используется кумулятивная кривая (кумулята), она особенно удобна для сравнения вариационных рядов.

Если поменять местами оси координат в кумуляте, то получаем новый вид графического изображения ряда распределения - огиву.

Пример.

Необходимо графически изобразить интервальный ряд распределения:

x f S
0 - 2 4 4
2 - 4 6 10
4 - 6 12 22
6 - 8 8 30
8 - 10 4 34
10 - 12 2 36

 

Гистограмма                                         Полигон

 

Кумулятивная кривая

Для анализа вариационных рядов используются три группы показателей:

*  показатели центра распределения;

*  показатели вариации (см. соответствующую тему);

*  показатели формы распределения.

К показателям центра распределения относятся: средняя арифметическая, мода и медиана (см. тему: “Средние величины”).

 

Тема 4. Абсолютные и относительные величины.

План:

1. Абсолютные величины.

2. Относительные величины.

 

Абсолютные величины.

Абсолютные величины характеризуют численность совокупности и объем (размер) изучаемого социально-экономического явления в определенных границах времени и места. Они являются всегда именованными показателями, т. е. имеют какую-либо единицу измерения. Единицы измерения могут быть натуральные, условно-натуральные, стоимостные и трудовые. Выбор единицы измерения зависит от сущности изучаемого явления и конкретных задач исследования.

Натуральные единицы измерения применяют в тех случаях, когда единица измерения соответствует потребительским свойствам продукта. Например, производство стали оценивается в тоннах, тканей - в квадратных метрах, автомобилей - в штуках и т. д.

Натуральные единицы могут быть и составными (сложными). Например, отработанное рабочими время учитывается в человеко-днях и человеко-часах, грузооборот транспорта - в тонно-километрах и т. п.

Для учета одного и того же вида продукции могут применяться различные единицы измерения. Делается это для того, чтобы полнее охарактеризовать потребительское назначение продукции и изменение ее состава. Например, производство электродвигателей учитывается в штуках и киловаттах мощности; бумаги - в тоннах и квадратных метрах и т. п.

Если некоторые разновидности продукции обладают общностью потребительского свойства, то обобщенные итоги по выпуску этих разновидностей продукции можно получить используя условно-натуральные единицы. В этом случае одна из разновидностей принимается в качестве единого измерителя, а другие приводятся к этому соизмерителю с помощью соответствующих коэффициентов пересчета.

При обобщении учетных данных на уровне предприятий, отраслей и народного хозяйства широко используются стоимостные единицы измерения. 

Абсолютные величины подразделяются на две группы:

· абсолютные величины, характеризующие объем явления на определенную дату (моментные показатели);

· абсолютные величины, характеризующие объем явления за определенный период времени (интервальные показатели).

Абсолютные величины первой группы имеют особенность: если они характеризуют объем явления на определенную дату по нескольким единицам (например, стоимость ОПФ по предприятиям фирмы), то их можно суммировать и получить общий объем явления. Если данные характеризуют объем явления по одной единице на несколько моментов (например, стоимость ОПФ на начало каждого квартала), то эти абсолютные величины суммировать нельзя.

Абсолютные величины второй группы можно суммировать за одинаковые периоды по нескольким единицам, а также по одной единице за несколько периодов, получая итог за более длительный период. 

Изучая экономические явления, статистика не может ограничиваться вычислением только абсолютных величин. Анализ - это прежде всего сравнение, сопоставление статистических данных. В результате сравнения получают качественную и количественную оценку экономических явлений, которая выражается в виде относительных величин.

 

Относительные величины.

Относительная величина - представляет собой результат сопоставления двух статистических показателей, дает количественную меру их соотношения. Она получается путем деления сравниваемого показателя на другой показатель, принимаемый за базу сравнения.

Относительные величины делятся на две группы:

·  относительные величины, полученные в результате соотношения одноименных статистических показателей;

·  относительные величины, представляющие результат сопоставления разноименных показателей.

К относительным величинам первой группы относятся:

- относительные величины динамики;

- относительные величины планового задания;

- относительные величины выполнения плана;

- относительные величины структуры;

- относительные величины координации;

- относительные величины наглядности. 

Результат сопоставления одноименных показателей представляет собой коэффициент, показывающий, во сколько раз сравниваемая величина больше (или меньше) базисной. Результат может быть выражен в процентах.

Относительные величины динамики характеризуют изменение явления во времени. Они показывают, во сколько раз увеличился (или уменьшился) объем явления за определенный период времени, их называют коэффициентами роста. Коэффициенты роста можно вычислять и в процентах. В этом случае их называют темпами роста. Коэффициенты равно как и темпы роста можно определять с переменной или постоянной базой сравнения.

Темпы роста с переменной базой получают при сравнении уровня явления каждого периода с уровнем предшествующего периода. Темпы роста с постоянной базой сравнения получают путем сопоставления уровня в каждом отдельном периоде с уровнем одного периода, принятого за базу. Выбор базы сравнения нередко имеет существенное значение.

Темпы роста с переменной базой сравнения (цепные темпы роста):

;

темпы роста с постоянной базой сравнения (базисные темпы роста):

,

где у1, у2, у3, у4 - уровни явления за одинаковые последовательные периоды (например, выпуск продукции по кварталам года);

у0 - постоянная база сравнения.

Относительная величина планового задания - отношение величины показателя по плану (упл) к его фактической величине в предшествующем периоде (у0):

.

Относительная величина выполнения плана - отношение фактической (отчетной) величины показателя (у1) к запланированной на тот же период его величине (упл):

.

Относительные величины планового задания, выполнения плана и динамики связаны между собой:

.  

Относительные величины структуры характеризуют долю отдельных частей в общем объеме совокупности и выражаются в долях единицы или в процентах. Они вычисляются по сгруппированным данным:

Каждую относительную величину структуры называют удельным весом.

Относительные величины координации отражают отношение численности двух частей единого целого, т. е. показывают, сколько единиц одной группы приходится в среднем на одну, на десять или на сто единиц другой группы изучаемой совокупности (например, сколько служащих приходится на 100 рабочих).

Относительные величины наглядности отражают результаты сопоставления одноименных показателей, относящихся к одному и тому же периоду (или моменту) времени, но к разным объектам или территориям (например, сравнивается годовая производительность труда по двум предприятиям). 

 

Вторая группа относительных величин, представляющая собой результат сопоставления разноименных статистических показателей, носит название относительных величин интенсивности.

Они являются именованными числами и показывают итог числителя приходящегося на одну, на десять, на сто единиц знаменателя.

В эту группу относительных величин включаются показатели производства продукции на душу населения; показатели потребления на душу населения; показатели, характеризующие техническую оснащенность производства и т. д.

Тема 5. Средние величины.

План:

1. Понятие средней величины.

2. Степенные средние.

3. Структурные средние.

 

 

Понятие средней величины.

Средней величиной называют значение признака, наиболее характерного для изучаемой совокупности.

Объективность и типичность статистической средней обеспечивается лишь при определенных условиях.

Первое условие — средняя должна вычисляться для качественно однородной совокупности. Для получения однородной совокупности необходима группировка данных, поэтому расчет средней должен сочетаться с методом группировок.

Второе условие — для вычисления средних должны быть использованы массовые данные. В средней величине, вычисленной на основе данных о большом числе единиц совокупности, колебания величины признака, вызванные случайными причинами, погашаются и проявляется общее свойство (типичный размер) признака для всей совокупности.

Средняя величина всегда имеет ту же размерность, что и признак у отдельных единиц совокупности.    

В экономических исследованиях и плановых расчетах применяются две категории средних:

- степенные средние;

- структурные средние.

К категории степенных средних относятся:

- средняя арифметическая;

- средняя гармоническая;

- средняя квадратическая;

- средняя геометрическая.

 

Степенные средние.

Формулы средних величин могут быть получены на основе степенной средней, для которой определяющей функцией является уравнение:

,

где f - веса средней (статистические веса), в качестве которых могут выступать: частота признака, частость и другие величины.

 

Формулы различных видов степенных средних

Значе Наименование

Формула средней

ние k средней простая взвешенная
-1 Гармоническая
0 Геометрическая
1 Арифметическая
2 Квадратическая

Средняя арифметическая и средняя гармоническая наиболее распространенные виды средней, получившие широкое применение в плановых расчетах, при расчете общей средней из средних групповых, а также при выявлении взаимосвязи между признаками с помощью группировок. Выбор средней арифметической и средней гармонической определяется характером имеющейся в распоряжении исследователя информации.

Пример:

Необходимо вычислить среднюю заработную плату в целом по трем бригадам использую следующие данные:

Бригада Средняя заработная плата, руб, (x) Фонд заработной платы, руб., (F) Численность рабочих, чел, (f)
1 1900 57000 30
2 2050 36900 18
3 2120 21200 10
S 115100 58

Меняя состав исходной информации, используемой для решения поставленной задачи, выделим 3 варианта ее решения.

Вариант 1. Вычислим среднюю заработную плату исходя из данных о фонде заработной платы и численности рабочих по логической формуле:

      Средняя зарплата =         Фонд зарплаты (по 3-м бригадам).

        (по 3-м бригадам)     Численность рабочих (по 3-м бригадам)

 

Фонд зарплаты (по 3-м бригадам): SF=Sxf = 115100 руб.

Численность рабочих (в 3-х бригадах): Sf = 58 чел.

Средняя зарплата:

средняя арифметическая взвешенная.

Вариант 2. Вычислим среднюю заработную плату исходя из данных о средней заработной плате и фонде заработной платы по каждой из бригад используя вышеприведенную логическую формулу.

Фонд зарплаты (по 3-м бригадам): SF= 115100 руб.

Численность рабочих (в 3-х бригадах): S(F/x) = 58 чел.

Средняя зарплата:

средняя гармоническая взвешенная.

Вариант 3. Вычислим среднюю заработную плату исходя из данных о средней заработной плате и численности рабочих по каждой из бригад.

Фонд зарплаты (по 3-м бригадам): Sxf.

Численность рабочих (в 3-х бригадах): Sf.

Средняя зарплата:

средняя арифметическая взвешенная.

Средняя квадратическая применяется для расчета среднего квадратического отклонения и дисперсии, являющихся показателями вариации признаков.

Средняя геометрическая (простая) используется при вычислении среднего коэффициента роста (темпа роста) в рядах динамики.

 

Структурные средние.

К категории структурных средних относятся мода и медиана. В отличие от степенных средних, которые в значительной степени являются абстрактной характеристикой совокупности, структурные средние выступают как конкретные величины, совпадающие с вполне определенными вариантами совокупности. Это делает их незаменимыми при решении ряда практических задач.

Мода - значение признака, наиболее часто встречающегося в изучаемой совокупности.

Для дискретного ряда распределения мода определяется визуально: просматривается ряд распределения и то значение признака, которое встречается чаще всего и будет соответствовать моде. Количество мод в одном ряде распределения может быть несколько.

Для интервального ряда распределения сначала определяется модальный интервал. Им будет интервал или интервалы наиболее часто встречающиеся в изучаемой совокупности. Выбрав модальный интервал, моду определяют по формуле:

,

где XMo - нижняя граница модального интервала;

hMo - величина модального интервала;

fMo - частота модального интервала;

fMo-1 - частота интервала, предшествующего модальному;

fMo+1- частота интервала, следующего за модальным.

Моду можно определить и графически по гистограмме распределения.

Для этого правую вершину модального прямоугольника соединяют отрезком с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника — с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

Медиана - это значение признака, которое лежит в середине ранжированного ряда и делит этот ряд на две равные по численности части. 

Ранжированный ряд - это ряд составленный из значений признаков, расположенных в порядке возрастания или убывания признака.

Для первичных (несгруппированных) данных и дискретного ряда распределения медиана может быть определена по формуле:

.

Для интервального ряда распределения сначала определяют медианный интервал. Медианным является первый интервал, в котором сумма накопленных частот равна или больше половины общего числа наблюдений: SMe ³ 0.5×n. Выбрав медианный интервал, определяют медиану по одной из формул:

; ,

 

где - нижняя граница медианного интервала;

- верхняя граница медианного интервала;

hMe - величина медианного интервала;

fMe - частота медианного интервала;

- сумма частот всех интервалов ряда;

- сумма частот интервалов, предшествующих медианному;

- сумма частот медианного интервала и всех ему предшествующих.

Медиана может быть определена и графически по кумулятивной кривой. Для ее определения высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятивной кривой. Абсцисса точки пересечения является медианой. 

Примеры определения медианы:

Пример 1.

Исходные данные:

x: 1.1 2.0 4.1 3.5 6.3 0.4 0.2 7.9 5.6

n=9 - нечетное. 

.

Ранжированные данные (по возрастанию):

                               Me=x5

                                   ¯ 

x: 0.2 0.4 1.1 2.0 3.5 4.1 5.6 6.3 7.9

i:  1   2  3  4   5   6  7   8   9

 

Пример 2.

Исходные данные:

x: 1.0 5.0 4.0 7.0 3.0 6.0 0.0 2.0 8.0 9.0

n=10 - четное. 

.

Ранжированные данные (по возрастанию):

                                  x5 x6

                                  ¯ ¯

x: 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0

i:  1   2  3  4   5   6  7   8   9

 

Me=0.5×(4.0+5.0)=4.5.

 

Пример 3.

Исходные данные:

x’i fi Si  
1 1 1  
2 3 4  
3 6 10  
4 10 20 >15, >16
5 5 25  
6 3 28  
7 2 30  

n=Sf=30 - четное

 

.

 

Если Sj ³ k (j=1,m), то хk = х’j, xk - искомый элемент совокупности с порядковым номером в ранжированном ряду k. В нашем случае х15, х16.

S4=20 > k=15 Þ x15=x’4=4.

S4=20 > k=16 Þ x16=x’4=4.

Me=0.5×(4+4)=4.

 

Пример 4.

x f S  
0-2 4 4  
2-4 5 9  
4-6 9 18 Медианный интервал: S ³ (n/2)
6-8 4 22  
8-10 2 24  

         n=Sf=24

, , , fMe=9, dMe=2.

.

 

Мода применяется при экспертных оценках, при изучении спроса: при определении наиболее ходовых размеров обуви, одежды и др. товаров, что учитывается при планировании их производства.

Медиана используется при статистическом контроле качества продукции и технологического процесса на промышленных предприятиях; при изучении распределения семей по уровню дохода и др.

 Средняя арифметическая, мода и медиана используются для характеристики среднего значения признака в совокупности и относятся к показателям центра распределения.  

Тема 6. изучение вариации.

План:

1. Понятие вариации.

2. Показатели вариации.

3. Сложение дисперсий изучаемого признака.

 

Понятие вариации.

Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака.

Средняя величина, как уже отмечалось - это абстрактная, обобщающая характеристика признака изучаемой совокупности, но она не показывает строения совокупности, которое весьма существенно для ее познания. Средняя величина не дает представления о том как отдельные значения признака группируются относительно средней, сосредоточенны ли они вблизи или значительно отклоняются нее. В тех случаях, когда отдельные значения признака близко расположены к средней арифметической и мало от нее отличаются, средняя хорошо представляет совокупность.

Для характеристики колеблемости отдельных значений признака в статистике используют показатели вариации. Изучая с помощью данных показателей силу и характер вариации можно оценить насколько однородной является совокупность в количественном, а иногда и в качественном отношении, а следовательно определить насколько характерной для данной совокупности является средняя величина.  

 

2. Показатели вариации.   

для характеристики размера вариации признака используются абсолютные и относительные показатели.

К абсолютным показателям вариации относятся:

*  размах колебаний;

*  среднее линейное отклонение;

*  среднее квадратичное отклонение;

*  дисперсия;

*  квартильное отклонение.

Размах колебаний (размах вариации):

R=xmax - xmin.

Данный показатель улавливает только крайние отклонения признака и не отражает отклонений всех вариант в совокупности. Однако легкость вычисления и простота истолкования результатов обусловили широкое применение этого показателя.

Чтобы дать обобщающую характеристику распределению отклонений вычисляют среднее линейное отклонение, которое учитывает различие всех единиц изучаемой совокупности.

Среднее линейное отклонение определяется как средняя арифметическая модуля отклонения каждого значения признака от средней:

а) для несгруппированных данных (первичного ряда):

;

б) для вариационного ряда:

.

На практике меру вариации более объективно отражают показатель дисперсии и среднее квадратическое отклонение. СКО является мерилом надежности средней. Чем меньше значение этого показателя, тем лучше средняя арифметическая отражает собой всю совокупность.

Среднее квадратическое отклонение и дисперсия:

а) для несгруппированных данных (первичного ряда):

; ;

б) для вариационного ряда:

; .

 

Формула для расчета дисперсии может быть преобразована:

.

Квартильное отклонение применяется вместо размаха вариации, чтобы избежать недостатков, связанных в использованием крайних значений:

.

Квартиль - значения признака, которые делят ранжированный ряд на четыре равные по численности части. Таких величин три: первая квартиль Q1, вторая квартиль Q2 , третья квартиль Q3. Вторая квартиль является медианой. Вычисление квартилей аналогично вычислению медианы.

Для дискретного ряда:

,



Поделиться:


Последнее изменение этой страницы: 2022-01-22; просмотров: 36; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.142.12.170 (0.215 с.)