Тема 6. Статистические методы классификации и группировки 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема 6. Статистические методы классификации и группировки



6.1. Группировка статистической информации

6.2. Ряд распределения

6.3. Вторичные группировки

6.4. Графическое представление ряда распределения

6.1. В результате проведения статистического наблюдения формируется совокупность данных об изучаемом социально-экономическом явлении. Статистическая совокупность − это множество элементов изучаемого явления, объединенных в соответствии с целью исследования единой качественной основой, существование которых ограничено во времени и пространстве. Совокупность может быть стабильной, т.е. относительно постоянной во времени, и нестабильной или динамичной. Элементы статистической совокупности называются единицами статистической совокупности. Они являются носителями основных свойств статистической совокупности. Статистическая совокупность является однородной, если существенные свойства характерны для большинства единиц совокупности, и неоднородной, если в совокупность объединяются разные типы явлений.

Для изучения статистической совокупности, проведения аналитических расчетов и выявления закономерностей необходимо обобщить и систематизировать статистические данные. Этот этап статистического исследования называется сводкой и группировкой статистической информации.

Сводка − это процесс объединения отдельных единиц статистической совокупности для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

Группировкой называется процесс объединение отдельных единиц статистической совокупности в группы элементов, однородных по какому-либо признаку. В результате группировки получается упорядоченная статистическая информация, позволяющая осуществлять статистический анализ.

В зависимости от цели и задач статистического исследования различают следующие виды группировок: типологическая; структурная; аналитическая.

Типологическая группировка − это разделение качественно неоднородной совокупности на однородные группы, характеризующие особенности и различия между явлениями. За основания такой группировки выбираются наиболее важные признаки, определяющие сущность изучаемых явлений.

Структурная группировка позволяет разделить однородную совокупность на группы, характеризующие ее структуру по какому-либо варьирующему признаку. Примерами могут служить группировки предприятий по проценту выполнения плана, численности рабочих, стоимости основных средств и т.д.

Аналитическая группировка применяется для исследования взаимосвязи между явлениями. Для этого в аналитической группировке выделяются факторные и результативные признаки. Взаимосвязь между явлениями существует в том случае, если с изменением значения факторного признака среднее значение результативного признака возрастает или убывает.

В зависимости от количества признаков, используемых для объединения единиц статистической совокупности, различают простые и комбинированные группировки. Простыми называются группировки, которые построены по одному признаку. Комбинированные группировки построены по двум и более признакам. Для этого сначала образуются группы по одному признаку, а затем по каждой группе выделяются подгруппы по другому признаку и т.д.

6.2. Одним из способов группировки статистической информации является построение ряда распределения.

Ряд распределения − это группировка, в которой каждому значению признака или выделенной группе соответствует единственный количественный показатель (удельный вес).

В зависимости от способа представления группировочного признака различают качественные (атрибутивные) и количественные (вариационные) ряды распределения.

Любой ряд распределения, как правило, состоит из трех элементов:

- варианты (атрибута) − числовое (качественное) значение изучаемого признака;

- частоты − количество того или иного значения признака, встречающегося в изучаемой совокупности;

- частости − количество того или иного значения признака, встречающегося в изучаемой совокупности, представленное в долях или процентах к общему числу элементов в совокупности.

Вариационные ряды распределения бывают дискретными и интервальными. В дискретных рядах группировочный признак представлен конкретным числом, а в интервальных − интервалом.

Для построения интервального ряда распределения необходимо определить число выделяемых групп, а затем рассчитать длину интервала по формуле:

,

где - соответственно максимальное и минимальное значения группировочного признака;

- число выделяемых групп.

В том случае, если вопрос о числе групп приходится решать самостоятельно, можно использовать формулу Стерджесса для определения оптимального количества групп:

,

где N - число единиц в совокупности.

Пример 6.1. Имеются данные о работе 24 предприятий отрасли промышленности. Необходимо по среднегодовой стоимости основных средств сформировать 5 групп в совокупности, рассчитать длину интервала и построить ряд распределения с равными интервалами, а также дискретный ряд распределения.

№ п/п Среднегодовая стоимость основных средств, млрд.руб. № п/п Среднегодовая стоимость основных средств, млрд.руб. № п/п Среднегодовая стоимость основных средств, млрд.руб.
  2,7 7,0 2,0 3,5 3,3 2,7 5,6 6,5   2,0 4,5 3,3 2,7 2,7 3,1 3,1 3,5   3,1 5,6 3,5 6,5 1,0 7,0 4,5 5,6

Решение.

Длина каждого интервала ряда распределения составит:

млрд.руб.

Интервальный ряд распределения имеет вид:

Группы предприятий по среднегодовой стоимости основных средств, млрд.руб. Число предприятий Удельный вес предприятий, %
1 - 2,2   12,5
2,2 - 3,4   37,5
3,4 - 4,6   20,8
4,6 - 5,8   12,5
5,8 - 7   16,7
     

Дискретный ряд распределения имеет вид:

Группы предприятий по среднегодовой стоимости основных средств, млрд.руб. Число предприятий Удельный вес предприятий, %
    4,3
    8,3
2,7   16,7
3,1   12,5
3,3   8,3
3,5   12,5
4,5   8,3
5,6   12,5
6,5   8,3
    8,3
     

6.3. В случае если построенный ранее ряд распределения (группировка) по каким-либо причинам не удовлетворяет требованиям, предъявляемым к его анализу, то ряд необходимо перегруппировать или осуществить вторичную группировку. Вторичной группировкой называется ряд распределения, полученный из исходного, путем его перегруппировки. Перегруппировку можно провести двумя способами: перегруппировка по интервалу; перегруппировка по удельным весам.

Пример 6.2. Перегруппируйте следующий ряд распределения, образовав три группы с интервалами: до 8; 8 - 20; свыше 20:

Группы предприятий по стоимости основных средств, млрд.руб. Число предприятий
до 1 1 - 3 3 - 6 6 - 12 12 - 22 свыше 22  

Решение.

Для иллюстрации метода вторичной группировки представим статистическую информацию на схеме:

В методе вторичной группировки предполагается, что элементы в каждом интервале распределены равномерно. Тогда возможно проведение расчетов, представленных в третьем столбце таблицы. Новый ряд распределения, полученный в результате перегруппировки исходного ряда распределения, приведен в первом и втором столбцах таблицы:

Группы предприятий по стоимости основных средств, млрд.руб. Число предприятий Расчеты
до 8  
8 - 20  
свыше 20  

6.4. При изучении ряда распределения часто прибегают к их графическому представлению. Для этого используются их изображения в виде полигона или гистограммы.

Полигон − это график, в котором ряд распределения представлен в виде линейной диаграммы (ломанной линии). Обычно полигон строится для дискретного ряда распределения, т.е. ряда, у которого группировочный признак представлен конкретными числами.

Для построения полигона на плоскости вычерчивается декартова система координат, по оси абсцисс которой откладываются значения группировочного признака, а по оси ординат − частота или частость. Затем для каждого значения группировочного признака на уровне соответствующей частоты (частости) на плоскость наносятся точки. Соединив точки отрезками, получается ломаная линия. Такой график называется полигоном ряда распределения.

Пример 6.3. Построить график ряда распределения по следующим данным:

Разряд рабочего цеха Количество рабочих
   
   
   
   
   
   

Решение.

Полигон дискретного ряда распределения представлен на графике:

Полигон может быть построен и для интервального ряда распределения, т.е. ряда, у которого группировочный признак задан в виде интервалов. В этом случае по оси абсцисс откладываются средние значения каждого интервала.

Гистограмма − это график, в котором ряд распределения представлен в виде смежных столбцов. Гистограмма обычно используется для графического представления интервального ряда распределения.

Для построения гистограммы на плоскости вычерчивается декартова система координат, по оси абсцисс которой откладываются нижняя и верхняя границы каждого интервала, а по оси ординат − частота или частость. Затем для каждого интервала на уровне соответствующей частоты (частости) на плоскости проводятся горизонтальные отрезки. Опустив из концов отрезков на ось абсцисс перпендикуляры, получаются смежные столбцы. Такой график называется гистограммой ряда распределения.

Пример 6.4. Построить график ряда распределения по следующим данным:

Группы предприятий по среднегодовой стоимости основных средств, млрд.руб. Число предприятий Накопленная частота
1 - 2,2    
2,2 - 3,4    
3,4 - 4,6    
4,6 - 5,8    
5,8 - 7    

Решение.

Гистограмма интервального ряда распределения представлена на графике:

При построении гистограммы для ряда распределения с интервалами неравной длины по оси ординат откладываются значения плотности распределения интервала. Плотность распределения интервала представляет собой отношение частоты (частости) к длине соответствующего интервала:

,

где - частота (частость) интервала;

- длина интервала.

Пример 6.5. Построить график ряда распределения по следующим данным:

Группы предприятий по среднегодовой стоимости основных средств, млрд.руб. Число предприятий Плотность распределения
1 - 3 3 - 3,4 3,4 - 4 4 - 6 6 - 7   3,5 12,5 2,5

Решение.

Гистограмма интервального ряда распределения с интервалами неравной длины представлена на графике:

Для графического изображения ряда распределения часто используется кумулятивная кривая распределения. Кумулятивная кривая распределения (кумулята) представляет собой возрастающую ломаную линию. Для построении кумулятивной кривой распределения на плоскости вычерчивается декартова система координат, по оси абсцисс которой откладываются для дискретного ряда распределения значения группировочного признака, а для интервального ряда распределения нижняя и верхняя границы каждого интервала группировки. По оси ординат наносится накопленная частота (частость), представляющая собой суммарное значение частот (частостей) текущего дискретного значения (интервала) группировки и всех предшествующих. Затем для каждого дискретного значения группировочного признака (верхней границы интервала) на уровне соответствующей накопленной частоты (частости) на плоскость наносятся точки. При построении кумуляты интервального ряда распределения выставляется еще одна точка для нижней границы первого интервала на уровне нуля. Соединив точки отрезками, получается ломаная линия. Такой график называется кумулятивной кривой распределения.

Пример 6.6. Построить кумулятивную кривую распределения по данным из примера 6.4.

Решение.

Кумулятивная кривая интервального ряда распределения представлена на графике:

Кумулятивная кривая характеризует равномерность распределения изучаемого признака по интервалам. При равномерном распределении изучаемого признака по интервалам график кумулятивной кривой распределении будет представлен возрастающей прямой.

Таким образом, чем сильнее график кумулятивной кривой распределения отличается от прямой, соединяющей точки соответствующие нижней границе первого интервала и верхней границе последнего интервала, тем менее равномерно значения признака распределены по интервалам.



Поделиться:


Последнее изменение этой страницы: 2016-08-12; просмотров: 626; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.171.20 (0.02 с.)