Лекция 5. Сводка и группировка статистических данных 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Лекция 5. Сводка и группировка статистических данных



 

   5. 1. Задачи сводки и группировки

Статистические данные, собранные в процессе наблюдения не позволяют получить обобщающие характеристики изучаемой совокупности, выявить закономерности ее развития, так как в процессе наблюдения фиксируются характеристики только отдельных единиц совокупности.

 

Для получения обобщающих характеристик собранную информацию необходимо систематизировать, превратить ее в упорядоченную систему статистических показателей._ Систематизация полученной информации и обобщение наблюдаемых факторов является содержанием второй стадии статистического исследования, называемой сводкой и группировкой.

Статистическая сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению.

Таким образом, целью сводки является получение итоговых данныхпутем подсчета единичных сведений.

По глубине проработки материала различают простые и сложные сводки.

Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения, то есть определение размера исследуемого явления.

Сложной сводкой называется комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и совокупности в целом, а также представление результатов группировки в табличной форме.

По форме обработки материала сводки делятся на централизованные и децентрализованные.

При централизованной сводке весь первичный материал поступает в одну организацию, где и подвергается обработке по принятой программе, по единой методике (например, в Государственном комитете по статистике РФ или территориальных управлениях статистики).

При децентрализованной сводке разработка статистическогоматериала осуществляется по иерархической системе управления, подвергаясь соответствующей обработке на каждом уровне. Например, предприятия сдают отчеты в районные_ отделы статистики, которые делают сводку по своему району, и отправляют обобщеннуюинформацию в региональные управления или комитеты, которые свои сводки отправляют в Государственный комитет по статистике РФ, где и определяются показатели в целом по народному хозяйству страны.Статистическая сводка осуществляется по специальной программе,которая должна составляться одновременно с разработкой плана ипрограммы проведения наблюдения.

Программа статистической сводки включает в себя:

• выбор группировочных признаков;

• определение порядка формирования групп;

• разработка системы статистических показателейдля

характеристики выделенных групп и совокупности в целом;

• разработка макетов таблиц для представления результатов сводки.

План статистической сводки содержит указания о сроках и

последовательности выполнения отдельных этапов сводки, ееисполнителях, о порядке представления ее результатов.

Научнойосновой сводки является статистическая

группировка, которая представляет собой процесс образования однородных групп на основе расчленения (разделения) статистической совокупности на части или объединение изучаемых статистических единиц в частные совокупности по существенным для них признакам.

Группировка является методом исследования содержанияизучаемого явления. На ее основе рассчитываются обобщающиепоказатели по группам, выявляется строение совокупности, взаимосвязимежду изучаемыми признаками, а затем проводится анализ полученныхрезультатов.

Основными категориямиметода группировокявляются

группировочный признак (основание группировки) и интервал.

Группировочным признаком (основанием группировки)

называется признак, по которому происходит выделение однородных групп. В качестве группировочного обычно выбирается один из

существенныхлегко распознаваемых признаков, носящих как

атрибутивный, так и количественный характер.

Интервал - это совокупность варьирующих значений признака в группе, он определяет количественные границы групп,а его ширинапредставляет собой промежуток между максимальным и минимальнымзначениями признака в группе.

При выполнении группировок используются следующие типы интервалов:      

• равные - во всех выделенных группах ширина интервала                       является одинаковой;

• неравные - в каждой группе ширина интервала различна; приэтом ее изменение может изменяться закономерно (например, равномерновозрастать), или произвольно, то есть быть свободной;

• закрытые□ если известны верхняя и нижняя границыинтервалов (максимальное и минимальное значения признака в группах);верхняя или нижняя.

 

При выполнении группировок необходимо исходить из следующего принципа: различия между единицами, отнесенными к одной группе должны быть меньше, чем между единицами, отнесенными к разным группам.

С помощью группировок в статистике решают следующие задачи:

• изучение состава статистических совокупностей;

•  выделение отдельных типов явлений внутри совокупности;

 

•  выявление причинно-следственных связей разных признаков внутри совокупности;

•  классификация единиц совокупности по множеству признаков.

Для решения указанных задач применяют разные типы статистическихгруппировок.

Типы группировок

В зависимости от степени сложности изучаемого явления и от

поставленных задач статистические группировки могут выполняться по

одному или несколькимгруппировочным признакам. Группировка          

называется простой (одномерной), если однородные группы формируются по одному признаку одновременно.

Если однородные группы образуются по двум и более признакам, то группировка называется сложной.

В классе одномерных группировок выделяют следующие типы:

• структурные - предназначены для выявления состава изучаемого явления;

• типологические - предназначены для выделения в статистическойсовокупности различных социально-экономических типов явлений;

• аналитические (факторные) - используютсядля изучения связей и зависимости между варьирующими признаками.

С труктурны е группировк и

Структурные группировки используются для изучения внутреннего_

строения статистической.совокупности и. характеристики структурных     

сдвигов.

Они дают информацию о текущем состоянии массовых явлений и применяются в целях оперативного управления.

Структурная группировка выполняется в несколько этапов:

• выбор группировочного признака;

       - определение необходимого числа групп;                                            

      - определение параметров групп;


- распределение единиц наблюдения по выделенным группам; расчет структурных характеристик; =формулировка выводов.

Выбор группировочного признака осуществляется в соответствии с целями статистического исследования. В качестве группировочного обычно выступает существенный признак. Обязательным условиемвыполнения любой группировки, в том числе и структурной являетсяупорядочение статистической совокупности по значениям группировочного признака.

Определение необходимого числа групп Число групп должно быть достаточным для объективного представления изучаемой совокупности. При большом числе групп различия между ними становятся малозаметными, а в самих группах в виду их малой наполняемости перестает действовать закон больших чисел и возможно проявления случайности. При малом жеих числе в одну группу могут попасть статистические единицы ссущественно различающимися значениямипризнака.

Удалено:

На количество выделяемых групп влияют ^следующиефакторы:

• уровень колеблемости группировочного признак - чем значительнеевариация признака, тем большее количество групп необходимо выделять при прочих равных условиях;

• размер изучаемой статистической совокупности - чем большеразмер исследуемой совокупности, тем большее количество группнеобходимо выделять.

Выделенные группы должны быть достаточно заполненными. Наличие пустыхгрупп или малое число статистических единиц в них свидетельствуют о неправильном определении ихчисла.

 

Ориентировочно число групп можно определить использую эмпирическую зависимость, называемую формулой Стерджесса:mи 1 + 3,322 х lgN,

где m- количество групп;

N- численность единиц статистической совокупности.

В практических расчетах можно использовать следующие соотношения, полученные на основании формулы Стерджесса:

N 15-24 25-44 45-89 90­ 179 180-359 360 и более
m 5 6 7 8 9 10

 

Зависимость Стерджессадает хорошие результаты, если совокупность состоит из большого числа единиц, распределение близко к нормальному, и при этом используются равные интервалы.На основе анализа показателей структуры делаются соответствующие выводы.

Формулировка выводов о составе совокупности Для структурных группировок в выводах отражаются два положения:

•  Какие значения признака встречаются в совокупности наиболее часто, какие наиболее редко.

•  Каков характер изменения структуры в зависимости от изменения значения признака. С увеличением xдоля может увеличиваться, либо уменьшаться. Это довольно типично для экономических показателей.

Выводы должны быть сделаныобязательно, иначе пропадает смысл группировки.

Данные структурных группировок обычно представляются в форме соответствующей таблицы.

Пример выполненияструктурной группировки:_ требуется произвести группировку с равными интервалами по данным о стаже_________

работы рабочих участка. На участке работает 50рабочих,со стажем    работыот 0 до 26 лет.По формуле Стерджесса рассчитаем оптимальное             количество групп:

m= 1+ 3,332 lg50«7                                                                        

Далее рассчитывается постоянная ширина интервалов;

Структурная группировка, выполненная по рассчитанным

параметрам приведена в таблице5.1:

.

Группировка рабочих участка по стажу.работы №

группы

Параметры групп, лет

Число рабочих в группе

Удельный

вес

рабочих в группах, %

Границы

интервалов

Ширина

интерва

ла

Середина

интервала

нижняя верхняя
1 0 4 4 2 6 12
2 4 8 4 6 8 16
3 8 12 4 10 11 22
4 12 16 4 14 13 26
5 16 20 4 18 6 12
6 20 24 4 22 4 8
7 24 28 4 26 2 4
Итого 0 28 28 14 50 100

 

По проведенной группировке можно сделать следующие выводы:

 

1.  Больше всего на участке имеетсярабочих со стажем работы от 12 до 16 лет, они составляют 26% от общей численности рабочих участка;меньше всего^_ со стажем от 24 до 28 лет, их доля составляет _ 4%.

2.  С увеличением стажа работы число рабочих вначале растет, достигает, максимума в 4-ой группе, азатем снижается.

 

Типологическая группировка

Ее цель состоит в изучении распространенности различных типов экономических явлений в статистической совокупности.

Типологические группировки применяются, как правило, к неоднородной

совокупности и осуществляются посредством_______ сложных

неравноинтервальныхгруппировок. Результатом типологических

группировок является разделение совокупности на классы, социально­экономические типы, однородные группы единиц.

По своей сути типологическая группировка представляет собой группировку-классификатор. Такие группировки часто основываются на устойчивом перечне групп, не меняющихся или меняющихся незначительно во времени.

Примером такой группировки является группировка предприятий по форме собственности (государственная, муниципальная, частная,смешанная) или группировка секторов экономики.

Удалено:Ц

Удалено: Ц

При выполнении типологическихгруппировок важно правильно выбрать основание группировки. Для этого необходимо предварительновыявить возможные типы явления на основе анализа сущности изакономерностей его развития.Число групп и их параметры устанавливаются неформально на основе выделенных качественных закономерностей, часто с привлечением количественных признаков.

Например, _при _ выполнении группировки населения _по возрастномусоставу выделяются 4 возрастные категории: дошкольный возраст - до7лет; школьный - с 7 до 17 лет; рабочий - с 17 до 55(60) лет; пенсионный -с 55 (60) лет.

Удалено:,

По технике выполнения типологическая группировка похожа на структурную группировку, за исключением первых этапов - группировочный признак, количество групп, их параметры определяются на основе качественного анализа. В таких группировках очень часто применяются специализированные интервалы^ Типологические, группировкипредставляются в табличной форме, объектом анализа в нихявляются показатели структуры. Пример типологической группировки приведен в таблице_4.2:


Таблица 4.2

Группировка населения поселка городского типа по возрастным

категориям.

Возрастные Границы   Численность Показатель
категории

интервалов.

в группе. структуры
населения

лет

чел. в %
  * i * в    
Дошкольный до 7 192 14.3
возраст        
Школьный 7 17 218 16.3
рабочий 17 55(60) 574 42.8
Пенсионный 55(60) и более 357 26.6
Итого - - 1340 100.0

 

Удалено:

Аналитические группировк и

Аналитические группировки предназначены для выявлениясвязи между изучаемыми признаками. Они позволяют выявить наличиеи направление связи, а также измерить ее тесноту и силу.

Все исследуемые признаки в этом случае делятся на две группы: факторные и результативные. Взаимосвязь между ними проявляется в том, что с изменением среднего значения факторного признака систематически изменяется среднее значение результативного признака.

Аналитические группировкиотличаются от структурных и типологических по _ _ технике выполнения. _ которая заключается вудалено:. следующем:

1.  Производится группировка единиц совокупности по факторномупризнаку. она выполняется как структурная.

2.  Вкаждой выделенной группе отбираются соответствующие значениярезультативного признака. и на их основе рассчитывается некоторыйобобщающий показатель. обычно. среднее значение.

3.  Анализируются изменения обобщающего показателя- среднего значения результативного признака по группам. и делается вывод оналичии или отсутствии взаимосвязи и ее направлении. Если приизменении значений факторного признака. положенного в основу

группировкиизменяется величина результативного. то признается

наличие связи между признаками; при этом. если с увеличением значенийфакторного признака увеличивается значение результативного. то связьотносится к прямой; в противном случае - к обратной.Статистические таблицы

Результаты сводок и группировок заносятся в статистические таблицы, являющиеся средством наглядного выражения результатов исследования. Статистическая таблица представляет собой рационального и наглядного изложения статистических данных об исследуемых явлениях. Основу статистической таблицы составляет графленная сетка, вертикальные столбцы которой называются графами, а горизонтальные - строками. Если строки и графы имеют название, то это будет макет таблицы (рис.3.1).

Рис. 4.1. Макет статистической таблицы


 

В таблице различают: заголовок, подлежащее и сказуемое. Заголовок таблицы отражает содержание таблицы, место и время, к которому относятся ее данные, единицы измерения, если они являются общими для приведенных данных. Подлежащим таблицы являются перечень единиц совокупности или группы, т. е. объект изучения, сказуемым - цифровые данные, характеризующие подлежащее, т. е. результаты сводки. Обычно подлежащее располагается слева в виде названий строк, а сказуемое - сверху в виде названий граф.

По содержанию подлежащего все статистические таблицы можно разделить на следующие группы:

•  Простые таблицы, в подлежащем которых отсутствуют группировки. Они содержат обобщающие показатели, относящиеся к перечню единиц совокупности (перечневые таблицы), к перечню хронологических дат (хронологические таблицы) или к перечню территорий (территориальные таблицы).

•  Групповые таблицы, в подлежащем которых изучаемый объект разделен на группы по определенному признаку. При этом каждая группа может быть охарактеризована рядом показателей.

•  Комбинационные таблицы, в подлежащем которых дана группировка единиц совокупности по двум и более признакам, взятым в комбинации.

Сказуемого таблицы может быть простым или сложным.

Простое сказуемое предусматривает параллельное расположение показателей, (графы 1,2 в макете таблицы) а сложное - комбинированное (графы 3, 4, 5).

При построении статистических таблиц необходимо соблюдать определенные правила по их оформлению:

1.  Таблица должна быть компактной, легко обозримой. Ее не следует загружать излишними подробностями, затрудняющими анализ.

2.  Заголовок таблицы должен ясно и кратко выражать ее содержание. Заголовки строк подлежащего и граф сказуемого также должны быть сформулированы точно и кратко.

3.  В таблице желательно давать нумерацию граф. Это облегчает пользование таблицей, показывает способ расчета чисел в графах. Графы, содержащие подлежащее, обозначаются заглавными буквами алфавита; графы, содержащие сказуемое, нумеруются арабскими числами. Не допускается в заголовках подлежащего и сказуемого сокращение слов.

4.  Если единицы измерения различны, то они указываются в названиях строк и граф.

5. Приводимые в подлежащем и сказуемом признаки должны располагаться в логическом порядке с учетом необходимости их совместного рассмотрения. Информация размещается от частного к общему, т. е. сначала показывают слагаемые, а в конце подводят итоги.

6.  Если в таблице приводятся не все данные, а только наиболее значимые из них то сначала показывают итог, а затем выделяют наиболее важные части с помощью оборотов «в том числе», «из них».

7.  Следует различать «Итого» и «Всего». «Итого» является итогом для определенной части совокупности, а «Всего» - итог для всей совокупности.

8.  При оформлении таблицы применяются следующие обозначения:

-  прочерк (-) -когда явление отсутствует;

-  символ «х» - если явление не имеет осмысленного содержания;

-  многоточие (...) - если отсутствуют сведения (или делается запись «нет сведений»).

-  если сведения имеются, но числовое их значение меньше принятой в таблице точности, оно выражается дробным числом 0,0.

9.  Округление чисел, приводимых в таблице, должно проводится с одинаковой степенью точности.

10.  Если одна величина превосходит другую многократно, то полученные относительные показатели лучше выражать не в процентах, а в количестве раз.

Соблюдение приведенных правил построения и оформления статистических таблиц делает их основным средством представления, обработки и обобщения статистической информации.


1. Обобщающие характеристики статических совокупностей

1.1. Ряды распределения

Результаты статистических сводок и группировок могут быть представлены в виде статистических рядов - упорядоченных совокупностей значений показателей (статистического признака). По своему содержанию статистические ряды подразделяются на ряды динамики и ряды распределения.

Рядом динамики называют систематизированную совокупность числовых данных, характеризующих изменения изучаемых явлений во времени.

Ряд распределения, представляет собой систематизированную последовательность статистических единиц, сгруппированных по конкретному признаку. Он характеризует состав изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения статистических единиц. Обычно ряд распределения представляет собой результат структурной группировки.

Ряд распределения считается построенным, если известно, каким образом меняются в совокупности значения признака и как часто встречаются отдельные значения признака.

Для различных статистических признаков строятся ряды распределения разного типа:

•  атрибутивные - строятся по описательным признакам в порядке возрастания или убывания наблюденных значений признака; примером атрибутивных рядов могут служить распределения населения по национальности, по профессиям, по полу; распределение предприятий по формам собственности;

•  вариационные - строятся по количественным признакам, например, распределение рабочих по уровню квалификации, по заработной плате, распределение студентов по успеваемости.

Вариационные ряды делятся на дискретные и интервальные.

В дискретных рядах признак принимает только целые значения, например, размер семьи, тарифный разряд.

Интервальные ряды основаны на непрерывных признаках, принимающих любые, в том числе и дробные значения. В зависимости от того, какая структурная группировка лежит в основе интервального ряда, различают равноинтервальные и неравноинтервальные ряды.

В равноинтервальных рядах ширина интервала является величиной постоянной, в неравноинтервальных - она различна для разных групп.

Основными элементами рядов распределения являются:          

1) значения признака (варианты):

• Xi- дискретное в дискретных рядах;

• хВ -                                                  хВ - интервал для интервальных рядов,    где i =1, n t,                                          n t -

частота;

2) частота n - число единиц совокупности, обладающих данным значением признака. Частота показывает, сколько раз данное значение признака встречается в совокупности; сумма всех частот всегда равна

m

объему статистической совокупности, т. е. £ n= N.

1

Исследование рядов распределения осуществляется в два этапа:

• эмпирическое исследование, целью которого является

получение обобщающих характеристик изучаемой совокупности;

• теоретическое исследование с    целью выявления

закономерности данного распределения и его теоретического описания.

Эмпирическое исследование начинается с определения частотных характеристик ряда распределения.

 

1.2. Частотные характеристики рядов распределения

Исходной частотной характеристикой любого ряда распределения является частота n. На ее основе можно рассчитать следующие характеристики:

•  Частость -    удельный вес (доля) единиц совокупности, имеющих определенное значение признака, т. е. это частота, выраженная в виде относительной величины (доли единицы или процента):

n■ 1— V 1

q = —, t = 1, m, £ q =1.

N         t?

Эта характеристика имеет важное значение при исследовании рядов распределения, так как позволяет связать показатели рядов распределения с соответствующими показателями и аппаратом теории вероятностей. В теории вероятностей qi    есть вероятность того, что данное значение

признака встретится в совокупности. Частость используется для

сопоставления рядов распределения, содержащих равное число

статистических единиц.

•_ Накопленная частота - число единиц совокупности, у формат: список

*

которых значение признака не превышает данного х, т. е. это частота нарастающим итогом:

m*

N. = £ nt, Nx = N.

1 xm

i=1

х* - данное значение признака в □ - ой группе, для которой

рассчитывается накопленная частота.

По накопленным частотам можно построить кумулятивный ряд распределения - ряд значений числа единиц совокупности с меньшими и

равными верхней границе соответствующего интервала значениями признака.

Формат: Список

Формат: Список

•_ Накопленная частость - удельный вес (доля) единиц, у которых значение признака не превосходит данное х*, т. е. это частость нарастающим итогом:

m*

Qx-=£qt, Qxm=1;

i=1

•_ Плотность распределения - универсальная частотная

характеристика, позволяющая перейти от эмпирического к теоретическому распределению. Для рядов с неравными интервалами только эта характеристика дает правильное представление о характере распределения. Плотность распределения рассчитывается в 2-х вариантах:

-  как абсолютная плотность распределения р, показывающая число единиц совокупности, приходящихся на единицу ширины интервала значения признака:

nt

р= —.

a

Формат: Список

-  как относительная плотность распределения р, показывающая^ удельный вес единиц совокупности, приходящихся на единицу ширины интервала:

Р = ^.

at

Плотность распределения обеспечивает сопоставимость различных рядов распределения.

Разные ряды распределения характеризуются разным набором частотных характеристик: минимальным - атрибутивные ряды (частота nt, и частость qt), для дискретных используются четыре характеристики (частота nt, частость qt, накопленная частота Nt, накопленная частость Qt), для интервальных - все пять (частота nt, частость qt, накопленная частота Nt, накопленная частость Qt, абсолютная р и относительная р плотности распределения).

Расчет частотных характеристик рассмотрим на следующем примере: имеется распределение рабочих участка по стажу работы. N=50 человек, стаж измеряется числом полностью отработанных лет. На основании структурной группировки, выполненной ранее, построен равноинтервальный вариационный ряд, m=7, at=4 года. Для такого ряда рассчитываются все частотные характеристики, результаты расчета приведены в таблице 5.1.

п/п

Стаж

работы, лет

Частота

, n, чел

Часто

сть

q

Накоп

ленна

я

частот

а

N,, чел.

Накоп

ленная

частост

ь

а

Абсо­

лютна

я

плот­

ность

распре

делен

ия

Относ

и

тельна

я

плотн

ость

распре

де

ления

интервал

a

X x А V
1 0 4 4 6 0,12 6 0,12 1,5 0,03
2 4 8 4 8 0,16 14 0,28 2,0 0,04
3 8 12 4 11 0,22 25 0,50 2,75 0,055
4 12 16 4 13 0,26 38 0,76 3,25 0,065
5 16 20 4 6 0,12 44 0,88 1,5 0,03
6 20 24 4 4 0,08 48 0,96 1,0 0,02
7 24 28 4 2 0,04 50 1,00 0,5 0,01
всего 0 28 2 8 50 1,00 - - 1,78 0,036

Таблица 5.1.


 

Расчет характеристик распределения рабочих участка по стажу работы

1.3. Графическое представление рядов распределения

Графики являются наглядной формой отображения рядов распределения. Для изображения рядов применяются линейные графики и плоскостные диаграммы, построенные в прямоугольной системе координат.

Для графического представления атрибутивных рядов распределения используются различные диаграммы:                                      столбиковые,

линейные, круговые, фигурные, секторные и т. д.

Для дискретных вариационных рядов графиком является полигон распределения.

Полигоном распределения называется ломаная линия, соединяющая точки с координатами                               {xt; nt} или {xt; qt},где xt-

дискретное значение признака, nt- частота, qt- частость.

График строится в принятом масштабе.   Вид полигона

распределения приведен на рис. 5.1.

Рис.5.1. Полигон распределения


 

Для изображения интервальных вариационных рядов применяют гистограммы, представляющие собой ступенчатые фигуры, состоящие из прямоугольников, основания которых равны ширине интервала ai, а высота - частоте ni(частости qi) равноинтервального ряда или плотности распределения неравноинтервального р, р. Построение диаграммы аналогично построению столбиковой диаграммы. Для графического представления вариационных рядов может использоваться также кумулята - ломаная линия, составленная по накопленным частотам (частостям). Накопленные частоты наносятся в виде ординат; соединяя вершины отдельных ординат отрезками прямой, получаем ломаную линию, имеющую неубывающий вид. Координатами точек на графике для дискретного ряда являются {xt; Nt}; для интервального ряда - {xв; Nt}. Начальная точка графика имеет координаты { хн;0}, самая высокая точка - { xsm;N}. Общий вид кумуляты приведен на рис.5.3. Использование кумуляты особенно удобно при проведении сравнений вариационных рядов.


Рис. 5.3. Кумулята распределения


 

При построении графиков рядов распределения большое значение имеет соотношение масштабов по оси абсцисс и оси ординат. В этом случае и необходимо руководствоваться «правилом золотого сечения», в соответствии с которым высота графика должна быть примерно в два раза меньше его основания.



Поделиться:


Последнее изменение этой страницы: 2021-05-12; просмотров: 171; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.220.160.216 (0.173 с.)