Раздел 2. Пм 02. 02 статистический анализ данных и бухгалтерский учет на компьютере. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Раздел 2. Пм 02. 02 статистический анализ данных и бухгалтерский учет на компьютере.



Раздел 2. ПМ 02.02 Статистический анализ данных и бухгалтерский учет на компьютере.

МДК 02.02 Статистический анализ данных и бухгалтерский учет на компьютере

Тема 2.1. Введение в статистику

Статистика как общественная наука. Роль статистики в экономике и управлении. Предмет, метод и основные стадии статистического исследования. Задачи, функции и структура органов государственной статистики. Принципы организации статистики в РФ. Создание единой статистической информационной системы и ее значение.

Тема 2.2. Характеристика статистической информации и средств ее описания

Понятие информации и ее структура. Особенности, классификация и основные параметры статистической информации. Потоки статистической информации на различных территориально-иерархических уровнях. Методика проектирования классификаторов и кодов. Структура основных классификаторов, используемых в экономике. Методика проектирования первичных и сводных отчетов. Унификация отчетно-статистической документации. Особенности проектирования машинно-читаемых документов. Методика проектирования структуры массивов информации.

Тема 2.3. Статистическое наблюдение и первичная обработка данных.

Статистическое наблюдение как основной источник для анализа данных. Основные организационные формы, виды и способы статистического наблюдения. Основные формы и виды действующей статистической отчетности. Программно-методологические вопросы статистического наблюдения. Организационные вопросы статистического наблюдения.

Понятие о статистической сводке и группировках. Метод группировки и его место в системе статистических методов. Основные задачи группировки, группировочные признаки, виды группировок. Выполнение группировки по количественному признаку, определение количества групп и величины интервалов. Группировки простые, сложные, комбинационные. Статистические ряды распределения.

Тема 2.4. Наглядное представление статистических данных

Статистические таблицы как способ наглядного представления результатов сводки и обработки статистических данных. Составные части и элементы статистических таблиц. Виды статистических таблиц: простые, групповые, комбинационные. Основные правила составления таблиц. Графический метод в статистике.Общие понятия о графическом представлении данных в статистике. Классификация статистических графиков. Приемы графического изображения структуры совокупности и структурных сдвигов. Применение графиков для изучения динамики явлений. Диаграммы и статистические карты.

Статистические таблицы

После того как данные статистического наблюдения собраны и даже сгруппированы, их трудно воспринимать и анализировать без определенной, наглядной систематизации. Результаты статистических сводок и группировок получают оформление в виде статистических таблиц.

Статистическая таблица – таблица, которая дает количественную характеристику статистической совокупности и представляет собой форму наглядного изложения полученных в результате статистической сводки и группировки числовых (цифровых) данных. По внешнему виду она представляет собой комбинацию вертикальных и горизонтальных строк. В ней обязательно должны быть общие боковые и верхние заголовки. Еще одной особенностью статистической таблицы является наличие в ней подлежащего (характеристика статистической совокупности) и сказуемого (показателя, характеризующего совокупности). Статистические таблицы являются формой наиболее рационального изложения результатов сводки или группировки.

Подлежащее таблицы представляет ту статистическую совокупность, о которой идет речь в таблице, т. е. перечень отдельных или всех единиц совокупности либо их групп. Чаще всего подлежащее помещается в левой части таблицы и содержит перечень строк.

Сказуемое таблицы – это те показатели, с помощью которых дается характеристика явления, отображаемого в таблице.

Подлежащее и сказуемое таблицы могут располагаться по-разному. Это технический вопрос, главное, чтобы таблица была легко читаемой, компактной и легко воспринималась.

В статистической практике и исследовательских работах используются таблицы различной сложности. Это зависит от характера изучаемой совокупности, объема имеющейся информации, задач анализа. Если в подлежащем таблицы содержится простой перечень каких-либо объектов или территориальных единиц, таблица называется простой. В подлежащем простой таблицы нет каких-либо группировок статистических данных. Простые таблицы имеют самое широкое применение в статистической практике. Характеристика городов Российской Федерации по численности населения, средней зарплате и иному представляется простой таблицей. Если подлежащее простой таблицы содержит перечень территорий (например, областей, краев, автономных округов, республик и т. д.), то такая таблица называется территориальной.

Простая таблица содержит только описательные сведения, ее аналитические возможности ограничены. Глубокий анализ исследуемой совокупности, взаимосвязей признаков предполагает построение более сложных таблиц – групповых и комбинационных.

Групповые таблицы в отличие от простых содержат в подлежащем не простой перечень единиц объекта наблюдения, а их группировку по одному существенному признаку. Простейшим видом групповой таблицы являются таблицы, в которых представлены ряды распределения. Групповая таблица может быть более сложной, если в сказуемом приводится не только число единиц в каждой группе, но и ряд других важных показателей, количественно и качественно характеризующих группы подлежащего. Такие таблицы часто используются в целях сопоставления обобщающих показателей по группам, что позволяет сделать определенные практические выводы. Более широкими аналитическими возможностями располагают комбинационные таблицы.

Комбинационными называются статистические таблицы, в подлежащем которых группы единиц, образованные по одному признаку, подразделяются на подгруппы по одному или нескольким признакам. В отличие от простых и групповых таблиц комбинационные позволяют проследить зависимость показателей сказуемого от нескольких признаков, которые легли в основу комбинационной группировки в подлежащем.

Наряду с перечисленными выше таблицами в статистической практике применяют таблицы сопряженности (или таблицы частот). В основе построения таких таблиц лежит группировка единиц совокупности по двум или более признакам, которые называются уровнями. Например, население делится по полу (мужской, женский) и т. п. Таким образом, признак А имеет n градаций (или уровней) A1 A2, An (в примере n = 2). Далее изучается взаимодействие признака А с другим признаком – В, который подразделяется на k градаций (факторов) B1, B2, Bк. В нашем примере признак В – принадлежность к какой-либо профессии, а B1, B2,., Bk принимают конкретные значения (доктор, водитель, учитель, строитель и т. д.). Группировка по двум и более признакам используется для оценки взаимосвязей между признаками А и В.

В «свернутом» виде результаты наблюдений можно представить таблицей сопряженности, состоящей из n строк и k столбцов, в ячейках которых проставлены частоты событий nij, т. е. количество объектов выборки, обладающих комбинацией уровней Аi и Bj. Если между переменными A и B имеется взаимно-однозначная прямая или обратная функциональная связь, то все частоты nij концентрируются по одной из диагоналей таблицы. При связи не столь сильной некоторое число наблюдений попадает и на недиагональные элементы. В этих условиях перед исследователем стоит задача выяснить, насколько точно можно предсказать значение одного признака по величине другого. Таблица частот называется одномерной, если в ней табулирована только одна переменная. Таблица, в основе которой лежит группировка по двум признакам (уровням), которые табулируются по двум признакам (факторам), называется таблицей с двумя входами. Таблицы частот, в которых табулируются значения двух или более признаков, называются таблицами сопряженности.

Из всех видов статистических таблиц наиболее широкое применение имеют простые таблицы, реже применяются групповые и особенно комбинационные статистические таблицы, а таблицы сопряженности строят для проведения специальных видов анализа. Статистические таблицы служат одним из важных способов выражения и изучения массовых общественных явлений, но лишь при условии их правильного построения.

Форма любой статистической таблицы должна наилучшим образом отвечать сущности выражаемого ею явления и целям его изучения. Это достигается путем соответствующей разработки подлежащего и сказуемого таблицы. Внешне таблица должна быть небольшой и компактной, иметь название, указание единиц измерения, а также времени и места, к которым относятся сведения. Заголовки строк и граф в таблице даются кратко, но точно и ясно. Чрезмерное загромождение таблицы цифровыми данными, неряшливое оформление затрудняют ее чтение и анализ. Перечислим основные правила построения статистических таблиц.

1. Статистическая таблица должна быть компактной и отражать только те исходные данные, которые прямо отражают исследуемое социально-экономическое явление в статике и динамике.

2. Заголовок статистической таблицы и название граф и строк должны быть четкими, краткими, лаконичными. В заголовке должны быть отражены объект, признак, время и место совершения события.

3. Графы и строки следует нумеровать.

4. Графы и строки должны содержать единицы измерения, для которых существуют общепринятые сокращения.

5. Лучше всего располагать сопоставляемую в ходе анализа информацию в соседних графах (либо одну под другой). Это облегчает процесс ее сравнения.

6. Для удобства чтения и работы числа в статистической таблице следует проставлять в середине граф, строго одно под другим: единицы под единицами, запятая под запятой.

7. Числа целесообразно округлять с одинаковой степенью точности (до целого знака, до десятой доли).

8. Отсутствие данных обозначается знаком умножения «ч», если данная позиция не подлежит заполнению, отсутствие сведений обозначается многоточием (…), либо н. д., либо н. св., при отсутствии явления ставится знак тире (-).

9. Для отображения очень малых чисел используют обозначение 0.0 или 0.00.

10. Если число получено на основании условных расчетов, то его берут в скобки, сомнительные числа сопровождают вопросительным знаком, а предварительные – знаком «!».

В случае необходимости дополнительной информации статистические таблицы сопровождаются сносками и примечаниями, в которых разъясняются, например, сущность специфического показателя, примененной методологии и т. д. Сносками пользуются для того, чтобы указать на ограничивающие обстоятельства, которые надо принять во внимание при чтении таблицы.

При соблюдении этих правил статистическая таблица становятся основным средством представления, обработки и обобщения статистической информации о состоянии и развитии изучаемых социально-экономических явлений.

Виды средних величин

В статистике используют различные виды средних величин, которые делятся на два больших класса:

1) степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадратиче-ская, средняя кубическая);

2) структурные средние (мода, медиана). Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения. Поэтому их именуют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней – средняя арифметическая. Средней арифметической называется такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. В общем случае ее вычисление сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй – 7, третий – 4, четвертый – 10, пятый – 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз для определения средней выработки одного рабочего, следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек, возраст которых варьируется от 18 до 22 лет, где xi – варианты осредняемого признака, f – частота, которая показывает, сколько раз встречается i-е значение в совокупности.

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:

Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум взаимосвязанным показателям, для одного из которых надо вычислить среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя не известны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитываться по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысла и единственным обобщающим показателем может служить только другой вид средней – средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя не известны, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Если при использовании средней гармонической веса всех вариантов (f;) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где хi – отдельные варианты;

n – число вариантов осредняемого признака.

Например простую среднюю гармоническую можно применить к скорости, если равны отрезки пути, пройденные с разной скоростью.

Любая средняя величины должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной средней скоростью) не должно измениться общее расстояние.

Формула средней определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым. Поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической, в статистике используются и другие виды (формы) средней. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения их окажутся одинаковыми, здесь действует правило мажорантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина.

Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле:

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая – при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и исчисляется по формуле:

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и исчисляется по формуле:

а средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где x – средняя величина;

х – индивидуальное значение;

n – число единиц изучаемой совокупности;

k – показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности, и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов. Поэтому, кроме рассмотренных средних, в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные (или описательные) средние – мода (Мо) и медиана (Ме).

Мода – величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле:

где х0 – нижняя граница интервала;

h – величина интервала;

fm – частота интервала;

fm1 – частота предшествующего интервала;

fm+1 – частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой – больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (n+1) /2с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле:

где х0 – нижняя граница интервала;

h – величина интервала;

fm – частота интервала;

f– число членов ряда;

∫ m -1 – сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на четыре равные части, а децили – на десять равных частей. Квартилей насчитывается три, а децилей – девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

Показатели вариации

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения – атрибутивные и вариационные – в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности непостоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум – это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k – число вариантов значений признака. Частоты удобно заменять частостями – wi.

Частость – относительный показатель частоты, который может быть выражен в долях единицы или процентах, позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

где fi – число вариантов.

 

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности, формально имеем:

R = Xmax– Xmin

Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, ибо показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость только от крайних значений признака может придавать ему неустойчивый, случайный характер. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних. Область применения этого показателя ограничена достаточно однородными совокупностями. Точнее характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно уметь обобщить отклонения всех этих значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели вариации, как среднее линейное отклонение, дисперсия и среднее квадра-тическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:

где d – среднее линейное отклонение;

– абсолютное значение (модуль) отклонения варианта от средней арифметической;

f – частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая – в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней с их последующим усреднением. При этом мы получаем новый показатель вариации – дисперсию.

Дисперсия ( σ2 ) – средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (σ) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков (среднее линейное и среднее квадртиче-ское отклонение), конечно, непригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:

Коэффициент вариации – наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% для распределений, близких к нормальному.

Раздел 2. ПМ 02.02 Статистический анализ данных и бухгалтерский учет на компьютере.



Поделиться:


Последнее изменение этой страницы: 2017-01-20; просмотров: 563; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.137.171.121 (0.079 с.)