Сбор данных и проверка их на достоверность. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Сбор данных и проверка их на достоверность.



Сбором статистических данных называется процесс получения исходных данных об элементах исследуемой совокупности и их свойствах, которые в дальнейшем становятся предметом статистической обработки и анализа.

Статистические наблюдения классифицируются: 1) по форме организации; 2) по времени регистрации фактов; 3) по признаку полноты охвата элементов изучаемой совокупности.

По форме организации выделяют отчётность и специально организованные статистические наблюдения. Отчётность - основная организационная форма статистического наблюдения, которая состоит в сборе сведений от предприятий, учреждений и организаций о различных сторонах их деятельности на специальных бланках, называемых отчётами. В зависимости от продолжительности периода, относительно которого составляется отчётность, выделяют основную и текущую отчётность. Статистическое обследование - такая форма специально организованного статистического наблюдения, при котором исследуемая совокупность явлений подвергается наблюдению в течение определённого периода времени.

По признаку времени регистрации фактов в эконометрике различают текущее (непрерывное) и дискретное (прерывное) статистическое наблюдение. Текущее (непрерывное) статистическое наблюдение - наблюдение, которое осуществляется во времени непрерывно. При этом отдельные явления, факты, события регистрируются по мере их возникновения. Дискретное (прерывное) статистическое наблюдение - наблюдение, при котором наблюдаемые явления, факты, события регистрируются через периоды времени, равной или неравной продолжительности. Дискретное наблюдение может быть периодическим и единовременным.

В соответствии с признаком полноты охвата элементов изучаемой совокупности явлений, фактов, событий статистические наблюдения делятся на сплошные и несплошные наблюдения. Сплошное наблюдение - такая форма статистического наблюдения, при использовании которой учитываются все без исключения явления, факты, события, входящие в исследуемую совокупность. Несплошное наблюдение - такая форма статистического наблюдения, при использовании которой учитывается только некоторая часть явлений, фактов, событий, входящих в исследуемую совокупность.

Основными видами контроля достоверности данных являются: синтаксический, логический и арифметический. 1. Синтаксический контроль означает проверку правильности структуры документа, наличие необходимых и обязательных реквизитов, полноту заполнения строк формуляров в соответствии с установленными правилами. 2. Логическим контролем проверяются правильность записи кодов, соответствие их наименованиям и значениям показателей. 3. При арифметическом контроле сравниваются полученные итоги с предварительно подсчитанными контрольными суммами по строкам и по графам. Таким образом, контроль достоверности статистической информации осуществляется на всех этапах проведения статистического наблюдения, начиная со сбора первичной информации и до этапа получения итогов.

7. Основные характеристики соответствия данных требованиям закона нормального распределения (ЗНР).

Подходы для выбора репрезентативной информации:

Число данных, на основании которых можно рассчитать и построить ЭМ, n>=20.

 Вместе с тем требуется, если модель многофакторная, то число данных д.б. не меньше n>=2,5k,

где k – число факторов, вкл. результативный. Если k=4, n=20, но если k=9, n=2,5*9 k+результ.=25.

Если информация репрезентативна, то она должна отвечать требованию закона Гаусса(ЗНР).Сущность закона:

Если информация отвечает требованию ЗНР, то вероятность появления факторов, элементов и значения данных увеличивается по мере приближения их величины средней арифметической.

Формула вероятности появления значения выборки: *

Где х-значение изучаемого фактора, xi- значение фактора, x(ср)- среднее арифметическое фактора, σх-ср. квадратическое отклонение/стандартная ошибка. σх =

Расчет данных, требуемых ЗНР, скрайне сложен. Есть более простые формулы, которые объъясняют соответствие данных. Это характеристики: А-асимметрия, Э-эксцесс.

Эти характеристики находятся по формулам: А=∑ ; Э= -3

А,Э=0, а в реальной жизни А и Э чаще всего не равны 0, т.к. могут содержать ошибки (напр.при округлении). Если А>0, то кривая распределений сдвинута вправо.

Если А<0, то кривая сдвигается влево.

 Асимметрия – смещение вероятности появления факторов по горизонтали, следует число факторов больше или меньше средней арифметической х. Эксцесс – вероятность числа факторов или больше среднего или меньше.

Если больше 0, то кривая вероятностей островерха, меньше – полога. Информация будет отвечать требованиям ЗНР, если , |Э≤5 |. Ошибка А и Э зависит только от одного параметра:  =>f(n). Сущность ошибки объясняется законом больших чисел. В соотв. С ним при увеличении числа данных бесконечности, отриц. Ошибки данных погашаются полож. Ошибками и информация в целом идеально объясняет свойственные ей закономерности. А= ,  =

Если или А, или Э выходит за допустимые пределы, то нужно найти значения, которые приводят к такой ситуации. Как правило, ошибки явл. причиной того, что среди данных столбца есть резко выделяющиеся значения: или очень малые, или очень больше. Чаще всего бывает, что до 20 процентов будут отличаться от А и Э. С учетом нарушений число данных д.б. примерно на 20 процентов больше числа, минимально необходимого. Т.е., если минимальное число больше 20, то надо взять как минимум 24-25.


 

8. Сущность закона трех сигм и его экономическое содержание.

 

При рассмотрении нормального закона распределения выделяется важный частный случай, известный как правило трех сигм.

Формула может быть использована для вычисления вероятности того, что отклонение случайной величины X, распределенной по нормальному закону от её математического ожидания по абсолютной величине меньше заданного числа δ. Часто такой расчет требуется в практических задачах, т.е. когда требуется найти вероятность осуществления неравенства: . Преобразуем эту формулу в: m-δ<X<m+δ и подставим в формулу . Поскольку Ф (х) нечетная функция, т.е. Ф (– х) = – Ф (х), имеем:

т.е. вероятность модуля отклонения случайной величины, распределенной по нормальному закону, можно вычислить по формуле:

Если измерять величину отклонения в единицах s, то можно вывести практически полезную закономерность, которая известна как правило трех сигм. Действительно, положим в d=s*t. Получим:

Если t =3 и, следовательно, s* t = 3s, то

т.е. вероятность того, что отклонение по абсолютной величине будет меньше утроенного среднеквадратичного отклонения, очень велика. Это означает, что вероятность противоположного события, которое заключается в том, что абсолютное отклонение превысит утроенное s, очень мала, а именно равна 0,0027. В этом и состоит сущность правила трех сигм.



Поделиться:


Последнее изменение этой страницы: 2021-07-18; просмотров: 71; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.152.98 (0.006 с.)