Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Алгоритм 2. Визуальный Анализ диаграммы рассеяния, выявление и фиксация аномальных значений признаков, их удаление из первичных данных

Поиск

1. Найти на графике точку, соответствующую аномальному наблюдению. Если таких точек нет, то перейти к действию 7, если есть – к действиям 2–6.

2. Подвести курсор к точке на диаграмме рассеяния, соответствующей аномальному наблюдению. После непродолжительного времени возле точки автоматически появится надпись, содержащая значения признаков (xi,yi) этого наблюдения.

 
 

Для демонстрационного примера такая надпись выглядит следующим образом:

3. В исходных данных визуально найти в табл.1 строку, соответствующую выявленной аномальной единице наблюдения (предприятию) и скопировать её в табл.2.

4. Выделить мышью всю адресную строку (вместе с ее номером) с данными, подлежащими удалению.

Для демонстрационного примера это адресная строка с номером 34, содержащая значения 31, 330 и 53:

  А В С D E
           
33          
           
           

3. Правка=>Удалить.

4. Выполнять действия 1–5 до полного удаления всех аномальных значений признаков.

5. Выделить диаграмму рассеяния и переместить ее, используя прием "захват мышью", в область ячеек, начиная с ячейки F4.

Для демонстрационного примера табл.2, содержащая две единицы наблюдения с аномальными значениями признаков, имеет следующий вид.

    Таблица 2-ДП
Аномальные единицы наблюдения
Номер предприятия Среднегодовая стоимость основных производственных фондов, млн руб. Выпуск продукции, млн руб.
  50,00 150,00
  330,00 53,00
         

Задание 2

Оценка описательных статистических параметров

Совокупности

Обобщающие статистические показатели совокупности исчисляются на основе анализа вариационных рядов распределения (см. в методических указаниях [1] п.3 раздела II – «Теоретические основы лабораторной работы»). Однако пакет Excel позволяет рассчитать многие из этих показателей непосредственно по первичным данным наблюдения, используя инструмент Описательная статистика надстройки Пакет анализа, а также статистические функции инструмента Мастер функций.

Выполнение Задания 2 заключается в автоматизированном решении двух статистических задач:

1. Расчет описательных показателей выборочной и генеральной совокупностей по несгруппированным выборочным данным с использованием инструментов Описательная статистика и Мастер функций.

2. Оценка средней и предельной ошибок выборки для средней величины признака, а также границ, в которых эта средняя будет находиться в генеральной совокупности при заданных уровнях надежности.

Алгоритмы выполнения Задания 2

Выполнение задания включает три этапа:

1. Расчет описательных параметров выборочной и генеральной совокупностей с использованием инструмента Описательная статистика.

2. Оценка предельных ошибок выборки для различных уровней надежности в режиме Описательная статистика.

3. Расчет описательных параметров выборочной совокупности с использованием инструмента Мастер функций.

Этап 1. Расчет описательных параметров выборочной и генеральной совокупностей с использованием инструмента Описательная статистика

Алгоритм 1.1. Расчет описательных статистик

1. Сервис=>Анализ данных=>Описательная статистика=>OK;

2. Входной интервал<= диапазон ячеек таблицы, выделенный для значений признаков Стоимость основных фондов и Выпуск продукции (B4:С33);

3. Группирование =>по столбцам;

4. Итоговая статистика - Активизировать;

5. Уровень надежности - Активизировать;

6. Уровень надежности <= 95,4 (или 95.4);

7. Выходной интервал <= адрес ячейки заголовка первого столбца табл.3 (А46);

8. OK;

9. При появлении окна с сообщением " Выходной интервал накладывается на имеющиеся данные " =>ОК.

Результат работы алгоритма 2.1 для демонстрационного примера представлен в табл.3–ДП.

 

  A B C D
        Таблица 3-ДП
    Описательные статистики  
  Среднегодовая стоимость основных производственных фондов, млн руб. Выпуск продукции, млн руб.
46 Столбец1 Столбец2
         
  Среднее 203,2333333 Среднее 144,6666667
  Стандартная ошибка 8,804737927 Стандартная ошибка 7,071772174
  Медиана 206,5 Медиана 148,5
  Мода   Мода  
  Стандартное отклонение 48,22553575 Стандартное отклонение 38,73369141
  Дисперсия выборки 2325,702299 Дисперсия выборки 1500,298851
  Эксцесс 0,18281271 Эксцесс -0,602481285
  Асимметричность -0,185105228 Асимметричность 0,218561586
  Интервал   Интервал  
  Минимум   Минимум  
  Максимум   Максимум  
  Сумма   Сумма  
  Счет   Счет  
  Уровень надежности (95,4%) 18,356223 Уровень надежности (95,4%) 14,74331526


Поделиться:


Последнее изменение этой страницы: 2016-04-26; просмотров: 304; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.218.3.204 (0.006 с.)