Статистический анализ данных 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистический анализ данных



Лабораторная работа №9

Статистический анализ данных

Цель работы: научиться обрабатывать статистические данные в электронных таблицах с помощью встроенных функций; изучить возможности Пакета анализа в MS Excel и его некоторые инструменты: Генерация случайных чисел, Гистограмма, Описательная статистика, а также рассмотреть возможности графического представления статистических данных в OpenOffice.org Calc.

Теоретическая часть

Очень часто для обработки данных, полученных в результате обследования большого числа объектов или явлений (статистических данных), используются методы математической статистики.

Современная математическая статистика подразделяется на две обширные области: описательную и аналитическую статистику. Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений и пр.

Аналитическая статистика называется также теорией статистических выводов. Ее предметом является обработка данных, полученных в ходе эксперимента, и формулировка выводов, имеющих прикладное значение для самых различных областей человеческой деятельности

Полученный в результате обследования набор чисел называется статистической совокупностью.

Выборочной совокупностью (или выборкой) называется совокупность случайно отобранных объектов. Генеральной совокупностью называется совокупность объектов, из которой производится выборка. Объемом совокупности (генеральной или выборочной) называется число объектов этой совокупности.

Для статистической обработки результаты исследования объектов представляют в виде чисел x 1, x 2, …, xk. Если значение x 1 наблюдалось n 1 раз, значение x 2 наблюдалось n 2 раз, и т.д., то наблюдаемые значения xi называются вариантами, а числа их повторений ni называются частотами. Процедура подсчета частот называется группировкой данных.

Объем выборки n равен сумме всех частот ni:

. (1)

Относительной частотой значения xi называется отношение частоты этого значения ni к объему выборки n:

. (2)

Статистическим распределением частот (или просто распределением частот) называется перечень вариант и соответствующих им частот, записанных в виде таблицы:

 

Распределением относительных частот называется перечень вариант и соответствующих им относительных частот.


Среднее значение.

Функция СРЗНАЧ (или AVERAGE в Calc) вычисляет выборочное (или генеральное) среднее, то есть среднее арифметическое значение признака выборочной (или генеральной) совокупности. Аргументом функции СРЗНАЧ является набор чисел, как правило, задаваемый в виде интервала ячеек, например, =СРЗНАЧ (А3:А201).

 

Объем совокупности.

Объем совокупности выборочной или генеральной – это число элементов совокупности. Функция СЧЕТ (или COUNT в Calc) определяет количество ячеек в заданном диапазоне, которые содержат числовые данные. Пустые ячейки или ячейки, содержащие текст, функция СЧЕТ пропускает. Аргументом функции СЧЕТ является интервал ячеек, например: =СЧЕТ (С2:С16).

Для определения количества непустых ячеек, независимо от их содержимого, используется функция СЧЕТ3 (или COUNTA в Calc). Ее аргументом является интервал ячеек.

 

Мода и медиана.

Мода – это значение признака, которое чаще других встречается в совокупности данных. Она вычисляется функцией МОДА (или MODE в Calc). Ее аргументом является интервал ячеек с данными.

Медиана – это значение признака, которое разделяет совокупность на две равные по числу элементов части. Она вычисляется функцией МЕДИАНА (или MEDIAN в Calc). Ее аргументом является интервал ячеек.

 

Задание 1. Применение статистических функций

Одним и тем же вольтметром было измерено 25 раз напряжение на участке цепи. В результате опытов получены следующие значения напряжения в вольтах: 32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35, 34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30. Найдите выборочные среднюю, дисперсию, стандартное отклонение, размах варьирования, моду, медиану. Проверить отклонение от нормального распределения, вычислив асимметрию и эксцесс.

1. Наберите результаты эксперимента в столбец А.

2. В ячейку В1 наберите «Среднее», в В2 – «выборочная дисперсия», в В3 – «стандартное отклонение», в В4 – «Максимум», в В5 – «Минимум», в В6 – «Размах варьирования», в В7 – «Мода», в В8 – «Медиана», в В9 – «Асимметрия», в В10 – «Эксцесс». Выровняйте ширину этого столбца с помощью Автоподбора ширины.

3. Выделите ячейку С1 и нажмите на знак «=» в строке формул. С помощью Мастера функций в категории Статистические найдите функцию СРЗНАЧ, затем выделите интервал ячеек с данными и нажмите Enter.

4. Выделите ячейку С2 и нажмите на знак «=» в строке формул. С помощью помощью Мастера функций в категории Статистические найдите функцию ДИСП, затем выделите интервал ячеек с данными и нажмите Enter.

5. Проделайте самостоятельно аналогичные действия для вычисления стандартного отклонения, максимума, минимума, моды, медианы, асимметрии и эксцесса.

6. Для вычисления размаха варьирования в ячейку С6 следует ввести формулу: =МАКС (А1:А25)-МИН(А1:А25).

 

Задание 2 (выполняется в Excel). Инструменты пакета анализа Excel

Сгенерировать 500 случайных чисел, распределенных нормально. Построить гистограмму и полный список статистических характеристик с помощью инструмента Описательная статистика.

1. Выполните команду Сервис®Анализ данных®Генерация случайных чисел;

2..В диалоговом окне Генерация случайных чисел введите в поле число переменных: 1; в поле Число случайных чисел 500; выберите Распределение Нормальное; задайте любое среднее значение (желательно около 100) и небольшое стандартное отклонение (не больше 10); в поле Выходной интервал укажите абсолютный адрес столбца $A$2. Нажмите ОК.

1. Теперь постройте гистограмму по совокупности случайных чисел. Сначала нужно задать интервалы решения. Пусть длины интервалов будут одинаковыми и равны 3. Для автоматического составления интервалов разбиения наберите в ячейку В2 начальное число, например, 75 для наших случайных чисел. Затем выполните команду Правка®Заполнить®Прогрессия. В появившемся диалоговом окне заполните данные:

- в группе переключателей поле Расположение установите по столбцам;

- в поле Шаг наберите 3;

- в поле Предельное значение наберите 125;

- в группе переключателей Тип установите арифметическая и нажмите ОК.

В результате столбец В будет содержать интервалы разбиения (карманы).

2. Выполните команду Сервис®Анализ данных®Гистограмма. В появившемся диалоговом окне Гистограмма заполните:

- входной интервал появится, если щелкнуть мышью по столбцу А;

- интервал карманов появится, если щелкнуть мышью по столбцу В;

- поставьте галочку в поле метки;

- укажите столбец С в поле Выходной интервал;

- активизируйте переключатель Вывод графика; если это поле не содержит галочки, нажмите ОК.

3. Построение гистограммы займет от 5 до 10 минут. За это время письменно ответьте на контрольные вопросы. В результате вычисления получатся столбец под названием Карман, который дублирует ваш столбец интервалов разбиения, и столбец под название Частота с рассчитанными частотами. После того, как появилась гистограмма, измените ее размеры с помощью мыши так, чтобы хорошо были видны все столбцы и подписи.

4. Теперь осталось получить таблицу статистических характеристик с помощью Описательной статистики. Выполните команду Сервис®Анализ данных®Описательная статистика. В появившемся диалоговом окне Описательная статистика укажите:

- в поле Входной интервал появится адрес, если выделить мышью интервал сданными или с клавиатуры набрать адрес $A$2: $A$501;

- в поле Группирование активизировать переключатель по столбцам;

- активизировать переключатель Метки в первой строке;

- в группе Параметры вывода укажите Выходной интервал, щелкнув мышью по какой-либо пустой ячейке ниже столбца частот, например, по С 25;

- активизируйте переключатель Итоговая статистика (если в этом поле нет галочки);

- активизируйте переключатель Уровня надежности и установите 95%;

- снимите галочки с полей наименьший и наибольший и нажмите ОК.

Результаты покажите преподавателю.

 

Лабораторная работа №9

Статистический анализ данных

Цель работы: научиться обрабатывать статистические данные в электронных таблицах с помощью встроенных функций; изучить возможности Пакета анализа в MS Excel и его некоторые инструменты: Генерация случайных чисел, Гистограмма, Описательная статистика, а также рассмотреть возможности графического представления статистических данных в OpenOffice.org Calc.

Теоретическая часть

Очень часто для обработки данных, полученных в результате обследования большого числа объектов или явлений (статистических данных), используются методы математической статистики.

Современная математическая статистика подразделяется на две обширные области: описательную и аналитическую статистику. Описательная статистика охватывает методы описания статистических данных, представления их в форме таблиц, распределений и пр.

Аналитическая статистика называется также теорией статистических выводов. Ее предметом является обработка данных, полученных в ходе эксперимента, и формулировка выводов, имеющих прикладное значение для самых различных областей человеческой деятельности

Полученный в результате обследования набор чисел называется статистической совокупностью.

Выборочной совокупностью (или выборкой) называется совокупность случайно отобранных объектов. Генеральной совокупностью называется совокупность объектов, из которой производится выборка. Объемом совокупности (генеральной или выборочной) называется число объектов этой совокупности.

Для статистической обработки результаты исследования объектов представляют в виде чисел x 1, x 2, …, xk. Если значение x 1 наблюдалось n 1 раз, значение x 2 наблюдалось n 2 раз, и т.д., то наблюдаемые значения xi называются вариантами, а числа их повторений ni называются частотами. Процедура подсчета частот называется группировкой данных.

Объем выборки n равен сумме всех частот ni:

. (1)

Относительной частотой значения xi называется отношение частоты этого значения ni к объему выборки n:

. (2)

Статистическим распределением частот (или просто распределением частот) называется перечень вариант и соответствующих им частот, записанных в виде таблицы:

 

Распределением относительных частот называется перечень вариант и соответствующих им относительных частот.



Поделиться:


Последнее изменение этой страницы: 2017-02-05; просмотров: 713; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 35.172.231.232 (0.019 с.)