ЗНАЕТЕ ЛИ ВЫ?

Математическая обработка статистических данных, результатов эксперимента.



 

Зависимости между параметрами некоторого объекта, процесса, явления могут быть выражены с помощью мате­матических формул. Но в некоторых случаях коэффициен­ты в этих формулах могут быть получены в результате ста­тистической обработки экспериментальных данных. Стати­стика— это наука о сборе, измерении и анализе больших массивов количественных данных. Статистические данные носят приближенный, усредненный характер, получаются путем многократных измерений. Математический аппарат статистики разрабатывает раздел науки под названием «Ма­тематическая статистика». Статистические данные исполь­зуются, в частности, для получения упрощенного математи­ческого описания сложной или неизвестной зависимости между данными некоторой системы (регрессионные моде­ли). Статистические функции электронных таблиц позво­ляют обрабатывать статистические данные, например, вы­числять, среднее арифметическое числовых данных (СРЗНАЧ), среднее геометрическое положительных число­вых данных, минимальное и максимальное значения из на­бора данных, выполнять подсчеты (СЧЁТ, СЧЁТЕСЛИ, СЧЁТЗ, СЧИТАТЬПУСТОТЫ и т. д.).

 

Статистический анализданных широко используется:

  • в народном хозяйстве при: анализе результатов дея­тельности предприятий и организаций; оценке состоя­ния финансового, сырьевого и других рынков; анализе прибыльности инвестиционной деятельности; составле­нии краткосрочных планов и долгосрочных прогнозов;
  • в социологии и психологии для обработки и анализа ре­зультатов опросов, тестирования, анкетирования;
  • в научной деятельности для обработки результатов экс­периментов, оценки их достоверности, проверки гипо­тез и пр.

Использование динамических (электронных) таблиц для обработки и представления результатов естественно-научного и математического эксперимента, экономических и экологических наблюдений, социальных опросов

Для определения статистической зависимости необходимо выпол­нить два шага:

  1. На основании физического смысла статистических данных принять вид аналитических зависимостей. Это может быть, например, полином второй степени у = ах2 + bx + с, линейная зависимость у = ах + b и т. п. Во всех формулах x — аргумент y — значение функции, а, b, с — параметры функций.
  2. С помощью метода наименьших квадратов (МНК) по имеющимся статистическим данным найти значения величин а, Ь, с, определяющих конкретный вид приня­той зависимости.

Полученная аналитическая зависимость называется регрессионной моделью.

MS Excel позволяет построить регрессионную модель по статистическим данным и получить значение коэффициента детерминированности (достоверности) R2(КД). КД определяет, насколько удачной является полученная регрессионная модель. КД принимает значения от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если 0, то выбранный вид регрессионной модели совсем неудачен. Чем R2 ближе к 1, тем удачнее модель.

 

Алгоритм построения регрессионной модели:

  1. Выделить обе колонки исходных данных (наборы X и Y).
  2. Вызвать Мастер диаграмм.
  3. Построить Точечную диаграмму.
  4. Для полученной диаграммы выбрать меню Диаграмма - Доба­вить линию тренда.
    Тренд — это график регрессионной модели (от англ. trend — тенденция).
  5. Выбрать, например, линейную линию тренда. Перейти к вкладке Параметры.
  6. В открывшемся диалоговом окне параметров выбрать опции: показывать уравнение на диаграмме и помес­тить на диаграмму величину достоверности аппрок­симации (R^2).
  7. На экране появится линия тренда, уравнение с число­выми параметрами и коэффициент R2.
  8. Проанализировать линию тренда (как часто ее точки совпадают с точками точечной диаграммы) и значение R2 и повторить построение регрессионной модели для других видов аналитических зависимостей.
  9. Выбрать из полученных регрессионных моделей ту, ко­торая имеет наибольшее значение R2.

Примеры построения регрессионных моделей

Пример географических наблюдений. Зависимость температуры воздуха от широты города.

Определить зависимость температуры воздуха от широты города.

 

Город Широта, град.с.ш. Температура
Воронеж 51,5
Краснодар 45,0
Липецк 52,6
Новороссийск 44,8
Ростов на Дону 47,3
Рязань 54,5
Северодвинск 64,8
Череповец 59,4
Ярославль 57,7

 

Статистические данные метеорологических наблюдений позволяют высказать гипотезу о том, что средняя темпера­тура зависит от широты города и может быть описана неко­торой математической формулой.

 

Линейная регрессионная модель:

 

Квадратичная регрессионная модель:

 

Регрессионный анализ показал, что зависимость средней температуры от широты города является квадратичной, так как R2 = 0,98, что ближе к 1, чем R2 для линейной за­висимости. Используя зависимость у = 0,0367х2 - 4,9784х + + 173,59 можно восстановить значение средней температу­ры для города, находящегося на 50-й широте (16,42 °С), и высказать прогноз средней температуры для города, находя­щегося на 70-й (4,9 °С) или 40-й (33,2 °С) широте. Если представится возможность получить данные о температуре на этих широтах, то можно проверить точность модели и убедиться в достоверности (или ошибочности) данных, кото­рые получены при ее использовании. Во втором случае новый набор статистических данных позволит уточнить мо­дель или ее коэффициенты и предоставит возможность для более точного прогноза температуры.

 

Экологический пример. Медицинская статистика

Определить зависимость частоты заболеваемости жителей города бронхиальной астмой от качества воздуха. Очевидно, чем хуже воздух, например, выше концентрация С угарного газа в атмосфере, тем больше хронических больных Р на 1000 жителей.

Статистические данные являются усредненными и при­ближенными, их собирают в разных городах в течение дли­тельного времени. Далее данные анализируют и обобщают.

 

С, мг/куб.м Р, бол./тыс.
2,0
2,5
2,9
3,2
3,6
3,9
4,2
4,6
5,0

 

Линейная зависимость P(C):

Квадратичная зависимость Р(С) (полиномная 2-ой степени):

 

Далее регрессионная модель может быть использована для восстановления значений и для прогнозирования забо­леваний.

 

Социальные опросы

Опросы разных категорий населения страны проводят для того, чтобы выявить, например, проблемы трудоустрой­ства, места размещения магазинов, школ и детских садов, мнения избирателей перед выборами и т. п. Анализ резуль­татов опросов позволяет принять правильные решения по тому или иному вопросу. Выбор будущей профессии являет­ся одним из важных решений, принимаемых человеком в своей жизни. Поэтому ответы на вопрос: «Какой фактор яв­ляется для вас наиболее значимым при выборе профессии, и, соответственно, вуза?» (Журнал «Обучение и карьера», 2006, № 4) представляют интерес для многих специалистов.

 

Фактор Процент выбравших данный фактор
Интерес к определенной деятельности 54,63
Престиж и доходность выбираемой специальности 16,49
Возможность последующего трудоустройства 12,37
Другое 7,21
Предназначение 5,25
Возможности родителей 3,09
Советы родителей и друзей 1,06

 

 





Последнее изменение этой страницы: 2016-04-26; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 34.201.3.10 (0.011 с.)