Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Дані про стаж роботи працівників підприємства

Поиск
Номер робітника Стаж, років Номер робітника Стаж, років Номер робітника Стаж, років Номер робітника Стаж, років
          21,5   17,6
  27,5   16,3   23,5   27,9
  12,5   33,5        
  4,2   19,3        
  5,5   18,2       18,2
  12,3   14,5        
  24,3   12,8   17,2    
              22,5
  30,5   9,5        
      5,3   5,6   6,5
  23,1   1,5       11,5
  10,5   22,5   11,5    
      26,2   29,5   17,5
  7,2       25,8   19,6
      15,8   18,4   25,5
  0,5   19,2   17,7   24,8
      15,2   18,5   11,2
  26,5       15,4   15,8
  32,5       28,5    
          27,3    
          22,3   26,8
          23,5    
      10,2   10,8    
  20,5           22,6
          16,8   17,8

 

На панелі інструментів (або в меню Statistics) виберемо Basic Statistics/TablesОсновні статистики/таблиці. У вікні, що з’явилося, представлені можливості цього модуля системи (рис. 1).

 

Рис. 1. Стартове вікно модуля Основні статистики/таблиці

 

Можливості модуля Основні статистики/таблиці наведені у табл. 2.

 

Таблиця 2

Можливості модуля Основні статистики/таблиці

Descriptive statistics Описові статистики
Correlation matrices Кореляційні матриці
t-test, independent, by groups t-критерій, для незалежних груп
t-test, independent, by variables t-критерій, для незалежних змінних
t-test, dependent samples t-критерій, для залежних вибірок
t-test, single samples t-критерій, для окремих вибірок
Breakdown & one-way ANOVA Класифікація та однофакторний дисперсійний аналіз
Frequency tables Таблиці частот
Multiple response tables Багатовимірні таблиці результатів
Difference tests Інші критерії значущості
Probability calculator Калькулятор імовірнісних розподілів

Розглянемо описові характеристики наведеного ряду розподілу.

У стартовому вікні Основні статистики та таблиці оберемо Descriptive statisticsОписові статистики і отримаємо діалогове вікно описових статистик (рис. 2).

 

Рис. 2. Діалогове вікно Описові статистики. Розширений набір описових статистик

 

У діалоговому вікні Описові статистики можна:

обрати змінні для аналізу;

обчислити різні описові статистики;

оцінити, наскільки близький розподіл до нормального закону;

побудувати гістограми розподілу;

згрупувати дані, розбиваючи різними способами на класи;

зручно візуалізувати дані та ін.

У цьому вікні перейдемо на закладку AdvancedРозширений набір описових статистик, де можна вказати, які саме статистики нам необхідно обчислити (табл. 3).

 

Таблиця 3

Перелік основних характеристик варіаційних рядів

Valid N Обсяг вибірки
Mean Середнє арифметичне значення
Sum Сума
Median Медіана
Mode Мода
Geom. Mean Середнє геометричне значення
Harm. Mean Середнє гармонічне значення
Standard Deviation Стандартне відхилення
Variance Дисперсія
Standard error of mean Стандартна помилка середнього значення
95% confidence limits of means 95%-ний довірчий інтервал для середнього значення
Minimum, maximum Мінімальне і максимальне значення
Lower, upper quartiles Нижній і верхній квартилі
Range Розмах варіації
Skewness Коефіцієнт асиметрії
Standard error of Skewness Стандартна помилка коефіцієнта асиметрії
Kurtosis Коефіцієнт ексцесу
Standard error of Kurtosis Стандартна помилка ексцесу

 

Зробивши необхідні установки у цьому вікні, натиснемо кнопку Summary: Descriptive statistics і отримаємо таблицю результатів (табл. 4).

 

Таблиця 4

Описові статистики ряду розподілу: стаж

  Valid N Mean Confidence Confidence Median Mode Frequency Sum
Стаж   18,982 17,2655 20,6985 18,45000 12,00   1898,2
                 
  Minimum Maximum Range Variance Std.Dev. Standard Skewness Kurtosis
Стаж 0,50 40,00 39,50 74,83563 8,650759 0,865 0,049 -0,5563

 

Дамо інтерпретацію отриманим результатам. Було проаналізовано стаж роботи 100 працівників підприємства. Мінімальний стаж роботи – півроку, а максимальний – 40 років. Різниця між максимальним та мінімальним стажем (Range) склала 39,5 років. Середній стаж роботи працівників – 18,98 років. З імовірністю 95% можна стверджувати, що середній стаж знаходитиметься у межах від 17,26 до 20,699 років. На середину впорядкованого ряду припадає стаж у 18,45 років, найбільша частина працівників мають стаж 12 років. Коефіцієнт асиметрії показує, що досліджуваний ряд симетричний, а коефіцієнт ексцесу показує, що розподіл низьковершинний.

Проведемо групування працівників за стажем роботи і побудуємо гістограму розподілу. Для цього у діалоговому вікні Описові статистики перейдемо на закладку NormalityНормальність (рис. 3).

 

Рис. 3. Діалогове вікно Описові статистики. Нормальність

 

На цій закладці є група кнопок та опцій DistributionРозподіл. Опції CategorizationГрупування дозволяють обрати спосіб групування даних. Тут можна задати кількість інтервалів (Number of intervals) і значення змінної будуть розбиті на задане число інтервалів, або вибрати Integer intervalsЦілі інтервали. Кнопка Frequency tables дозволяє продивитися таблицю частот згрупованих даних (рис. 4). У таблиці зазначені нижня і верхня межі інтервалів, частоти (кількість значень, що ввійшли в інтервал), накопичені частоти, частки й накопичені частки (у %).

Кнопка HistogramsГістограми дозволяє побудувати гістограму розподілу за згрупованими даними (рис. 5). За бажанням на гістограму можна накласти щільність нормального розподілу, перевірити узгодженість даних із нормальним законом розподілу за допомогою критеріїв Колмогорова – Смірнова, Ліллієфора, обчислити статистику Шапіро – Уілкса (відповідні значення будуть указані в таблиці частот і вгорі на графіку розподілу (рис. 4, 5)).

 

Рис. 4. Таблиця частот

Рис. 5. Гістограма розподілу з накладеною щільністю нормального закону

Окрім того, можна побудувати функцію емпіричного розподілу. Для цього необхідно в меню вибрати GraphsHistograms, у вікні, що з’явилося, перейти на закладку Advanced і зробити ряд установок. Наприклад: тип графіка (Graph Type): Regular (обирається у випадку, коли аналізуються значення однієї змінної, а якщо змінних декілька, то для кожної будується окрема гістограма); тип підбору (Fit Type): Normal (якщо значення змінної розподілені за нормальним законом розподілу) або Оff (без підбору); тип гістограми (Showing Type): Cumulative (накопичений); указати кількість інтервалів (Categories), наприклад, 25. У результаті отримаємо наступний графік емпіричного розподілу (рис. 6).

 

Рис. 6. Графік емпіричного розподілу

 

З таблиці частот, гістограми розподілу та графіка емпіричного розподілу бачимо, що значення змінної розподілені за нормальним законом.

Завдання. Самостійно ознайомтеся з іншими можливостями модуля Основні статистики/таблиці. Проведіть розрахунки, наведіть їх результати. Дайте математичну та економічну інтерпретацію отриманих результатів.

Лінійна множинна регресія

Процедури регресійного аналізу об’єднано в модулі Multiple RegressionМножинна регресія. Як приклад, розглянемо модель залежності виходу цукру з 1 т сировини в кг (у) від цукристості буряка (х1), втрат сировини при транспортуванні й зберіганні (х2) та втрат цукру при переробці сировини (х3). Вихідні дані для аналізу наведені у табл. 5.

 

Таблиця 5

Вихідні дані для аналізу

  x1 x2 x3 y
  15,1 0,99 2,5 9,78
  15,41 1,06 2,68 9,13
  15,22 0,98 2,19 10,46
  15,16 0,95 2,06 10,69
  15,43   2,05 10,58
  15,41   2,06 10,84
  15,15 0,97 2,34 10,87
  16,06 0,9 2,24 12,24
  15,95 0,92 2,27 11,94
  15,59 0,95 2,13 11,26
  15,52 0,93 2,26 11,01
  15,33 0,97   11,88
  15,48 0,91 2,2 11,53
  15,18 0,98 2,23 11,03
  15,17 0,98 2,18 10,37

 

Запустимо програму Statistica і сформуємо файл даних. На панелі інструментів (або в меню Statistics) вибираємо модуль Multiple Regression. У стартовому вікні модуля, натиснувши кнопку Variables, вибираємо залежну (Dependent var.) і незалежну (Independent var.) змінні. На закладці Advanced можна задати додаткові параметри побудови регресійної моделі. За командою виконання програми з'явиться вікно результатів аналізу (рис. 7).

Рис. 7. Вікно Результатів множинної регресії

 

В інформаційній частині вікна міститься наступна інформація: назва залежної змінної та обсяг сукупності; наводяться значення коефіцієнтів щільності зв’язку (множинної кореляції, множинної детермінації та скоректований коефіцієнт множинної детермінації); значення F-критерію, стандартної похибки оцінювання (Standard error o f estimate), вільного члена рівняння регресії b0 (Intercept) та його похибки (Std. Error), значення критерію Стьюдента, значення bі-коефіцієнтів.

У функціональній частині вікна містяться кнопки та опції, що дозволяють усебічно розглянути результати регресійного аналізу. Так, на закладці Quik є кнопка Summary: Regression ResultsРезультати регресії, яка виводить таблицю результатів побудови регресії (рис. 8). У цій таблиці наведені наступні результати побудови регресії: bі-коефіцієнти (Beta) і коефіцієнти регресії bi з стандартними похибками, значення t-критерію та фактичні рівні істотності p-level. Зверніть увагу на те, що деякі рядки виділені червоним кольором. Це своєрідна підказка щодо значущості відповідних параметрів побудованої моделі. Значущість параметрів оцінюється за t-критерієм, значення якого наведені у цій же таблиці.

 

Рис. 8. Результати регресії

 

Наступним кроком є аналіз адекватності побудованої моделі. Про адекватність моделі можна судити за значеннями коефіцієнтів множинної кореляції та детермінації, за значеннями критеріїв Стьюдента та Фішера. Окрім того, слід провести аналіз залишків моделі. Для цього призначена кнопка Perform residual analysis, яка знаходиться на закладці Residuals/assumptions/prediction у вікні Результатів множинної регресії. Натиснувши цю кнопку, переходимо у вікно Аналіз залишків (рис. 9).

 

Рис. 9. Вікно налізу залишків

У цьому вікні представлений великий набір аналітичних та графічних інструментів, призначених для аналізу залишків моделі. Наглядними і найважливішими є гістограма розподілу залишків (закладка Residuals, кнопка Histogram of residuals) і графік залишків на нормальному ймовірнісному папері (закладна Probability plots, кнопка Normal plot of residuals). Відповідні графіки наведено на рис. 10, 11.

 

Рис. 10. Гістограма розподілу залишків

 

Рис. 11. Графік залишків на нормальному ймовірнісному папері

Якщо залишки розподілені за нормальним законом розподілу (гістограма залишків) і добре лягають на пряму (графік залишків на нормальному ймовірнісному папері), то це свідчить про адекватність побудованої моделі.

У модулі Множинної регресії можна знайти прогнозне значення залежної змінної. Для цього у вікні результатів необхідно перейти на закладку Residuals/assumptions/prediction і натиснути кнопку Predict dependent variableПрогнозне значення залежної змінної. У вікні, що з’явилося, потрібно задати значення незалежних змінних, при яких слід знайти прогнозне значення залежної змінної. Наприклад, задамо такі значення (рис. 12).

 

Рис. 12. Значення незалежних змінних для обчислення прогнозного значення залежної змінної

 

Після виконання команди, отримаємо наступну таблицю результатів (рис. 13).

 

Рис. 13. Результати прогнозування

 

У цій таблиці в стовпці B-Weight указані коефіцієнти регресії при залежних змінних, у стовпці Value – значення незалежних змінних, які щойно були задані. У рядку Intercept вказане значення вільного члена регресії, у рядку Predicted – прогнозне значення залежної змінної. Нижче вказані нижня та верхня межі довірчого інтервалу. Отже, при цукристості буряка 15,5, втратах сировини при транспортуванні та зберіганні 0,95 та втратах цукру при переробці сировини 2,45, вихід цукру становитиме 10,76 кг.

Завдання. Самостійно ознайомтеся з іншими аналітичними та графічними можливостями модуля Множинної регресії. Побудуйте регресію, використовуючи інші методи (метод підключень та метод виключень). Порівняйте та проаналізуйте результати, отримані різними методами.

 

Нелінійні моделі

У статистиці розроблено багато методів рішення задачі оцінювання функціональної залежності. У випадку, коли залежність між показниками є нелінійною, при оцінці параметрів моделі використовуються методи нелінійного оцінювання, що зібрані в модулі Nonlinear EstimationНелінійне оцінювання. У цьому модулі можна скористатися заздалегідь визначеними регресійними моделями (логіт, пробіт, експоненційна та інші моделі, що традиційно використовуються на практиці) або задати власну модель.

У модулі Нелінійного оцінювання використовуються різні методи оцінювання невідомих параметрів. Можливим є використання методу найменших квадратів, методу максимальної правдоподібності, можна також задати свою функцію втрат. Більшість методів засновано на мінімізації того чи іншого функціонала. При мінімізації можливо використовувати ряд оптимізаційних процедур, серед яких є квазі-ньютонівський метод, симплекс-метод, процедура Хука – Дживіса та інші.

Розглянемо приклад. Нехай, певне підприємство характеризується наступними даними: випуск продукції, вартість основних виробничих фондів і середньоспискова чисельність робітників (табл. 6). Необхідно побудувати багатофакторну нелінійну модель (вид моделі – функція Кобба – Дугласа) залежності випуску продукції від вартості основних фондів та чисельності робітників; оцінити параметри моделі та її адекватність.

Таблиця 6



Поделиться:


Последнее изменение этой страницы: 2016-09-05; просмотров: 238; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.44.156 (0.009 с.)