Розділ 8. Програми для статистичної обробки даних 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Розділ 8. Програми для статистичної обробки даних



 

Які програми слід використовувати для статистичної обробки даних? Це питання, мабуть, виникає перед кожним дослідником, оскільки в наш час є досить багато таких програм як платних, так і доступних на безплатних безкоштовній основі. Для різного роду статистичного аналізу можна використовувати стандартні пакети, що входять до складу електронних таблиць (Excel, Lotus 1-2-3, Quattro Pro), математичні пакети загального призначення (Mathcad, Maple) і спеціалізовані програмні продукти (СПП). Міжнародний ринок нараховує більш, ніж 1000 пакетів, які здатні вирішувати задачі статистичного аналізу даних в середовищі операційних систем Windows, Linux, Macintosh та ін. Ми зупинимось на характеристиці тільки найбільш відомих СПП, які, на нашу думку, заслуговують на особливу увагу.

STATISTICA. Це одна з найбільш популярних статистичних програм, яку можна використовувати на практиці. Вона має деталізований розділ «Допомога». В даний момент в продажі є як російськомовна, так і англомовна версії STATISTICA 10. В цій системі STATISTICA модулі комплектуються наступним чином: можна придбати окремо STATISTICA Base, або пакети більш розширеної конфігурації, такі як STATISTICA Advanced, STATISTICA QC чи STATISTICA Advanced + QC. В STATISTICA 10 методи, які використовуються в біології, згруповані в наступних модулях: базова статистика (Basiс statistics), непараметричні методи (Nonparametrics/Distrib.) і дисперсійний аналіз (ANOVA/MYNOVA). Також досить зручним для використання є можливість завантаження 64-бітної версії цієї програми.

IBM SPSS (Statistical Package for Social Science). Один з найпопулярніших статистичних пакетів (http://www-01.ibm.com/software/analytics/spss/). Відрізняється гнучкістю, потужністю, його можна застосовувати для всіх видів статистичних обчислень, які використовуються в біомедицині. Недавно вийшла 21-а англомовна версія. SPSS має зручні графічні засоби (більш, ніж 50 типів діаграм), а також розвинуті засоби підготовки звітів. Аналітичні параметри відображаються на екрані у вигляді простих і зрозумілих меню і діалогових вікон. Нова контекстно-орієнтована довідкова система містить покрокові інструкції для найбільш важливих операцій.

STADIA. Пакет STADIA є єдиним російським статистичним пакетом, який можна віднести до класу універсальних пакетів, в якому наявні всі найбільш поширені методи статистичного аналізу даних як параметричних, так і непараметричних. Пакет STADIA досить простий в користуванні, проте досить дорогий (професійна версія коштує 300 дол.) Безкоштовну пробну версію програми можна завантажити за наступним посиланням: http://protein.bio.msu.ru/~akula/Podr2~1.htm. Дана програма дозволяє швидко знайти необхідний метод обробки даних, представити результати аналізу в табличній і графічній формах і продовжити їх оформлення в інших середовищах Windows (текстових і графічних редакторах).

STATGRAPHICS. Дана програма включає більш, ніж 250 статистичних процедур. Кожній групі процедур відповідає власне меню. Результати виводяться в табличній формі або на зручних для відтворення графіках. Остання версія програми V16.1.18 збагачена діалоговою системою вводу даних і вибору методів аналізу (сайт http://www.statgraphics.com). Модуль Statistical Advisor, що коротко пояснює суть будь-якого проведеного аналізу, допомагає в інтерпретації результатів. Окрім того, дана програма містить в собі порадник, який пояснює, що означає та чи інша обчислена величина і що потрібно дослідникові робити далі. Таким чином, STATGRAPHICS є достатньо корисним програмним продуктом, доступним для молодого дослідника.

SYSTAT. Остання 13.1 версія програми має непоганий інтуїтивно зрозумілий інтерфейс. Окрім того на сайті програми http://systat.com подана не тільки демо-версія цієї програми, але й інструкція для використання цієї програми у форматі PDF, і досить показова відеопрезентація, і безкоштовна для використання студентами версія програми MYSTAT 12.

MINITAB 16. Статистичний пакет MINITAB в даний час випускається у версії 16. Із сайту виробника http://www.minitab.com можна взяти повнофункціональний пробний варіант програми, який працює 30 днів. Це достатньо зручний у роботі програмний пакет, що має зрозумілий інтерфейс, досить добрі можливості з візуалізації результатів роботи, має детальну довідку. MINITAB добре продуманий розділ описової статистики, який керується за допомогою зручного меню. Команди, які часто використовуються, можна запустити, набравши першу букву їхньої назви. Загальна кількість команд перевищує 200. Імпорт/експорт даних з інших Windows-програм можна зробити через стандартний буфер обміну.

PRISM 6. Ця програма, що сторена спеціально для біомедичних досліджень, містить основні статистичні функції, шо часто використовуються. На сайті http://www.graphpad.com крім можливості закачати демо-версію Prism 6, можна отримати довідник у форматі PDF по біомедичній статистиці.

MYNOVA. Це досить спеціалізована безкоштовна програма для біомедичних досліджень. Вона виділяється зрозумілим інтерфейсом і простотою обчислень. Дуже проста у використанні. Проте дана програма не може конкурувати із такими славнозвісними спеціалізованими пакетами, як STATISTICA чиSTADIA.

Такі програми для статистичного аналізу даних, як SAS, STATA, JMR, NCSS тут розглянутися не будуть.

Окрім цих спеціалізованих програм в Інтернеті доступно багато ресурсів по статистичній обробці даних. Один із них – це сайт Биометрика (http://www.biometrica.tomsk.ru). Варто сказати і те, що в мережі Інтернет доступні онлайн-калькулятори по статистичній обробці даних. Серед них слід виділити сайт http://math.semestr.ru/, де можна не тільки здійснити потрібну статистичну обробку даних, але й завантажити результати обчислень у вигляді документу Word з детальним описом їх виконання. На сайті http://mas.exponenta.ru/mathematics/mathstat/ також можна здійснити статистичну обробку даних, проте він є менш функціональним за попередній.

На якій же програмі зосередити свою увагу? Перш за все потрібно завантажити їх демо-версії, а потім вже робити свій вибір.

Що стосується можливих рекомендацій, то вони наступні:

- ми рекомендуємо всі проміжні обчислення проводити в програмі MS Excel, де не тільки зосереджений потужний функціонал, але й ця програма дає змогу досліднику з легкістю вводити свої формули і зберігати їх для подальшого використання;

- якщо потрібний загальноприйнятий професійний пакет із потужним функціоналом, то можна скористатись програмою STATISTICA, IBM SPSS або STATGRAPHICS;

- для користувачів, що у своїх дослідженнях застосовують стандартні статистичні методи, можна рекомендувати безкоштовні версії програм STADIA, MYSTAT і MYNOVA.

 


УЗАГАЛЬНЕННЯ

Розглянувши в даній роботі статистичні показники, які необхідні для правильного опису експериментальних даних, на завершення нами складена узагальнююча таблиця (алгоритм) послідовності етапів статистичної обробки даних, застосування певних формул, критеріїв чи методів для цих обчислень (таблиця 27). Ця таблиця не є панацеєю статистичної обробки даних, проте, на нашу думку, вона допоможе досліднику в осмисленні послідовності етапів обробки даних.

Таблиця 27. Етапи статистичної обробки даних

Етап роботи Показник, який потрібно визначити Формула, критерій або метод для використання Ст.
І. ХАРАКТЕРИСТИКИ ВИБІРКИ 13-48
  (М) =  
  s або  
  m або  
    Промахи Критерій Шовене Q-критерій Діксона  
або
Критерій Романовського Критерій Ірвіна  
  Систематичні помилки Критерій Аббе  
  За наявності промахів у вибірці, їх викидаємо і повторюємо обчислення за пунктами 1-3  
  Нормальний розподіл даних при n≥10 Складовий критерій d Критерій Шапіро-Уілка Коефіцієнт асиметрії та ексцесу  
Якщо масив даних істотно відрізняється від нормального розподілу, то для опису даних потрібно використати медіану або збільшити кількість повторів
  при p<0,05  
Результати обчислень записуємо у вигляді або або
ІІ. ПОРІВНЯННЯ ВИБІРОК МІЖ СОБОЮ 49-81
  Однорідність дисперсій (тільки при порівнянні двох вибірок між собою) Критерій Кокрена G Критерій Фішера F  
  Дві незалежні вибірки Непарний критерій Стьюдента U -критерій Манна-Уітні Критерій Уелча  
або
  Дві залежні вибірки Парний критерій Стьюдента W -критерій Уілкоксона  
або
  Більше двох вибірок, які порівнюються між собою Критерій Ньюмена-Коулса Критерій Данна  
або
    Більше двох вибірок, які порівнюються із контрольною вибіркою Критерій Даннета Критерій Данна  
ІІІ. ВЗАЄМОЗВ'ЯЗКИ МІЖ ГРУПАМИ: КОРЕЛЯЦІЙНО-РЕГРЕСІЙНИЙ АНАЛІЗ   82-105
  Коефіцієнти рівнянь регресії Метод МНК / Метод найменших квадратів  
     
    η  
  S y2 S y2 = (Σyi2 – ((Σyi)2 / n)) / n – 1  
  S 2зал S 2зал = Σ(yi – yx)2/ (n – 2)  
  F ф F ф = S y2 / S 2зал  
  δ  
  Δ  
  op op = (1/n)Σ((yi – yx)/yx) × 100  
  oδ  
На основі фактичних значень F -критерію Фішера, похибок та помилок робимо загальний висновок про адекватність того чи іншого рівняння регресії і використовуємо його для опису даних

РЕКОМЕНДОВАНА ЛІТЕРАТУРА

1. Айвазян С.А. Прикладная статистика: Исследование зависимостей: Справ.изд. / С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин. – М.: Финансы и статистика, 1985. – 487 с.

2. Алиев Т.М. Восстановление закона распределения случайных погрешностей в классе распределений И.А. Назарова / Т.М. Алиев, А.М. Шекиханов // Измерительная техника. – 1992. – №3. – С. 7

3. Блейхер О.В. Статистика: Учебное пособие / О.В. Блейхер. – Томск: Изд-во., 2007. – 86 с.

4. Бурдун Г.Д. Основы метрологии / Г.Д. Бурдун, Б.Н. Марков. – М.: Изд-во стандартов, 1985.

5. Вайнберг Дж. Статистика / Дж. Вайнберг, Дж. Шумекер. – М.: Статистика. – 1979. – 390 с.

6. Валеев С.Г. Практикум по прикладной статистике: учебное пособие / С. Г. Валеев, В. Н. Клячкин. – Ульяновск: УлГТУ, 2008. – 129 с.

7. Вальд А. Последовательный анализ / А. Вальд. – М: ФМ, 1960.

8. Ван дер Варден Б.А. Математическая статистика / Б.А. Ван дер Варден. – М: ИЛ., 1960.

9. Волкова П.А. Статистическая обработка данных в учебно-исследовательских работах / П.А. Волкова, А.Б. Шипунов. – М.: Экопресс, 2008. – 60 с.

10. Гаскаров Д.В. Малая выборка / Д.В. Гаскаров, В.И. Шаповалов. – М.: Статистика, 1978. – 248 с.

11. Гланц С. Медико-биологическая статистика. Пер. с англ. / С. Гланц– М.: Практика, 1998. – 459 с.

12. Гмурман В.Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. – Изд. 7-е, стер. / В.Е. Гмурман. – М.: Высш. шк., 2001. – 479 с.

13. Гублер Е.В. Применение непараметрических критериев статистики медико-биологических исследованиях / Е.В. Гублер, А.А. Генкин. – Л.: Медицина, 1973. – 141 с.

14. Гусев К.И. Метрологическое обеспечение, взаимозаменяемость, стандартизация: Учебное пособие для студентов машиностроительных специальностей вузов / К.И. Гусев. – М.: Машиностроение, 1992. – 384 с.

15. Джини К. Средние величины / К. Джини. – М.: Статистика, 1970. – 447 с.

16. Долинский Е.Ф. Обработка результатов измерений / Е.Ф. Долинский. – М., Издательство стандартов. – 1973. – 192 с.

17. Зайцев Г.Н. Методика биометрических рсчетов. Математическая статистика в экспериментальной ботанике / Г.Н. Зайцев. – М., «Наука», 1973. – 256 с.

18. Захаров И.П. Теоретическая метрология: Учеб. Пособие / И.П. Захаров. – Харьков: ХТУРЭ, 2000. – 172 с.

19. Калінін М.І. Біометрія: Підручник для студентів вузів біологічних і екологічних напрямків / М.І. Калінін, В.В. Єлісеев. – Миколаїв: Вид-во МФ НаУКМА, 2000. – 204 с.

20. Кассандрова О.Н.Обработка результатов наблюдений / О.Н. Кассандрова, В.В. Лебедев. – М.: “Наука”, 1970. – 104 с.

21. Кобзарь А.И. Прикладная математическая статистика / А.И. Кобзарь. – М.: Физматлит, 2006. – 816 с.

22. Кокунин В.А. Статистическая обработка данных при малом числе опытов / В.А. Кокунин // Укр. биохим. журнал. – 1975. – Т.47, №6. – C. 776-790.

23. Колмогоров А.Н. Определение центра рассеивания и меры точности по ограниченному числу наблюдений / А.Н. Колмогоров. – М: ИАН СССР, 1947.

24. Крамер Г. Математические методы статистики / Г. Крамер. – М.: Мир, 1975. – 648 с.

25. Кудряшова Ж.Ф. Рекомендация по методам обработки результатов наблюдений при прямых измерениях / Ж.Ф. Кудряшова, С.Г. Рабинович, К.А. Резник // Методы обработки результатов наблюдений при измерениях (Тр. Метрологических институтов СССР). – Вып. 134 (194). – C. 5-113.

26. Кузнецов В.А. Метрология: теоретические, прикладные и законодательные основы: Учеб. Пособие / В.А. Кузнецов, Г.В. Ялунина. – М.: ИПК Издательство стандартов, 1998. – 336 с.

27. Лакин Г.Ф. Биометрия. Издание четвертое, переработанное и дополненное / Г.Ф. Лакин. – М.: Высшая школа, 1990. – 352 с.

28. Лемешко Б.Ю. О применении и мощности критериев проверки однородности дисперсий. Ч. I. Параметрические критерии / Б.Ю. Лемешко, С.Б. Лемешко, А.А. Горбунова // Измерительная техника. – 2010. – №3. – С. 10-15

29. Лемешко Б.Ю. Критерии Бартлетта и Кокрена в измерительных задачах при вероятностных законах, отличающихся от нормального / Б.Ю. Лемешко, Е.П. Миркин // Измерительная техника. – 2004. – №10. – С. 10-16.

30. Лемешко Б.Ю. Исследование распределений статистик, используемых для проверки гипотез о равенстве дисперсий при законах ошибок, отличных от нормального / Б.Ю. Лемешко, В.М. Пономаренко // Научный вестник НГТУ. – 2006. – №2(23). – С. 21-33.

31. Лемешко Б.Ю. О применении и мощности критериев проверки однородности дисперсий. Ч. II. Непараметрические критерии / Б.Ю. Лемешко, С.Б. Лемешко, А.А. Горбунова // Измерительная техника. – 2010. – №5. – С. 11-18

32. Леонов В.П. Применение статистики в статьях и диссертациях по медицине и биологии. Часть 1. Описание методов статистического анализа в статьях и диссертациях / В.П. Леонов, П.В. Ижевский // Международный журнал медицинской практики. – 1998. № 4. – С. 7-12.

33. Львовский Е.Н. Статистические методы построения эмпирических формул: Учеб. Пособие / Е.Н. Львовский. – М.: Высш. школа, 1982. – 224 с.

34. Малета Ю.С. Непараметрические методы статистического анализа в биологии и медицине / Ю.С. Малета, В.В. Тарасов. – М.: Изд-во Московского университета, 1982. – 178 с.

35. Медик В.А. Статистика в медицине и биологии. Том 1 / В.А. Медик, М.С. Токмачев, Б.Б. Фишман. – М.: Медицина, 2000. – 412 с.

36. Мироновский Л.А. Алгоритмы оценивания результата трех измерений / Л.А. Мироновский, В.А. Слаев. – СПб.: «Профессионал», 2010. – 192 с.

37. Морозов Ю.В. Основы высшей математики и статистики: Учебник / Ю.В. Морозов. – М.: Медицина, 1998. – 232 с.

38. Основы метрологии: методические указания по выполнению практических работ для студентов всех специальностей дневной и заочной форм обучения / СПб. гос. архит.-строит. ун-т; сост. В. А. Норин. – СПб., 2007. – 28 с.

39. Петри А. Наглядная статистика в медицине. Перевод с английского / А. Петри, К. Сэбин. – М.: Издательский дом «ГЭОТАР-МЕД», 2003. – 139 с.

40. Платонов А.Е. Статистический анализ в биологии и медицине: задачи, терминология, логика, компьютерные методы / А.Е. Платонов. – М.: Из-во РАМН, 2000. – 52 с.

41. Плохинский Н.А. Математические методы в биологии / Н.А. Плохинский. – М.: МГУ, 1978. – 226 с.

42. Пустыльник Е.И. Статистические методы анализа и обработки наблюдений / Е.И. Пустыльник. – М., Наука, 1968. – 288 с.

43. Рабинович С.Г. Погрешности измерений / С.Г. Рабинович. – Л.: Энергия. 1978. – 262 с.

44. Реброва О.Ю. Статистический анализ медицинских данных. Применение прикладных программ Statistica / О.Ю. Реброва. – М.: МедиаСфера, 2002. – 312 с.

45. Рыков В.В. Математическая статистика и планирование эксперимента: Конспект лекций / В.В. Рыков, В.Ю. Иткин. – М.: Прикладная математика в инженерном деле, 2009. – 303 с.

46. Рокицкий П.Ф. Биологическая статистика. Изд. 3-е, испр. / П.Ф. Рокицкий. – Минск. – Вышэйш. Школа. 1973. – 320 с.

47. Руденко В.М. Математична статистика. Навч. посіб. / В.М. Руденко. – К.: Центр учбової літератури, 2012. – 304 с.

48. Серафинович Л.П. Статистическая обработка опытных даннях / Л.П. Серафинович. – Томск, 1980. – 74 с.

49. Сергеев А.Г. Метрология: Учебное пособие для вузов / А.Г. Сергеев, В.В. Крохин. – М.: Логос, 2001. – 408 с.

50. Снедекор Дж.У. Статистические методы в применении к исследованиям в сельском хозяйстве и биологии / Дж.У. Снедекор. – М.: Сельхозгиз, 1961. – 503 с.

51. Статистична обробка даних: Монографія / [Бабак В.П., Білецький А.Я., Приставка О.П., Приставка П.О.]. – К.: МІВВЦ, 2001. – 388 с.

52. Третьяк Л.Н. Обработка результатов наблюдений: Учебное пособие / Л.Н. Третьяк. – Оренбург: ГОУ ОГУ, 2004. – 171 с.

53. Тюрин Н.Н. Введение в метрологию: Учеб.пособие. – 3 изд. перераб. и доп. / Н.Н. Тюрин. – М.: Изд-во стандартов, 1985.

54. Урбах В.Ю. Биометрические методы. Статистическая обработка опытных данных в биологии, сельском хозяйстве и медицине / В.Ю. Урбах. – М.: Наука, –1964. – 416 с.

55. Фишер Р. Статистические методы для исследователей / Р. Фишер. – М: Гостехиздат, 1958.

56. Юнкеров В.И. Математико-статистическая обработка данных медицинских исследований / В.И. Юнкеров, С.Г. Григорьев. – СПб.: ВМедА, 2002. – 266 с.

57. Anderson D. The Scientific Analysis of Data / D. Anderson, S.L. Slove. The Scientific Press, Palo Alto, 1986.

58. Ansari A.R. Rank-tests for dispersions / A.R. Ansari, R.A. Bradley // AMS.1960. – V.31. №4. – P.1174-1189.

59. Bartlett M.S. Properties of sufficiency of statistical tests / M.S. Bartlett // Proc. Roy. Soc. – 1937. – A 160. – P. 268-287.

60. Capon J. Asymptotic efficiency of certain locally most powerful rank tests / J. Capon // AMS. – 1961. – V.32, №1. – P. 88-100.

61. Cochran W.G. The distribution of the largest of a set of estimated va-riances as a fraction of their total / W.G. Cochran // Annals of Eugenics. – 1941. – V.11. – P. 47-52.

62. Davidian M. Experimental statistics for biological sciences: Lecture notes / M. Davidian. – 1998. – 366 p.

63. Dicks H.M. Biometry. Introduction to statistical method: Course notes / H.M. Dicks. – 2006. – 64 p.

64. Hartley H.O. The maximum F-ratio as a short-cut test of heterogeneity of variance / H.O. Hartley // Biometrika. – 1950. – V.37. – P. 308-312.

65. Feinstein A.R. Clinical biostatistics XXXVII. Demeaned errors, confidence games, nonplused mineses, inefficient coefficients, and other statistical disruption of scientific communication / A.R. Feinstein // Clin. Pharmacol. Ther. –1976. – V.20. – P.617-31.

66. Feinstein A.R. X and iprP: an improved summery for scientifics communication / A.R. Feinstein // J. Chronic. Dis. – 1987. – V. 40. – P. 283-8.

67. Fisher R.A. On the mathematical foundations of theoretical statistics / R.A. Fisher // Phil. Trans. Roy. Soc., ser. A. 1921. – V. 222.

68. Klotz J. Nonparametric tests for scale / J. Klotz // AMS. – 1962. – V.33. – P. 498-512.

69. Lang T. Twenty Statistical Errors Even YOU Can Find in Biomedical Research Articles / T. Lang // Croatian Medical Journal. – 2004. – V.45(N4). – P. 361-370.

70. Lehner P.N. Handbook of Ethological Methods / P.N. Lehner. Cambridge University Press, 1996. – 672 p.

71. Levene H. Robust tests for equality of variances / H. Levene // Contributions to Probability and Statistics: Essays in Honor of Harold Hotelling. – 1960. – P. 278-292.

72. Mood A. On the asymptotic efficiency of certain nonparametric tests / A. Mood // AMS. – 1954. – V.25. – P. 514-522.

73. Mosteller F., Rourke R. Sturdy Statistics: Nonparametrics and Order Statistics / F. Mosteller, R. Rourke. Addison-Wesley, Reading, Mass., 1973.

74. Neyman J. L’estimation statistique traitce comme unprobleme classique de probabilite / J. Neyman. Actualites sci. et ind. № 739.

75. Rayner A.A. A first course in biometry for agriculture students. University of Natal Press / A.A. Rayner. – 1967. – 603 p.

76. Shapiro S.S. An analysis of variance test for normality (complete samples) / S.S. Shapiro, M.B. Wilk // Biometrika. – V.52, N3/4. – 1965. – P.591-611.

77. Siegel S. Nonparametric statistics for the behavioural sciences N.Y. McGraw-Hill, 1956. – 312 p.

78. Siegel S. A nonparametric sum of rank procedure for rela-tive spread in unpaired samples / S. Siegel, J.W. Tukey // JASA. – 1960. – V.55, №291. – P. 429-445.

79. Siegel S. Nonparametric Statistics for the Behavioral Sciences, 2nd ed. / S. Siegel, N.J. Castellan. McGraw-Hill, N,Y., 1988.

80. Zar J.H. Biostatistical analysis. Upper Saddle River, N.J., Prentice-Hall, 1999.


ТЛУМАЧНИЙ СЛОВНИК ТЕРМІНІВ

Асиметрія (англ. skewness, γ1)– показник, який характеризує ступінь несиметричності розподілу. Це відношення центрального моменту третього порядку µ3 до куба середнього квадратичного відхилення σ3: γ1= µ33.

Варіанта, випадкова величина (англ. random variable; хі)– окреме випадкове значення варіаційної ознаки, якого набуває ця ознака в ряді розподілу.

Варіація (англ. variation) – мінливість, коливання значень ознак у одиниць сукупності. Це характерна особливість будь-якого біологічного об’єкту.

Вибіркова сукупність, або вибірка (англ. sample) – це сукупність об’єктів, вибраних випадковим чином з генеральної сукупності. Власне цей набір даних може бути підданий далі статистичній обробці.

Генеральна сукупність ( англ. population) – сукупність всіх об’єктів, що підлягають дослідженню. Обсяг генеральної сукупності, тобто число об’єктів дослідження може бути досить великим. Часто буває неможливо дослідити всі об’єкти генеральної сукупності.

Дисперсія (англ. variance, σ2)–міра відхилення випадкових значень від середньої значення величини для вибірки або генеральної сукупності.

Довірчий інтервал (англ. confidence interval, Δx) – це інтервал, у межах якого з заданою імовірністю можна чекати значення оцінюваного параметру. Застосовується для повнішої оцінки точності в порівнянні з точковою оцінкою.

Ексцес (англ. kurtosis,γ2) – ступінь загостреності (згладженості) кривої емпіричного розподілу. Це характеристика, що обчислюється за наступною формулою: γ244–3, де де µ4 – центральний момент четвертого порядку, σ2 – дисперсія.

Індекс кореляції (англ. correlation index) умовна величина, розрахована лише по відношенню до певної кривої. Її значення може бути доведене до 1, якщо в якості кривої, що описує зв’язок, взяти параболу, в якій кількість параметрів доведена до кількості одиниць спостереження. Ця величина використовується для вимірювання щільності криволінійного зв’язку і визначається аналогічно до коефіцієнта кореляції(r). Індекс кореляції приймає значенням від 0 до 1. Певного знака він не має, оскільки на різних відрізках кривої напрям зв’язку може змінюватись.

Закон розподілу (англ. distribution law) – це будь-яке співвідношення, що встановлює зв'язок між можливими значеннями випадкової величини та відповідними ймовірностями.

Квантиль (англ. quantile) – значення, яке задана випадкова величина не перевищує з фіксованою ймовірністю, що є порядком квантиля. Квантилі відсікають в межах ряду певну частину його членів. Тобто, квантиль розподілення значень – це таке число xp, що значення p -ї частини сукупності менше або рівне xp. Наприклад, квантиль 0,25 (також називається 25-м процентилем або нижнім квартилем) змінної – це таке значення (xp), коли 25% (p) значень змінної попадають нижче даного значення. Значення 50-ого квантилю є медіаною.

Квартиль (англ. quartile) – це квантиль порядку p = 0,25 або p = 0,75.

Коефіцієнт асиметрії (англ. skewness) – це безрозмірна характеристика симетричності статистичного ряду.

Коефіцієнт варіації (англ. coefficient of variation) – відношення стандартного відхилення до абсолютного значення математичного сподівання випадкової величини.

Коефіцієнт детермінації (англ. determination coefficient, r-squared, R2) – статистичний показник, що використовується в статистичних моделях як міра залежності варіації залежної змінної від варіації незалежних змінних. Вказує наскільки отримані спостереження підтверджують модель.

Коефіцієнт ексцесу (англ. coefficient of kurtosis)– числова характеристика розподілу ймовірностей дійсної випадкової величини, що характеризує «крутість», тобто, стрімкість підвищення кривої розподілу у порівнянні з нормальною кривою.

Кореляційний аналіз (англ. сorrelation analysis) – метод дослідження взаємозалежності ознак у генеральній сукупності, які є випадковими величинами з нормальним характером розподілу.

Кореляція (англ. correlation) – це взаємозалежність двох або декількох випадкових величин.

Крива регресії (англ. regression curve) – для двох випадкових величин Х і Y це крива, яка відображає залежність умовного математичного сподівання випадкової величини Y за умови Х = х для кожної змінної х. Якщо крива регресії Y по X являє собою пряму лінію, то регресію називають «Простою лінійною».

Крива розподілу (англ. distribution curve) цекрива, що зображає щільність розподілу f(x) випадкової величини.

Медіана (англ. median)– значення xi, розміщене посередині ряду значень, що розставлені в порядку від найменшого до найбільшого. Геометричнo медіана – це абсциса точки, у якій площа, що обмежена кривою розподілу ділиться навпіл. Це квантиль порядку р=0,5.

Метод найменших квадратів (англ. method of least squares, МНК) – метод оцінки параметрів моделі на підставі експериментальних даних, що містять випадкові помилки. В основі методу лежать наступні міркування: при заміні точного (невідомого) параметра моделі приблизними значенням необхідно мінімізувати різницю між експериментальними даними і теоретичними (обчисленими за допомогою запропонованої моделі). Це дозволяє розрахувати параметри моделі за допомогою МНК з мінімальною похибкою.

Непараметричні критерії (англ. non-parametric test) – це критерії, які засновані на операціях з такими типами даних, як частоти, ранги і т.п. Це критерій Колмогорова-Смирнова, Манна-Уїтні і багато інших. Непараметричні критерії позбавлені обмежень, які присутні при застосуванні параметричних критеріїв. Ці критерії дозволяють вирішити деякі важливі завдання, які супроводжують дослідження в біології: виявлення відмінностей у рівні досліджуваної ознаки, оцінка зсуву значень досліджуваної ознаки, виявлення відмінностей у розподілах ознак.

Об’єм вибірки ( англ. sample size ) –число вибіркових одиниць у вибірці.

Параметричні критерії (англ. parametric test) – це критерії, які використовуються в задачах перевірки параметричних гіпотез і включають в свій розрахунок показники розподілу, наприклад, середні, дисперсії і т.д. Це такі відомі класичні критерії, як t-критерій Стьюдента, F-критерій Фішера та ін. Параметричні критерії дозволяють прямо оцінити рівень основних параметрів генеральних сукупностей, різниці середніх і відмінності в дисперсіях. Ці критерії здатні виявити тенденції зміни ознаки при переході від умови до умови, оцінити взаємодію двох і більше факторів у впливі на зміни ознаки. Параметричні критерії вважаються дещо більш потужними, ніж непараметричні, за умови, що ознака виміряна інтервальною шкалою і нормально розподілена. Однак з інтервального шкалою можуть виникнути певні проблеми і, якщо дані, представлені не в стандартизованих оцінках.

Регресійний аналіз, регресія (англ. regression analysis і regression) – статистичний метод, використовуваний для дослідження відносин між двома величинами. На відміну від суворої функціональної залежності y=f(x) у регресійній моделі одного й того ж значенню величини x можуть відповідати кілька значень величини y, іншими словами, при фіксованому значенні x величина y має деякий випадковий розподіл.

Розмах вибірки (англ. range) різниця між найбільшим і найменшим значеннями кількісної ознаки у вибірці.

Розподіл (англ. probability distribution) – функція, що визначає ймовірність того, що випадкова величина прийме якесь задане значення або належатиме заданому проміжку значень.

- нормальний (англ. normal distribution, Laplace-Gauss distribution) – розподіл ймовірностей неперервної випадкової величини Х таке, що щільність розподілу ймовірностей має вигляд:

Середня арифметична величина (англ. arithmetic mean) – це частка від ділення суми всіх варіант сукупності на їх загальну кількість.

Середня арифметична зважена (англ. arithmetic weighted mean) – це величина, яка обчислюється із значень варіюючої ознаки з урахуванням ваг. Її застосовують у тих випадках, коли значення ознаки представлені у вигляді варіаційного ряду розподілу, в якому чисельність одиниць по варіантах не однакова, а також при розрахунку середньої із середніх при різному обсязі сукупності. Зважування в даному випадку здійснюється за частотами, які показують скільки разів повторюється та або інша варіанта.

Середня арифметична проста ( англ. arithmetic single mean) – це величина, яка застосовується в тих випадках, коли відомі дані про окремі значення ознаки та їх число в сукупності, тобто розраховується у разі, коли є незгруповані індивідуальні значення ознаки. В статистичній практиці вона застосовується, як правило, для розрахунку середніх рівнів ознак, представлених у вигляді абсолютних показників.

Середня величина (англ. mean) – це узагальнюючий показник, що характеризує типовий рівень варіюючої ознаки в якісно однорідній сукупності.

Систематична похибка, систематична помилка ( англ. systematic error ) – компонент помилки результату, який залишається постійним чи закономірно змінюється в ході отримання результатів перевірки для однієї ознаки.

Стандартне відхилення (англ. standard deviation) – додатний квадратний корінь із значення дисперсії.

Статистичні дані (англ. statistical data) це сукупність показників, отриманих внаслідок статистичного спостереження або обробки даних.

Статистичний критерій (англ. statistical test) строге математичне правило, за яким приймається або відкидається та або інша статистична гіпотеза. Побудовою критерію є вибір відповідної функції від результатів спостережень (ряду емпірично набутих значень ознаки), яка служить для виявлення міри розбіжності між емпіричними значеннями і гіпотетичними.

Стандартна помилка середньої арифметичної величини (англ. s tandard e rror of the m ean) – стандартна помилка, що вказує на точність, з якою показник вибірки – середнє арифметичне – представляє (репрезентує) середнє арифметичне для генеральної сукупності.

Ступінь свободи (англ. degree of freedom) – у загальному випадку число доданків мінус число обмежень, що накладаються на них.

Потужність критерію (англ. power of a test) – ймовірність недопущення помилки прийняти гіпотезу, якщо вона хибна.

Промахи (англ. outliers) – це cпостереження у вибірці, що відрізняються від інших по величині настільки, що виникає припущення, що вони належать іншій сукупності або отримані в результаті помилки виміру.

Функція розподілу (англ. distribution function) – функція, що задає для будь-якого значення х імовірність того, що випадкова величина Х менша або дорівнює х.

Центральний момент q-го порядку (англ. central moment of order q) – математичне сподівання q-го степеня центрованої випадкової величини.

Щільність розподілу (англ. probability density function) – перша похідна функції розподілу неперервної випадкової величини, f(x)=dF(x)/dx.

 



Поделиться:


Последнее изменение этой страницы: 2017-01-19; просмотров: 571; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 44.192.107.255 (0.138 с.)