Соответствующие разным вероятностям допустимой ошибки 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Соответствующие разным вероятностям допустимой ошибки



И разным степеням свободы

 

Число степеней свободы (m-1) Вероятность допустимой ошибки
0,05 0,01 0,001
  3,84 5,99 7,81 9,49 11,07 12,59 14,07 15,51 16,92 18,31 19,68 21,03 22,36 23,68 25,00 6,64 9,21 11,34 13,28 15,09 16,81 18,48 20,09 21,67 23,21 24.72 26,05 27,69 29,14 30,58 10,83 13,82 16,27 18,46 20,52 22,46 24,32 26,1227.88 29,59 31,26 32,91 34,53 36,12 37,70

экспериментально подтвердилась: успеваемость значительно улучшилась, и это мы можем утверждать, допуская ошибку, не превышающую 0,001%.

Иногда в психолого-педагогическом эксперименте возника­ет необходимость сравнить дисперсии двух выборок для того, чтобы решить, различаются ли эти дисперсии между собой. До­пустим, что проводится эксперимент, в котором проверяется ги­потеза о том, что одна из двух предлагаемых программ или ме­тодик обучения обеспечивает одинаково успешное усвоение зна­ний учащимися с разными способностями, а другая программа или методика этим свойством не обладает. Демонстрацией спра­ведливости такой гипотезы было бы доказательство того, что ин­дивидуальный разброс оценок учащихся по одной программе или методике больше (или меньше), чем индивидуальный разброс оценок по другой программе или методике.

Критерий Фишера

Подобного рода задачи решаются, в частности, при помощи критерия Фишера. Его формула выглядит следующим образом:

где n1 количество значения признака в первой из сравнивае­мых выборок;

п2 — количество значений признака во второй из сравниваемых выборок;

(п 1 1, п2 1) — число степеней свобо­ды;

— дисперсия по первой выборке;

— дисперсия по вто­рой выборке.

 

Вычисленное с помощью этой формулы значение F-критерия сравнивается с табличным (табл. 34), и если оно превосхо­дит табличное для избранной вероятности допустимой ошибки и заданного числа степеней свободы, то делается вывод о том, что гипотеза о различиях в дисперсиях подтверждается. В про­тивоположном случае такая гипотеза отвергается и дисперсии считаются одинаковыми1.

Таблица 34

Граничные значения F-критерия для вероятности допустимой ошибки 0,05 и числа степеней свободы n1и n2

n2 n1                  
  9,28 9,91 9,01 8,94 8,84 8,74 8,69 8,64 8,58
  6,59 6,39 6,26 6,16 6,04 5,91 5,84 5,77 5,70
  5,41 5,19 5,05 4,95 4,82 4,68 4,60 4,58 4,44
  4,76 4,53 4,39 4,28 4,15 4,00 3,92 3,84 3,75
  4,07 3,84 3,69 3,58 3,44 3,28 3,20 3,12 3,03
  3,49 3,26 3,11 3,00 2,85 2,69 2,60 2,50 2,40
  3,24 3,0 2,85 2,74 2,59 2,42 2,33 2,24 2,13
  3,01 2,78 2,62 2,51 2,36 2,18 2,09 1,98 1,86
  2,79 2,56 2,40 2,29 2,13 1,95 1,85 1,74 1,60

1. Если отношение выборочных дисперсий в формуле F-критерия оказы­вается меньше единицы, то числитель и знаменатель в этой формуле меняют местами и вновь определяют значения критерия.

Примечание. Таблица для граничных значений F-распреде­ления приведена в сокращенном виде. Полностью ее можно найти в справочниках по математической статистике, в частности в тех, которые даны в списке дополнительной литературы представленной в Теме № 1..

Пример.

Сравним дисперсии следующих двух рядов цифр с целью определения статистически достоверных различий меж­ду ними.

Первый ряд: 4,6,5,7,3,4,5,6.

Второй ряд: 2,7,3,6,1,8,4,5.

Средние значения для двух этих рядов соответственно рав­ны: 5,0 и 4,5. Их дисперсии составляют: 1,5 и 5,25. Частное от деления большей дисперсии на меньшую равно 3,5. Это и есть искомый показатель F. Сравнивая его с табличным граничным значением 3,44, приходим к выводу о том, что дисперсии двух сопоставляемых выборок действительно отличаются друг от дру­га на уровне значимости более 95% или с вероятностью допусти­мой ошибки не более 0,05%.

 

МЕТОД КОРЕЛЛЯЦИЙ

 

Следующий метод вторичной статистической обработки, по­средством которого выясняется связь или прямая зависимость между двумя рядами экспериментальных данных, носит назва­ние метод корреляций. Он показывает, каким образом одно яв­ление влияет на другое или связано с ним в своей динамике. По­добного рода зависимости существуют, к примеру, между вели­чинами, находящимися в причинно-следственных связях друг с другом. Если выясняется, что два явления статистически досто­верно коррелируют друг с другом и если при этом есть уверен­ность в том, что одно из них может выступать в качестве причи­ны другого явления, то отсюда определенно следует вывод о на­личии между ними причинно-следственной зависимости.

 

Имеется несколько разновидностей данного метода:

*линей­ный,

*ранговый,

*парный и

*множественный.

Линейный корреля­ционный анализ позволяет устанавливать прямые связи между переменными величинами по их абсолютным значениям. Эти связи графически выражаются прямой линией, отсюда название «линейный».

Ранговая корреляция определяет зависимость не между абсолютными значениями переменных, а между поряд­ковыми местами, или рангами, занимаемыми ими в упорядочен­ном по величине ряду.

Парный корреляционный анализ вклю­чает изучение корреляционных зависимостей только между парами переменных, а множественный, или многомерный, — меж­ду многими переменными одновременно.

Распространенной в прикладной статистике формой многомерного корреляционно­го анализа является факторный анализ.

На рис. 74 в виде множества точек представлены различные виды зависимостей между двумя переменными X и У (различ­ные поля корреляций между ними).

На фрагменте рис. 74, отмеченном буквой А, точки случай­ным образом разбросаны по координатной плоскости. Здесь по величине X нельзя делать какие-либо определенные выводы о величине Y. Если в данном случае подсчитать коэффициент кор­реляции, то он будет равен 0, что свидетельствует о том, что до­стоверная связь между X и У отсутствует (она может отсутство­вать и тогда, когда коэффициент корреляции не равен 0, но бли­зок к нему по величине).

На фрагменте Б рисунка все точки ле­жат на одной прямой, и каждому отдельному значению перемен­ной X можно поставить в соответствие одно и только одно зна­чение переменной У, причем, чем больше X, тем больше У. Такая связь между переменными X и У называется прямой, и если это прямая, соответствующая уравнению регрессии, то связанный с ней коэффициент корреляции будет равен +1. (Заметим, что в жизни такие случаи практически не встречаются; коэффициент корреляции почти никогда не достигает величины единицы.)

На фрагменте В рисунка коэффициент корреляции также бу­дет равен единице, но с отрицательным знаком: -1. Это означает обратную зависимость между переменными X и У, т.е., чем боль­ше одна из них, тем меньше другая.

На фрагменте Г рисунка точки также разбросаны не случай­но, они имеют тенденцию группироваться в определенном на­правлении. Это направление приближенно может быть представ­лено уравнением прямой регрессии.

Такая же особенность, но с противоположным знаком, характерна для фрагмента Д. Соот­ветствующие этим двум фрагментам коэффициенты корреляции приблизительно будут равны +0,50 и -0,30. Заметим, что кру­тизна графика, или линии регрессии, не оказывает влияния на величину коэффициента корреляции.

 

Рис. 74. Схематическое представление различных корреляционных зависи­мостей с соответствующими значениями коэффициента линейной корреля­ции (цит. по: Иберла К. Факторный анализ. М,, 1980).

 

Наконец, фрагмент Е дает коэффициент корреляции, равный или близкий к 0, так как в данном случае связь между перемен­ными хотя и существует, но не является линейной.

Коэффициент линейной корреляции определяется при по­мощи следующей формулы:

где rxy коэффициент линейной корреляции;

х, у - средние выборочные значения сравниваемых величин;

хii частные выборочные значения сравниваемых величин;

п — общее число величин в сравниваемых рядах показателей;

дисперсии, отклонения сравниваемых величин от

средних значений.

Пример. Определим коэффициент линейной корреляции между следующими двумя рядами показателей.

Ряд 1: 2, 4, 4, 5, 3, б, 8.

Ряд II: 2, 5, 4, 6, 2, 5, 7.

Средние значения этих двух рядов соответственно равны 4,6 и 4,4.

Их дисперсии составляют следую­щие величины: 3,4 и 3,1. Подставив эти данные в приведенную выше формулу коэффициента линейной корреляции, получим следующий результат: 0,92. Следовательно, между рядами дан­ных существует значимая связь, причем довольно явно выражен­ная, так как коэффициент корреляции близок к единице. Дейст­вительно, взглянув на эти ряды цифр, мы обнаруживаем, что большей цифре в одном ряду соответствует большая цифра в дру­гом ряду и, наоборот, меньшей цифре в одном ряду соответству­ет примерно такая же малая цифра в другом ряду.

К коэффициенту ранговой корреляции в психолого-педаго­гических исследованиях обращаются в том случае, когда при­знаки, между которыми устанавливается зависимость, являют­ся качественно различными и не могут быть достаточно точно оценены при помощи так называемой интервальной измеритель­ной шкалы.

Интервальной называют такую шкалу, которая по­зволяет оценивать расстояния между ее значениями и судить о том, какое из них больше и насколько больше другого.

Напри­мер, линейка, с помощью которой оцениваются и сравниваются длины объектов, является интервальной шкалой, так как, поль­зуясь ею, мы можем утверждать, что расстояние между двумя и шестью сантиметрами в два раза больше, чем расстояние между шестью и восемью сантиметрами. Если же, пользуясь некоторым измерительным инструментом, мы можем только утверждать, что одни показатели больше других, но не в состоянии сказать на сколько, то такой измерительный инструмент называется не ин­тервальным, а порядковым.

Большинство показателей, которые получают в психолого-педагогических исследованиях, относятся к порядковым, а не к интервальным шкалам (например, оценки типа «да», «нет», «ско­рее нет, чем да» и другие, которые можно переводить в баллы), поэтому коэффициент линейной корреляции к ним неприменим. В этом случае обращаются к использованию коэффициента ран­говой корреляции, формула которого следующая:

 

где Rs — коэффициент ранговой корреляции по Спирмену;

di разница между рангами показателей одних и тех же ис­пытуемых в упорядоченных рядах;

п — число испытуемых или цифровых данных (рангов) в кор­релируемых рядах.

Пример. Допустим, что экспериментатора интере­сует, влияет ли интерес учащихся к учебному предмету на их успеваемость. Предположим, что с помощью некоторой психо­диагностической методики удалось измерить величину интере­са к учению и выразить его для десяти учащихся в следующих цифрах: 5, 6, 7, 8, 2, 4, 8, 7, 2, 9. Допустим также, что при помощи другой методики были определены средние оценки этих же уча­щихся по данному предмету, оказавшиеся соответственно рав­ными: 3,2; 4,0; 4,1; 4,2; 2,5; 5,0; 3,0; 4,8; 4,6; 2,4.

Упорядочим оба ряда оценок по величине цифр и припишем каждому из учащихся по два ранга; один из них указывает на то, какое место среди остальных данных ученик занимает по успе­ваемости, а другой — на то, какое место среди них же он занима­ет по интересу к учебному предмету. Ниже приведены ряды цифр, два из которых (первый и третий) представляют исходные данные, а два других (второй и четвертый) — соответствующие ранги1:

2-1,5 2,4-1
2-1,5 2,5-2
4-3 3,0-3
5-4 3,2-4
6-5 4,0-5
7-6,5 4,1-6
7-6,5 4,2-7
8-8,5 4,6-8
9-10 5,0-10

Определив сумму квадратов различий в рангах (∑d2i) и под­ставив нужное значение в числитель формулы, получаем, что ко­эффициент ранговой корреляции равен 0,97, т.е. достаточно вы­сок, что и говорит о том, что между интересом к учебному пред­мету и успеваемостью учащихся действительно существует ста­тистически достоверная зависимость.

Однако по абсолютным значениям коэффициентов корреля­ции не всегда можно делать однозначные выводы о том, являют­ся ли они значимыми, т.е. достоверно свидетельствуют о суще­ствовании зависимости между сравниваемыми переменными. Может случиться так, что коэффициент корреляции, равный 0,50, не будет достоверным, а коэффициент корреляции, составивший 0,30, — достоверным. Многое в решении этого вопроса зависит от того, сколько показателей было в коррелируемых друг с дру­гом рядах признаков: чем больше таких показателей, тем мень­шим по величине может быть статистически достоверный коэф­фициент корреляции.

В табл. 35 представлены критические значения коэффици­ентов корреляции для различных степеней свободы.

1 Если исходные данные, которые ранжируются, одинаковы, то и их ранги также будут одинаковыми. Они получаются путем суммирования и деления пополам тех рангов, которые соответствуют этим данным.

Таблица 35



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 427; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.157.186 (0.032 с.)