Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Коэффициент корреляции Пирсона
Если переменные «х» и «у» измерены в числовых шкалах в качестве меры связи между ними выступает коэффициент корреляции Пирсона (rxy). Обычно коэффициент корреляции Пирсона называют выборочным коэффициентом корреляции или просто коэффициентом корреляции. Данный коэффициент измеряет только степень прямолинейной связи и направление связи. Криволинейную (нелинейную) связь данный коэффициент не измеряет. Рабочая формула для вычисления коэффициента корреляции: В числителе – ковариация – разность между суммой произведений «х» на «у» и произведением сумм по «х» и «у», деленная на объем выборки. В знаменателе – корень квадратный из произведения SSx на SSy. Коэффициент корреляции варьирует от - 1 до + 1. Эти два предела варьирования представляют собой функциональные связи: обратную (r = - 1) и прямую (r = 1). при приближении к нулю связь уменьшается, при r = 0 связь полностью отсутствует. В дополнении к коэффициенту корреляции часто вычисляют коэффициент детерминации (D), который представляет собой квадрат коэффициента корреляции: Коэффициент детерминации показывает долю изменчивости переменных, которая детерминируется корреляцией между ними. Значение r = 0,7 является пороговым, ниже которого связь считается слабой или средней, но выше – сильной. Пример 4. Получены данные о длине листовой пластинки («х», мм) и диаметре штамба («у», см) у 31 сеянца алычи (табл. 5.12.): Таблица 5.12. Длина листовой пластинки «х», мм и диаметр штамба «у», см у 31 сеянца алычи
Необходимо вычислить коэффициент корреляции между длиной листовой пластинки и диаметром штамба. Решение: 1. Копируем исходные данные в табличный редактор Excel. Транспонируем таблицу. Формируем два столбца: для признаков «х» и «у». 2. Строим точечную корреляционную решетку, задаем нужный формат осям абсцисс и ординат, добавляем линию тренда. Рис 6.4. Точечная корреляционная решетка и тренд распределения 31 сеянца алычи по длине листовой пластинки (х) и диаметру штамба (у)
Исходя из распределения точек на корреляционной решетке, следует вывод о том, что связь между признаками, несомненно, имеется, прямая, средней степени. Вычисляем компоненты формулы коэффициента корреляции: Σ xiyi = 7868,663 Σ xi = 1843,8 Σ yi = 131,82 Σ x 2 i = 110851,4 Σ y 2 i = 562,6978 3. Вычислим коэффициент корреляции: 4. Вычислим коэффициент детерминации: 0,562=0,31 5. Вывод: корреляция между длиной листовой пластинки и диаметром штамба прямая, ниже средней степени. Достаточный объём выборки для оценки достоверности коэффициента корреляции Пирсона. Достаточная численность выборки (N) при изучении коэффициента корреляции представляет собой число пар значений переменных (признаков) у объектов. Для её расчета необходимо коэффициент корреляции «r» преобразовать в величину «z». Преобразование «r» в «z» можно также осуществлять по специальной статистической таблице (приложение 2.8) или вручную. Достаточная численность выборки определяется по формуле: где: z – преобразованная величина «r»; tst – критерий Стьюдента t 05 или t 01. Пример 5. Планируется определить достаточный объём выборки (число пар значений признаков у различных сортов абрикоса) для оценки достоверности коэффициента корреляции «r» между признаками «диаметр плода, мм» и «масса плода, г. Единицами выборки будут выступать различные сорта абрикоса. У каждого сорта будут определяться две средние арифметические: 1) по диаметру плода (мм); 2) по массе плода (г). Для этого по каждому сорту отбирается репрезентативная выборка, например, по 10-15 плодов, и у каждого плода измеряются 2 параметра «диаметр плода, мм» и «масса плода, г. После этого вычисляются по каждому сорту пара средних арифметических. Совокупность этих пар у разных сортов абрикоса и является исходными данными для вычисления коэффициента корреляции. Достоверность коэффициента корреляции во многом зависит от объема выборки. В малых выборках достоверность корреляции, как правило, трудно доказать. В больших выборках достоверность корреляции доказать значительно проще. Для доказательства достоверности используют преобразование «r» в показатель «z».
Зададим необходимые для вычислений параметры. Основным параметром является величина коэффициента корреляции «r». Предположим, различные степени связи: от слабой до сильной. Зададим следующие 5 величин «r»: 0,10; 0,30; 0,50; 0,70; 0,90. Рабочая гипотеза состоит в том, что связь между диаметром и массой плода сильная и близка к функциональной. Однако, для исследования зависимости достаточного объема выборки от величины коэффициента корреляции проанализируем все 5 значений коэффициента корреляции. Вначале проведем z -преобразование: Преобразование коэффициентов корреляции Пирсона «r» в показатели «z»
Зададим величину t -критерия: t 01=2,58 и вычислим достаточную численность пар значений признаков у различных сортов абрикоса (N) при различных «z»: На основе сравнительного анализа достаточных объемов выборок можно утверждать следующее: 1) для доказательства достоверности слабых связей ( r <<0,3) необходимы очень большие по объему выборки: N около 700 и более; 2) для связей средней величины (r = 0,3-0,6) N варьирует от 25 до 75 пар значений признаков; 3) для сильных связей (r >0,7) N варьирует от 6 до 12 пар значений признаков, то есть, выборки могут быть очень малыми. Определим достоверность коэффициентов корреляции путем сравнения t 01 =2,58 с величиной . Если t 01 > нулевая гипотеза принимается, связь недостоверная. Если t 01 < нулевая гипотеза отвергается, связь достоверная: Таблица 5.14. Достаточные объемы выборок (N) при различных величинах коэффициента корреляции (t 01=2,58)
Таким образом, для доказательства достоверности очень слабой корреляции (r = 0,10 и менее) необходимы выборки, включающие более 670 пар значений признаков. Для доказательства достоверности всех остальных корреляций (r >0,1) допустимы достаточные объемы от 6 до 73 пар значений признаков. Практическое задание 6.4. У 20 плодов яблони сорта «Айдаред» были измерены масса плода «х» (г) и диаметр плода «у» (мм). Постройте точечную корреляционную решетку, вычислите коэффициент корреляции Пирсона, коэффициент детерминации.
Решение: Работа сдана «____» ______________ 20__ г. ____________________________________ (подпись студента, электронная
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Последнее изменение этой страницы: 2021-05-12; просмотров: 72; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.188.255.116 (0.009 с.) |