Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Корреляционное поле сильной линейной обратной связи

Поиск

В случае линейной зависимости у от х уравнением регрессии является уравнение прямой у = а + bх, где у — значение результативного признака (зависимая переменная), х — значения факторного признака (независимая переменная), а и b — коэффициенты

Простейшим примером линейного уравнения регрессии может служить индекс Брока, который используется как росто-весовой индекс для исчисления нормального веса: из роста вычитают 100 и получают нормальный вес, соответствующий этому росту. Математически этот индекс записывается в виде уже приводившегося уравнения линейной регрессии у=а+bх, где у — вес, х — рост, а=–100, b — поправочный коэффициент, который изменяется для разных возрастных групп.

Иногда при измерении расстояний на местности прибегают к счету шагами. Длина шага человека описывается уравнением регрессии L=37 + h/4, где h — рост человека в см, L — длина его шага.

Полная оценка взаимосвязи признаков требует нахождения уравнения регрессии не только для зависимости у от х, но и для зависимости х от у. В силу вероятностного характера статистических взаимосвязей результаты вычислений по этим уравнениям не будут зеркально похожими. Поскольку методика и порядок вычислений в обоих случаях во многом аналогичны, ограничимся рассмотрением основ обработки уравнения у = а + bх (зависимость у от х).

В уравнении у = а + bх коэффициент b равен тангенсу угла наклона линии регрессии. Этот коэффициент, называемый «коэффициент регрессии», имеет большой статистический смысл. Он показывает, насколько изменяется значение одной величины (зависимой, результативной переменной) при изменении второй (независимой, факторной) на единицу. Например: при увеличении температуры тела человека на 1°С, частота пульса увеличивается в среднем на 10 ударов в минуту.

Статистический анализ подразумевает решение уравнения регрессии, т. е. отыскание параметров этого уравнения на основе исходных данных. Математически решение уравнения линейной регрессии сводится к вычислению параметров а и b таким образом, чтобы точки исходных данных корреляционного поля как можно ближе лежали к прямой регрессии. Для этого вычисляют параметры по формулам, которые обеспечивают наименьший квадрат отклонений этих точек от линии регрессии (метод наименьших квадратов):

и

Пример: Найти выборочное уравнение регрессии по данным пяти наблюдений (л=5) зависимой и независимой переменных У и Х.

 

Расчетная таблица параметров уравнения регрессии
i   Xi   Yi   Xi2   XiYi
    2,0   2,6   4,0   5,2
    4,0   1,8   16,0   7,2
    7,0   1,3   49,0   9,1
    5,0   1.1   25,0   5,5
    3,0   2,4   9,0   7,2
X   21,0   9,2   103,0   34,2

 

Согласно уравнению параметр

 

параметр

Искомое уравнение регрессии y=3.1+(–0.3)х. Коэффициент регрессии, соответственно, равен –0,3. Т. е. при изменении независимой переменной (х) на 1, зависимая переменная (у) будет уменьшаться в среднем на 0,3.

Насколько близки расчетные и фактические данные по зависимому фактору у, демонстрирует таблица, где Ypac первого наблюдения (i=1) Y1=3,1+(–0,3)х2,0=2,5 и т. д. Нетрудно заметить, что между фактическими и расчетными значениями (Ypac и Yi) существует определенная разница. Эта разница может объясняться малым числом наблюдений и точностью самого метода.

Разность фактического (Yi)и вычисленного (Ypac) параметров

i Xi Yi Ypac Yi – Ypac
  2.0 2.6 2.5 0.1
  4.0 1.8 1.9 –0.1
  7.0 1.3 1.0 0.3
  5.0 1.1 1.6 –0.5
  3.0 2.4 2.2 0.2

 

Параметры уравнения регрессии, как и любые выборочные статистические характеристики, оцениваются в определенных интервалах. В том случае, если уравнение регрессии имеет вид у=а+bх, выборочные значения коэффициентов а и b являются оценкой соответствующих генеральных коэффициентов и отличаются от них в среднем на величину соответствующих им ошибок. Ошибка коэффициента

, где σх — среднеквадратическое (стандартное) отклонение по ряду х, n — число наблюдений.

Ошибка коэффициента b характеризует разброс значений угла наклона линии регрессии. Полная ошибка для результатов отдельных измерений у:

Рассмотренный пример касается так называемой двухмерной зависимости. В этом случае рассматривается вариант, при котором взаимодействуют два признака — зависимый (результативный) и независимый (факторный). В реальной ситуации чаще приходится сталкиваться с многофакторными зависимостями. Соответственно, если рассматривается большее число независимых признаков, то расчеты проводятся по другим формулам, с учетом трехмерного, четырехмерного и т. п. пространства распределения. С математической точки зрения, число пространственных распределений, в принципе, не ограничено.

Обязательным условием такого подхода является независящее друг от друга распределение факторных признаков.

В общем виде формула для расчета коэффициента множест­венной регрессии для результативного показателя:

Y=β0+ β1X1+ β2X2+…+βnXn,

где β0, β1, β2… βn — коэффициенты регрессии. Например: должные (стандартные) величины показателей ЖЕЛ — жизненной емко­сти легких вычисляются для мужчин в воз­расте 18-25 лет по уравнению регрессии Y=β0+ β1X1+ β2X2где β0 — константа, равная – 6,908, β1 — коэффициент по росту, рав­ный 5,8, β2 — коэффициент по возрасту 0,085. С помощью этого уравнения, опираясь на фактические данные о конкретном че­ловеке, путем несложных вычислений можно определить дол­жную (стандартную) величину ЖЕЛ этого человека. Так, для мужчины в возрасте 19 лет, имеющему рост 1,8 метра, должная ЖЕЛ = –6,908 + 5,8 х 1,8 + 0,085 х 19 = 5,2. С точки зрения клиниче­ской практики, снижение фактической ЖЕЛ по сравнению с должной ЖЕЛ может говорить о рестриктивных нарушениях вентиляционной способности легких, являющихся следствием нарушения процесса расправления легких при вдохе.

Относительная простота применения уравнений регрессии обеспечила их большое распространение: для нахождения дол­жных величин при оценке различных физиологических парамет­ров, в гигиенических исследованиях для прогнозирования резу­льтатов воздействия различных факторов окружающей среды и т. п. Вместе с тем, получение точных исходных параметров урав­нений регрессии требует большой и кропотливой работы.

Одной из причин, снижающих точность параметров уравне­ния регрессии, является несоответствие теоретического распре­деления, взятого за основу расчетов, и фактического распределе­ния точек корреляционного поля. Например, линия регрессии может представлять собой не прямую, а какую-либо кривую. Со­ответственно, форма уравнения регрессии должна соответство­вать криволинейной зависимости.

Различные линии регрессии

Криволинейная зависимость может принимать различное математическое выражение в виде парабол 2-го и 3-го порядка. Например: для того чтобы найти параметры a, b и с в уравнении параболы второго порядка, нужно решить систему уравнений:

И найти следующие промежуточные величины:

В целом, вычисление и практическое использование этих параметров аналогичны операциям с параметрами прямой линии регрессии. Однако, в связи с громоздкостью расчетов, рекомендуется их находить с помощью специальных программ статистической обработки данных.

Метод группировок и построение статистических таблиц, а также регрессионный анализ позволяют установить наличие или отсутствие связи между факторными и результативными признаками, описать обнаруженные связи и определить некоторые количественные характеристики. Различные коэффициенты корреляции позволяют выявить форму и силу (плотность, тесноту) этой связи.

 

 


Литература

1. Буштуева К.А., Случанко И.С. Метотды и критерии оценки состояния здоровья населения в связи с загрязнением окружающей среды. М. Медицина, 1979

2. Зайцев В.М., Лифляндский В.Г., Маринкин В.И. Прикладная медицинская статистика. СПб, 2003

3. Кучеренко В.З. Применение методов статистического анализа для изучения общественного здоровья и здравоохранения. – М., 2004

4. Лисицын Ю.П. Общественное здоровье и здравоохранение. М., 2002

5. Миняев В.А., Вишнякова Н.И. Общественное здоровье и здравоохранение. М., 2002

6. Серенко Л.Ф., Ермакова В.В. Социальная гигиена и организация здравоохранения., М. 1984

7. Юрьев В.К. Куценко Г.И. Общественное здоровье и здравоохранение СПб. 2000

 


О Г Л А В Л Е Н И Е

 

Раздел 1. Введение. Определение статистики. Разделы медицинской статистики, задачи  
Раздел 2. Основные понятия в статистике  
  2.1. Статистическая совокупность  
  2.2. Единица наблюдения и учетные признаки  
  2.3. Виды статистической совокупности  
  2.4. Понятие о репрезентативности  
  2.4.1. Способы формирования выборочной совокупности  
  2.4.2. Необходимая численность выборки  
Раздел 3. Организация статистического исследования  
  3.1. I этап  
  3.1.1. Цель и задачи исследования  
  3.1.2. Программа сбора материала  
  3.1.3. Программа разработки полученных данных  
  3.1.3.1. Виды статистических таблиц  
  3.1.3.2. Виды статистического наблюдения  
  3.2. II этап  
  3.3. III этап  
  3.4. IV этап  
  3.4.1. Виды графических изображений  
  3.5. V этап  
  3.6. Контрольные вопросы к разделам 1, 2, 3  
Раздел 4. Относительные величины  
  4.1. Экстенсивные показатели  
  4.2. Интенсивные показатели  
  4.3. Показатели соотношения  
  4.4. Показатели наглядности  
  4.5. Динамические ряды  
  4.5.1. Типы динамических рядов  
  4.5.2. Выравнивание уровней динамических рядов  
  4.5.2.1. Укрупнение интервалов  
  4.5.2.2. Вычисление групповой средней  
  4.5.2.3. Расчет скользящей средней  
  4.5.3. Показатели динамического ряда  
  4.6. Задача – эталон  
  4.7. Контрольные вопросы  
  4.8. Задачи для самостоятельного решения  
Раздел 5. Средние величины  
  5.1. Вариационный ряд и методика его составления  
  5.2. Виды средних величин, методика их вычисления  
  5.3.Методы оценки разнообразия признака в статистической совокупности  
  5.3.1. Критерии, характеризующие границы совокупности (лимит, амплитуда)  
  5.3.2. Критерии характеризующие внутреннюю структуру совокупности  
  5.3.2.1. Расчет среднеквадратического отклонения  
  5.3.2.2. Расчет коэффициента вариации  
  5.4. Контрольные вопросы  
  5.5. Задачи для самостоятельного решения  
Раздел 6. Статистическая оценка достоверности результатов.  
  6.1. Определение ошибки репрезентативности  
  6.2. Определение доверительных границ генеральной совокупности  
  6.3. Оценка достоверности разности результатов исследования  
  6.4 Оценка достоверности различия сравниваемых групп по критерию соответствия (хи-квадрат)  
  6.5. Типичные ошибки, допускаемые при применении методов оценки достоверности результатов исследования  
  6.6. Задачи – эталоны  
  6.7. Контрольные вопросы  
  6.8. Задачи для самостоятельного решения  
Раздел 7. Дисперслонный анализ.    
Раздел 8. Методы стандартизации.    
  8.1. Прямой метод стандартизации  
  8.2. Косвенный метод стандартизации  
  8.3. Обратный метод стандартизации  
  8.4. Контрольные вопросы  
  8.5. Задачи для самостоятельного решения  
Раздел 9. Корреляционный анализ.  
  9.1. Вычисление корреляционной зависимости методом квадратов  
  9.2. Вычисление корреляционной зависимости методом рангов  
  9.3. Контрольные вопросы  
  9.4. Задачи для самостоятельного решения    
Раздел 10 Регрессионный анализ    
  Литература  
  Оглавление  

.

 

 



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 490; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.58.90 (0.01 с.)