Типы статистических шкал (или типы переменных) 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Типы статистических шкал (или типы переменных)



Переменные различаются между собой тем, «насколько хорошо» они могут быть измерены или, другими словами, как много измеряемой информации обеспечивает шкала их измерений. Известно, что в каждом измерении присутствует некоторая ошибка, определяющая границы «количества информации», которое можно получить в данном измерении. Тип шкалы, в которой проведено измерение, является еще одним фактором, определяющим количество информации, содержащейся в переменной. Различают следующие типы шкал: номинальная, порядковая (ординальная), интервальная относительная (шкала отношения). Соответственно мы имеем четыре типа переменных.

Шкала наименований (номинальная шкала) фактически не связана с понятием «величина» и используется только для качественной классификации с целью отличить один объект от другого: номер животного в группе или присвоенный ему уникальный шифр и т.п. Данные переменные могут быть измерены только как принадлежность к некоторым, существенно различным классам; при этом вы не сможете упорядочить эти классы. Например, индивидуумы принадлежат к разным национальностям. Типичные примеры номинальных переменных - пол, национальность, цвет, город и т.д. Часто номинальные переменные называют категориальными. Категориальные переменные часто представляют в виде частот наблюдений, попавших в определенные категории и классы. Если классов всего два, то переменная будет называться дихотомической. Например, при исследовании выборки было установлено, что к первой категории Пол женский отнесено 30 испытуемых с повышенным АД, а ко второй категории Пол мужской отнесено 25 испытуемых с повышенным АД. Возможности обработки переменных, относящихся к номинальной шкале, очень ограничены. Собственно говоря, можно провести только частотный анализ таких переменных. К примеру, расчет среднего значения для переменной Пол, совершенно бессмыслен.

Порядковая шкала (шкала рангов) – шкала, относительно значений которой нельзя говорить ни о том, во сколько раз измеряемая величина больше (меньше) другой, ни на сколько она больше (меньше). Такая шкала только упорядочивает объекты, приписывая им те или иные баллы (результатом измерений является нестрогое упорядочение объектов). При этом указывается, какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. Однако они не позволяют сказать «на сколько больше» или «на сколько меньше». Порядковые переменные иногда также называют ординальными. Номера домов на улице измерены в порядковой шкале. Типичный пример порядковой переменной - социоэкономический статус семьи. Для размера одежды используют следующую порядковую шкалу: S, M, L, XL,XXL, XXXL, XXXXL. Шкала твердости минералов Мооса также является порядковой. Аналогично построены шкалы силы ветра Бофорта и землетрясений Рихтера. Шкалы порядка широко используются в педагогике, психологии, медицине и других науках, не столь точных, как, скажем, физика и химия. В частности, повсеместно распространенная шкала школьных отметок в баллах (пятибалльная, двенадцати балльная и т.д.) может быть отнесена к шкале порядка. В медико-биологических исследованиях шкалы порядка встречаются сплошь и рядом и подчас весьма искусно замаскированы. Например, для анализа свертывания крови используется тромботест: 0 – отсутствие свертывания в течение времени теста, 1 –«слабые нити», 2 – желеподобный сгусток, 3 – сгусток, легко деформируемый, 4 – плотный, упругий, 5 – плотный, занимающий весь объем и т.п. Понятно, что интервалы между этими плохо отличимыми и очень субъективными позициями произвольны. В этом случае сравнивать средние значения в двух выборках не имеет смысла!! Масса подобных шкал все еще встречается в экспериментальной токсикологии, экспериментальной хирургии, экспериментальной морфологии. Порядковыми шкалами в медицине являются шкала стадий гипертонической болезни (по Мясникову), шкала степеней сердечной недостаточности (по Стражеско-Василенко-Лангу), шкала степени выраженности коронарной недостаточности (по Фогельсону), и т.д. Все эти шкалы построены по схеме: заболевание не обнаружено; первая стадия заболевания; вторая стадия; третья стадия. Каждая стадия имеет свойственную только ей медицинскую характеристику. При описании групп инвалидности числа используются в противоположном порядке: самая тяжелая - первая группа инвалидности, затем - вторая, самая легкая - третья. Кроме частотного анализа, переменные с порядковой шкалой допускают также вычисление определенных статистических характеристик, таких как медианы. В некоторых случаях возможно вычисление среднего значения. Для сравнения различных выборок переменных, относящихся к порядковой шкале, могут применяться непараметрические тесты, формулы которых оперируют рангами.

Интервальные переменные позволяют не только упорядочивать объекты измерения, но и численно выразить и сравнить различия между ними. Например, температура, измеренная в градусах Фаренгейта или Цельсия, образует интервальную шкалу. Шкала Цельсия, как известно, была установлена следующим образом: за ноль была принята точка замерзания воды, за 100 градусов – точка ее кипения, и, соответственно, интервал температур между замерзанием и кипением воды поделен на 100 равных частей. Здесь утверждение, что температура 40°С в два раза больше, чем 20°С, будет неверным. В шкале интервалов сохраняется отношение длин интервалов. Вы можете не только сказать, что температура 40°С выше, чем температура 30°С, но и что увеличение температуры с 20°С до 40 градусов вдвое больше увеличения температуры от 30 до 40 градусов. Такие переменные могут обрабатываться любыми статистическими методами без ограничений. Так, к примеру, среднее значение является полноценным статистическим показателем для характеристики таких переменных.

Шкалами отношений измеряются почти все физические величины – время, линейные размеры, площади, объемы, сила тока, мощность и т.д. Это самая мощная шкала. К этой шкале относятся все интервальные переменные, которые имеют абсолютную нулевую точку. В медико-биологических исследованиях шкала отношений будет иметь место, например, когда измеряется время появления того или иного признака после начало воздействия (порог времени, в секундах, минутах), интенсивность воздействия до появления какого-либо признака (порог силы воздействия в вольтах, рентгенах и т.п.). Естественно, к шкале отношений относятся все данные в биохимических и электрофизиологических исследованиях (концентрации веществ, вольтажи, временные показатели электрокардиограммы и т.п.). Сюда же, например, относятся и количество правильно или неправильно выполненных «заданий» в различных тестах по изучению высшей нервной деятельности у животных. Например, температура по Кельвину образует шкалу отношения, и при этом можно утверждать, что температура 200 градусов не только выше, чем 100 градусов, но при этом она вдвое выше. Интервальные шкалы (например, шкала Цельсия) не обладают данным свойством шкалы отношения. Заметим, что в большинстве статистических процедур не делается различия между свойствами интервальных шкал и шкал отношения. Для двух последних шкал возможно вычисление таких числовых показателей, как среднее значение, стандартное отклонение.

Рассмотрим еще несколько конкретных примера переменных в эмпирическом исследовании. Пусть они кодируются следующим образом:

Таблица 1.1

Типы шкал

Тип шкалы    
Номинальная Пол   1 - мужской 2 - женский  
Номинальная Семейное положение 1 -холост/не замужем 2 - женат/замужем 3 - вдовец/вдова 4 - разведен(а)  
Порядковая Курение 1-некурящий 2 - редко курящий 3 - интенсивно курящий 4 - очень интенсивно курящий  
Порядковая Месячный доход 1 - до 5000 руб 2 - 5001 - 8000 руб 3 - более 8000 руб  
Интервальная Коэффициент интеллекта (IQ)   80, 120, 160
Шкала отношений Возраст, лет   30, 60

Мы видим, что кодирование переменной пол с помощью цифр 1 и 2 абсолютно произвольно, их можно было поменять местами или обозначить другими цифрами. Это не значит, что женщины стоят на ступеньку ниже мужчин. В этом случае говорят о переменных, относящихся к номинальной шкале. Такая же ситуация и с переменной семейное положение. Здесь также соответствие между числами и категориями семейного положения не имеет никакого эмпирического значения. Но в отличии от пола, эта переменная не является дихотомической - у нее четыре кодовых цифры вместо двух.

Переменная курение отсортирована в порядке значимости снизу вверх: умеренный курильщик курит больше, нежели некурящий, а сильно курящий - больше, чем умеренный курильщик и т.д. Эти переменные относятся к порядковой шкале. Однако эмпирическая значимость этих переменных не зависит от разницы между соседними численными значениями. Так, несмотря на то, что разница между значениями кодовых чисел для некурящего, редко курящего и интенсивно курящего в обоих случаях равна единице, нельзя утверждать, что фактическое различие между некурящим, изредка курящим и интенсивно курящим одинаково. Для этого данные понятия слишком расплывчаты. Классическими примерами переменных с порядковой шкалой являются также переменные, полученные в результате объединения величин в классы, такие, как месячный доход в нашем примере.

Рассмотрим теперь коэффициент интеллекта (IQ). И его абсолютные значения отображают порядковое отношение между респондентами, и разница между двумя значениями также имеет эмпирическую значимость. Например, если у Федора IQ равен 80, у Петра – 120 и у Ивана – 160, можно сказать, что Петр в сравнении с Федором настолько же интеллектуальнее насколько Иван в сравнении с Петром (а именно – на 40 единиц IQ). Однако, основываясь только на том, что значение IQ у Федора в два раза меньше, чем у Ивана, нельзя сделать вывод, что Иван вдвое умнее Федора. Такие переменные относятся к интервальной шкале.

Наивысшей статистической шкалой, на которой эмпирическую значимость приобретает и отношение двух значений, является шкала отношений. Примером переменной, относящейся к такой шкале, является возраст: если Андрею 30 лет, а Алексею 60, можно сказать, что Алексей вдвое старше Андрея. Шкалой отношений является температурная шкала Кельвина с абсолютным нулём температур.

На практике, в том числе при обработке данных в пакете Statistica, различие между переменными, относящимися к интервальной шкале и шкале отношений обычно несущественно.

От более богатой или мощной шкалы всегда можно перейти к более бедной. Так, непрерывные переменные можно категоризировать. Например, непрерывную случайную величину (СВ) Рост можно из шкалы отношений перевести в порядковую шкалу с градациями: низкий, средний, высокий.

Допустим, весь диапазон изменения интервальной переменной был разделен на область высоких, средних и низких значений и каждое наблюдение было отнесено к одной из трех категорий. Это означает, что явление, которое вначале описывалось в интервальной шкале, может быть описано также и в шкале наименований, а, следовательно, можно использовать для анализа этого явления все те статистические методы, которые требуют использования переменных в шкале наименований. Но надо учитывать, что при переходе к шкале наименований от шкал более высокого порядка, мы теряем часть информации о наблюдениях. Наблюдения, которые отличались друг от друга при описании их в интервальной шкале, могут восприниматься как одинаковые при описании их в шкале наименований. Поэтому рекомендуется применять шкалу наименований лишь тогда, когда нет возможности использовать шкалу более высокого порядка.



Поделиться:


Последнее изменение этой страницы: 2016-04-08; просмотров: 8547; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.143.218.146 (0.008 с.)