Типы шкал измерения переменных 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Типы шкал измерения переменных



Для работы с данными в SPSS важно знать, по шкале какого типа измеряются исследуемые переменные. Это необходимо для выбора метода анализа данных и определения возможности расчета статистических показателей (табл. 2.3).

Существует четыре типа шкал измерения переменных:

Номинальная шкала.

Порядковая шкала.

Интервальная шкала.

Примеры переменных, измеряемых по шкалам разных типов

Относительная шкала.

Таблица 2.3
Шкала Переменная Значения переменной
Номинальная Пол (дихотомическая переменная) • «1» = мужской • «2» = женский
Производитель продукта «X» • «1» = производитель А • «2» производитель В • «3» производитель С
Порядковая Класс полета • «1» = первый класс • «2» = бизнес-класс • «3» =эконом-класс
Категории потребителей по уровню дохода • «1» = до 1000 евро • «2» = от 1001 до 3000 евро • «3» = свыше 3000 евро
Интервальная Коэффициент интеллекта (IQ) ...«120»...
Относительная Уровень дохода ... «2100» евро...

 

Номинальная шкала характеризуется самым низким уровнем измерения переменных. Все значения переменной, измеряемой по номинальной шкале, находятся на одном уровне. По этой шкале измеряются, как правило, качественные характеристики объекта исследования. Между значениями переменной, измеряемой по номинальной шкале, не существует логического порядка. Например, в качестве ответа на вопрос анкеты: «Какого производителя продукта «X» вы предпочитаете?» — может быть предложено несколько вариантов: «Производитель А», «Производитель В», «Производитель С» и т.д. В этом случае, с точки зрения исследователей, все предложенные производители являются равнозначными. Числовые коды («1», «2», «3»...) могут присваиваться значениям метки переменной в любом порядке.

Переменные, измеряемые по номинальной шкале и имеющие всего два значения (например, «мужчины» и «женщины»), называются дихотомическими.

Порядковая шкала является второй по уровню измерения переменных. Значения переменной, измеряемой по порядковой шкале, не являются равнозначными, они находятся на равных уровнях по отношению друг к другу и подчиняются логическому числовому порядку.

Порядковая шкала характеризуется низким уровнем измерения переменных, поскольку является шкалой с неравными интервальными отрезками. Совершенно четко можно утверждать, что уровень обслуживания авиапассажиров первого класса выше, чем бизнес-класса, но насколько именно, неизвестно. Также разница в обслуживании между первым и бизнес-клас- сом, между бизнес- и эконом-классом может быть различной (см. табл. 2.3).

Низкий уровень измерения переменных по порядковой шкале можно проиллюстрировать на примере переменной «Категории потребителей по уровню дохода». Потребители примерно с одинаковым уровнем дохода (например, 950 и 1050 евро) оказываются в разных категориях, а потребители с существенной разницей по уровню дохода (например, 1050 и 2950 евро) оказываются в одной категории.

Интервальная шкала является третьей по уровню измерения переменных. В отличие от порядковой шкалы она является шкалой с равными интервальными отрезками. Это позволяет осуществлять количественное сравнение значений переменной, т.е. можно определить, насколько одно значение больше или меньше (лучше или хуже, длиннее или короче и т.д.) другого.

Характерной чертой интервальной шкалы является отсутствие «естественного нуля», т.е. исходная точка измерения является относительной. Примерами интервальной шкалы являются шкала Цельсия и календарь. По шкале Цельсия за «0» принята температура замерзания воды, однако за «0» можно было принять любую другую температуру. Существуют также различные календари с одинаковым количеством дней в году, но разным временем начала года.

В маркетинговых исследованиях очень часто используется рейтинговая шкала, когда респондентам предлагается оценить по балльной шкале (например, от 1 до 7 баллов) утверждение, продукт, бренд и т.п. Строго говоря, рейтинговая шкала является порядковой, поскольку балльные оценки субъективны. Одинаковые балльные оценки в действительности отображают разный уровень измеряемой переменной. Например, студенты, получившие одинаковые оценки на экзамене, в действительности могут иметь разный уровень знаний.

Очень часто при проведении исследований шкала бапльных оценок рассматривается как интервальная. В основе этого лежит предположение, что интервальные отрезки шкалы балльных оценок одинаковы. Это дает возможность рассчитать соеднее значение переменной (например, средний балл успеваемости студентов). Расчет средней величины (среднеарифметической) для показателя, измеряемого по порядковой шкале, невозможен. Например, не существует показателя «средний класс» полета (см. табл. 2.3).

Относительная шкала характеризуется самым высоким уровнем измерения переменных. Ее основное отличие от интервальной шкалы заключается в существовании «естественного нуля», который можно интерпретировать как отсутствие значения переменной. Например, если заработная плата равна нулю, это значит, что ее не выплачивают.

По относительной шкале измеряются количественные характеристики. Это могут быть как физические характеристики (объем, вес, скорость и пр.), так и экономические характеристики (доход, издержки, цена и пр.).

Относительная шкала получила свое название благодаря возможности сравнения значений переменной по отношению друг к другу, что невозможно при использовании интервальной шкалы измерения. Например, нельзя сказать, что человек, у которого коэффициент интеллекта (iQ) равен 160, в два раза умнее человека у которого этот показатель составляет 80. Но можно сказать, что заработная плата 1000 евро в два раза больше заработной платы 2000 евро.

При выборе типа шкалы измерения переменных в SPSS (столбец «Measure» во вкладке редактора данных «Variable View») интервальная шкала и шкала отношений объединяются в один вид — метрическую шкалу (Scale).

При построении в SPSS интерактивных графиков номинальная (Nominal) и порядковая (Ordinal) шкалы объединяются в «категориальный» тип (табл. 2.4).

Таблица 2.4
Шкала Характеристики
Категориаль-ная Номинальная {Nominal) Служит для классификации качественных показателей. Все значения измеряемой переменной равнозначны
Порядковая (Ordinal) Служит для построения значений измеряемой переменной в определенной последовательности. Шкала с неравными интервальными отрезками
Метрическая (Scale) Интервальная Шкала с равными интервальными отрезками и условной точкой отсчета
Относительная Шкала с равными интервальными отрезками и безусловной точкой отсчета

 

Чем выше уровень измерения переменной, тем богаче ее информационная содержательность и тем больше возможностей осуществления расчетов и определения статистических показателей.

Числовые коды («1», «2», «3»...) значений метки переменной, измеряемой по номинальной или порядковой шкале, не могут рассматриваться как числа, они представляют собой лишь некие числовые символы. Поскольку они не являются числами, с ними нельзя производить никаких арифметических операций (сложение, вычитание, деление, умножение).

Что касается статистических показателей, характеризующих распределение величины, измеряемой по номинальной шкале, можно провести частотный анализ (Frequencies) и определить моду (Mode). Частоты показывают, например, сколько респондентов предпочитают того или иного производителя продукта «Л». Мода обозначает самую многочисленную группу респондентов, предпочитающих определенного производителя продукта «Л».

Для переменных, измеряемых по порядковой шкале, кроме вышеуказанных статистических показателей можно определить медиану и средневзвешенное. Значения меток переменной, измеряемой по интервальной шкале, рассматриваются как числа. С ними можно производить такие арифметические операции, как сложение и вычитание.

Что касается возможности расчета статистических показателей, характеризующих распределение переменной, измеряемой по интервальной шкале, кроме моды и медианы можно также определить стандартное отклонение (Std. deviation) и среднеарифметическое (Mean). (Средневзвешенное значение переменных с интервальной шкалой равно среднему арифметическому.)

При расчете статистических показателей, характеризующих распределение переменной, измеряемой по интервальной шкале, не рассчитывается такой показатель, как сумма (Sum). Например, не рассчитывается «суммарный коэффициент интеллекта» для группы студентов, такого показателя не существует.

Значения меток переменной, измеряемой по шкале отношений, выражаются в числах, с ними можно производить любые арифметические операции. Также можно определять любые статистические показатели, характеризующие распределение переменной.

Возможна трансформация имеющихся данных, измеряемых по шкале более высокого уровня, в данные, измеряемые по шкале более низкого уровня, но не наоборот. Например, значения переменной «Уровень дохода», измеряемой по относительной шкале, можно трансформировать в значения переменной «Категории потребителей по уровню дохода», измеряемой по порядковой шкале (см. табл. 2.3). Подобная трансформация данных, производимая в целях упрощения процедуры анализа и наглядности представления результатов, неизбежно связана с частичной потерей информации и снижением точности расчетов.

На практике, в том числе при применении SPSS, различие между переменными, измеряемыми по интервальной и относительной шкалам, обычно несущественно.

Во многих учебниках по SPSS метрические переменные (Scale) определяются как интервальные.

ип шкалы измерения переменных определяет возможность применения того или иного метода анализа данных. Все методы статистического анализа делятся на две группы:

методы оценки связи между переменными;

методы выявления структуры данных.

Методы выявления структуры данных характеризуются тем, что исходные данные для проведения анализа не содержат информации (предположений) о существовании взаимосвязей между исследуемыми переменными. К таким методам относятся, например, кластерный и факторный анализ.

Методы оценки связи между переменными устанавливают влияние одной или нескольких независимых переменных на одну или несколько зависимых переменных. С точки зрения теории статистики существуют правила применения того или иного метода оценки связи между переменными в зависимости от типа шкалы их измерения (табл. 2.5).

Таблица 2.5 Методы оценки связи между переменными и типы шкал измерения переменных (Backhaus, Erichson, Ptinke, Weiber, 2000.S. Ш)
  Независимые переменные
Метрическая шкала Номинальная шкала
Зависимые переменные Метрическая шкала Регрессионный анализ Дисперсионный анализ
Номинальная шкала Дискриминантный анализ Таблицы сопряженности

 

Применение некоторых основных методов статистического анализа в SPSS будет более подробно рассмотрено в следующих подразделах.

КОНТРОЛЬНЫЕ ВОПРОСЫ

Что представляют собой таблицы, содержащиеся во вкладках редактора данных SPSS «Свойства переменных» (Variable View) и «Значения переменных» (Data View)?

Каким образом осуществляется процедура занесения в исходный файл данных SPSS меток переменных?

Чем отличаются пропущенные значения, определяемые системой (system-defined truss, ig values) от пропущенных значений, задаваемых пользователем программы {user-defined missing values)!

Какие три типа шкал измерения переменных используются в SPSS и каким образом задается тип шкалы измерения переменной при формировании исходного файла данных?

Чем отличаются дихотомическая и категориальная кодировка данных?

Почему при занесении в исходный файл данных SPSS ответов ка многовариантные (безальтернативные) вопросы необходимо использовать дихотомическую кодировку данных?

С какой целью и в каких случаях применяется двойная запись данных при создании исходного файла SPSS?

По шкале какого типа измеряются следующие переменные: а) частота приобретения товара «A»

реже 1-го раза в неделю;

1—3 раза в неделю;

чаще 3-х раз в неделю;

б) семейное положение

замужем/женат;

не замужем/ холост;

разведена/разведен;

в) оценка уровня сервисного обслуживания

очень высокая;

высокая;

средняя;

низкая;

очень низкая;

г) возраст (23 года, 24 года, 32 года, 57 лет)?

1. Как отличаются друг от друга переменные, измеряемые по разным типам шкал, относительно возможности произведения арифметических операций и расчета статистических показателей?


3. СРАВНЕНИЕ СРЕДНИХ ВЕЛИЧИН В SPSS

Методы сравнения средних величин часто используются в маркетинговых исследованиях для выявления взаимосвязи между исследуемыми переменными. К таким методам относятся T-тесты и дисперсионный анализ.

В ходе проведения Т-теста или дисперсионного анализа проверяется исходная (нулевая) гипотеза о равенстве сравниваемых средних величин, которая представляет собой утверждение: «Взаимосвязи между исследуемыми величинами не существует». Например, исходная (нулевая) гипотеза предполагает равенство среднего балла успеваемости студентов — юношей и девушек, что свидетельствует о том, что пол студента не влияет на его успеваемость. По результатам проведения анализа данная гипотеза должна быть подтверждена или опровергнута.

Основным результатом T-теста или дисперсионного анализа, выдаваемого SPSS, является величина «Significance» («Значимость»). Она характеризует вероятность ошибки, с которой может быть отклонена исходная (нулевая) гипотеза. Если вероятность ошибки мала, исходная гипотеза может быгь отклонена, т.е. ее можно считать неверной (рис. 3.1).

Результаты проверки исходной (нулевой) гипотезы определяются доверительным интервалом (Confidence Interval), который задается при формировании задания на проведение Г-теста или дисперсионного анализа в SPSS. По умолчанию устанавливается доверительный интервал 95%.

SPSS предоставляет возможность сравнения средних величин (Compare Means) при помощи различных методов (рис. 3.2).

При запуске процедуры «Средние величины» (Means) (см. рис. 3.2) определяются средние величины зависимых переменных в разных группах, сформированных по разным признакам (независимым переменным), а также вычисляются различные статистические показатели распределения зависимых переменных в группах (например, дисперсия, стандартное отклонение и др.).


 

Сравнение двух средних величин осуществляется при помощи T-теста. При этом Т-тест для одной выборки (One-Sample T-test) используется для сравнения средней величины тестируемого признака в выборке с заданной стандартной величиной.

Например, с помощью этого теста можно определить, отличается ли средняя цена на определенный товар в заданной выборке предприятий торговли от средней цены, указанной каким-либо официальным источником.

Т-тест для независимых выборок (,Independent Samples T-test) (см. рис. 3.2) производится для сравнения средних величин тестируемого признака в двух группах. При этом каждый респондент может оказаться только в одной из двух групп, например: мужчины и женщины, семейные и несемейные, покупающие или не покупающие товар «X» и т.д.

Т-тест для спаренных выборок (Paired-Samples T-test) (см. рис. 3.2) применяется для сравнения средних величин в двух группах, но при этом один и тот же респондент может одновременно оказаться в разных группах. Например, респонденты, покупающие товар А и товар В.

Для сравнения средних величин в трех и более группах применяется однофакторныi дисперсионный анализ (One- Way-ANO VA) (см. рис. 3.2).

В данной работе подробно рассматривается Г-тест для независимых выборок и однофакторный дисперсионный анализ.

3.1. Т-ТЕСТ ДЛЯ НЕЗАВИСИМЫХ ВЫБОРОК

3.1.1. ПОСТАНОВКА ЦЕЛИ ИССЛЕДОВАНИЯ И ПРЕДСТАВЛЕНИЕ ИСХОДНЫХ ДАННЫХ В SPSS

Т-тест проводится с целью определения влияния одной (независимой) переменной на другую (зависимую) переменную. По типу шкалы измерения зависимая переменная должна быть метрической, а независимая, как правило, является дихотомической (см. подраздел 2.3 «Типы шкал измерения переменных»).

Переменная дихотомического типа может принимать только два значения; следовательно, при помощи этой переменной можно разбить все анализируемые данные на две группы. Именно поэтому независимая переменная называется группирующей, а зависимая переменная — тестируемой.

Например, следует определить, влияет ли пол туриста на его удовлетворенность местом отдыха (рис. 3.3).

Независимая переменная «пол» является дихотомической, она разделяет всех респондентов на две группы: «мужчины» и «жен щины». В файле данных SPSS, сформированном по результатам опроса туристов, отдыхающих в курортной зоне «Баварский лес», эта переменная имеет имя «s_l» и метку переменной «Пол» (см. рис. 2.1,2.3, 2.6).

В Качестве зависимой переменной выступает переменная, представляющая вопрос анкеты № 34 «Оцените по 5-балльной шкале степень своей удовлетворенности местом отдыха в целом». В файле данных SPSS, сформированном по результатам опроса туристов, отдыхающих в курортной зоне «Баварский лес», эта переменная имеет имя «q_34» и метку переменной «Удовлетворенность» (рис. 3.4).

В столбце «Values» таблицы «Свойства переменных» отображаются значения метки переменной «Удовлетворенность» и их числовые коды.

Числовые коды значений переменной «Удовлетворенность» содержатся в таблице «Значения переменных» вкладки редактора данных «Data View» (рис. 3.5).

 

Из данных, представленных на рис. 3.5, видно, что респондент в строке 3525 доволен местом отдыха, респондент в строке 3526 — очень доволен, респондент в строке 3529 — доволен и недоволен одновременно, а респондент в строке 3530 затруднился ответить на поставленный вопрос.

Для того чтобы выяснить, влияет ли пол туриста на степень его удовлетворенности местом отдыха, необходимо сравнить средний уровень удовлетворенности мужчин и женщин. Если данные показатели существенно отличаются друг от друга, то можно судить о наличии вышеуказанной взаимосвязи.

Т-тест позволяет проверить верность гипотезы, согласно которой средние величины тестируемого показателя в двух группах равны. В рассматриваемом примере исходная (нулевая) гипотеза формулируется следующим образом:

«Мужчины и женщины в одинаковой степени довольны (недовольны) местом отдыха, т.е. пол туриста не влияет на его удовлетворенность местом отдыха».

В ходе проведения T-теста исходная гипотеза должна быть подтверждена или опровергнута. Для выполнения этого задания последовательно решаются две задачи:

Проверяются условия равенства дисперсий тестируемой переменной в двух сравниваемых группах.

Выявляются взаимосвязи между исследуемыми переменными, т.е. проверяются неравенства средних значений тестируемой переменной в двух сравниваемых группах.

3.1.2. КОМАНДЫ SPSS НА ВЫПОЛНЕНИЕ Т-ТЕСТА ДЛЯ НЕЗАВИСИМЫХ ВЫБОРОК

 

При помощи выбора меню «Analyze > Compare Means > Independent Samples T-tesU (см. рис. 3.2) открывается диалоговое окно «T-тест для независимых выборок» (рис. 3.6).

В левом поле окна указываются метки всех переменных, занесенных в базу данных. Из данного списка выбирается метка тестируемой переменной (в рассматриваемом примере это «Удовлетворенность») и переносится в поле «Test Variable(s)». Далее из списка выбирается метка группирующей переменной (в рассматриваемом примере это «Пол») и переносится в поле «Group ng Vat able».

 

 

руппирующая переменная делит всех респондентов на две группы: мужчины («1») и женщины («2»). Кодировку этих групп необходимо указать во вспомогательном диалоговом окне «Обозначенные группы» (Define Groups), которое открывается нажатием одноименной кнопки в диалоговом окне «Г-тест для независимых выборок» (рис- 3.6 и 3.7).

 

Группирующая переменная может быть не только дихотомической (т.е. принимающей только два значения), но и метрической, например переменная «возраст». В этом случае группы обозначаются при помощи указания «точки разрыва» (Cut point), например старше или младше указанного возраста.

Путем нажатия кнопки «Продолжение» (Continue) (см. рис. 3.7) снова активируется главное диалоговое окно «T-teст для независимых выборок» (см. рис. 3.6). При нажатии в этом окне кнопки «Опции» (Options) открывается одноименное диалоговое окно (рис. 3.8.).

В данном окне устанавливается «доверительный интервал» (Confidence Interval), который по умолчанию задается в размере 95%. Доверительный интервал определяет допустимую вероятность ошибки в случае отклонения исходной (нулевой) гипотезы (см. рис. 3.1).

После того как задан доверительный интервал путем нажатия кнопки «Продолжение» (Continue) осуществляется возврат в главное диалоговое окно «Г-тест для независимых выборок» (см рис. 3.6.), где нажатием кнопки «ОК» запускается процедура проведения T-теста.

 



Поделиться:


Последнее изменение этой страницы: 2016-04-08; просмотров: 4105; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.118.1.232 (0.048 с.)