Тема 6. Методы анализа социологических данных 

 

 

 

 

 



Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Тема 6. Методы анализа социологических данных



Анализ данных вообще - это, во-первых, совокупность действий, осуще­ствляемых исследователем в процессе изучения полученных тем или иным об­разом данных с целью формирования определенных представлений о характере явления, описываемого этими данными. Исследователь пытается данные свер­нуть, сократить их количество, стремясь потерять при этом как можно меньше полезной информации, потенциально в них заложенной. Делается это обычно с помощью математических методов.

Во-вторых, процесс изучения статистических данных (поиска статисти­ческих закономерностей, закономерностей в среднем) с помощью математиче­ских методов, не предполагающих вероятностной модели изучаемого явления. Противостоит вероятностно-статистическому подходу к обработке данных, опирающемуся на их вероятностную интерпретацию (как случайной выборки


из генеральной совокупности) и использование вероятностных моделей для по­строения и выбора наилучших методов обработки.

Получаемые с помощью вероятностно-статистического подхода выводы опираются на строго доказанные математические положения. В частности, этот подход обеспечивает корректный перенос результатов с выборки на генераль­ную совокупность (оценивание статистическое и проверка статистических ги­потез). В методах анализа данных подобные возможности не заложены. Эти ме­тоды не удовлетворяют строгим математическим требованиям. Выбор наилуч­шего метода здесь почти всегда опирается на неформализуемые эвристические соображения. Поэтому проблема обоснования получаемых выводов здесь тре­бует особого внимания. Особенно острой становится необходимость выделения точек соприкосновения содержания задачи и математического формализма, реализации человекомашинного диалога в процессе применения метода.

К методам анализа данных относят и вероятностно-статистические мето­ды в тех случаях, когда не удается проверить адекватность реальности, предпо­лагаемой методом вероятностной модели. Выделение методов анализа данных обусловлено потребностями ряда наук (в том числе социологии), в которых, с одной стороны, велика потребность поиска статистических закономерностей, а, с другой, - предположения, лежащие в основе вероятностно-статистических ме­тодов, разработанных специально для решения таких задач, часто не выполня­ются.

Существует мнение, что поскольку методы анализа данных с точки зре­ния строгой математики не являются достаточно обоснованными, то имеет смысл использовать их лишь на предварительном этапе анализа для уточнения представлений исследователя об изучаемом явлении, корректировки понятий­ного аппарата, формулировки гипотез и т.д. Однако методы анализа данных могут служить и средством получения фундаментального знания, выявления неизвестных ранее закономерностей, если перейти на новый уровень понима­ния самого математического формализма: считать, что адекватным решаемой


задаче является не отдельный метод, а совокупность методов, применяемых в соответствии с определенными методологическими принципами.

В-третьих, анализ данных отождествляется с понятием прикладной ста­тистики, понимаемой как научная дисциплина, разрабатывающая и системати­зирующая понятия, приемы, математические методы и модели, предназначен­ные для организации сбора, стандартной записи, систематизации и обработки статистических данных с целью их удобного представления, интерпретации и получения научных и практических выводов.

В-четвёртых, анализ данных представляет собой процедуры поиска ста­тистических закономерностей (свертки информации), не сводящиеся к приме­нению формальных алгоритмов. В основе лежит комплексное использование математико-статистических методов с опорой на несколько методологических принципов.

Первый принцип - вариация предпосылок, лежащих в основе выбираемых методов (любой метод опирается на определенную модель изучаемого явления, т.е. определенную систему предпосылок и постулатов): изменение таких пред­посылок, рассмотрение последствий этого изменения, сравнение использования разных предпосылок и т.д. Актуальность реализации этого принципа объясня­ется тем, что для большинства методов проверка состоятельности заложенных в них моделей в социологических задачах является весьма проблематичной.

Второй принцип - системный подход. В процессе анализа данных изы­скиваются различные приемы для наиболее полного использования и эндоген­ной информации (т.е. данных, описывающих изучаемый объект), и экзогенной (т.е. данных, описывающих среду обитания объекта). Системный подход предъявляет к исследователю повышенные требования, поскольку носит прин­ципиально междисциплинарный характер.

Третий принцип - отказ от той точки зрения, что любое исследование имеет начало и конец. Анализ данных - способ существования данных, готов­ность к постоянному возврату к одним и тем же данным. В непрерывном про­цессе анализа данных предусматриваются разрывы, позволяющие извлекать


накопленную информацию и принимать решения, связанные с управлением об­работкой данных, с выбором дальнейших шагов анализа данных. Формальные операции перемежаются с неформальными процедурами принятия решения. С появлением новых данных возникают новые идеи, подходы, методы, уточняет­ся понимание происходящих процессов и т.д. В социологии реализация этого принципа актуальна, т.к. социолог обычно не имеет той априорной модели изу­чаемого явления, которая является необходимой и для выбора формального ап­парата анализа данных и вообще для проведения исследования, начиная с фор­мулировки гипотез и разработки способа сбора данных.

Методы, применяемые социологами для анализа данных, многообразны. Выбор конкретного метода зависит, в первую очередь, от характера исследова­тельских гипотез. Если целью является описание одной характеристики выбор­ки в определённый момент времени, ограничиваются одномерным анализом, то есть описанием распределения наблюдений вдоль оси интересующего призна­ка. Разнообразные техники многомерного анализа позволяют одновременно ис­следовать взаимоотношения двух и более переменных и в той или иной форме проверять гипотезы о причинных связях между ними. В реальном исследовании каждое уточнение исходных гипотез или выдвижение новой гипотезы в ходе анализа результатов приводит к необходимости выбора новой техники анализа данных.

Помимо характера исследовательских гипотез на выбор методов стати­стического анализа влияет и природа полученных социологом данных. Уже го­ворилось о том, что разные уровни измерения социологических переменных определяют возможности и ограничения анализа.

Одномерный анализ. Результаты измерения любой переменной могут быть представлены с помощью распределения наблюдений по отдельным кате­гориям данной переменной. Результатом такого упорядочения наблюдений бу­дет группировка. Группировка - это классификация или упорядочение данных по признаку подобия или различия. Если данные сгруппированы, можно по­смотреть, какова абсолютная частота, то есть число наблюдений в данной вы-


борке, попадающих в интересующую нас категорию, и относительная частота (процент).

Доли процентов не существенны для интерпретации полученных резуль­татов. Поэтому в представлении данных обычно используют процедуру округ­ления. Определив необходимую степень точности, исследователь может округ­лить все полученные числовые значения до десятых долей или до целых про­центов. В результате процедуры округления исследователь фактически уста­навливает границы классов, объединяющих значения переменной в заданном интервале, и середины (центры) классов, то есть усреднённые значения для ка­ждого интервала. Независимо от того, какие статистические методы и модели собирается использовать исследователь, первым шагом в анализе данных все­гда является построение частотных распределений для каждой изучавшейся пе­ременной.

Полученные результаты принято представлять в виде таблицы частотного распределения для каждой существенной переменной. Примером табличного представления может служить приведённая ниже таблица, в которой представ­лены реальные данные опроса, проведённого кафедрой социологии и социаль­ных технологий управления УГТУ-УПИ «Студент-2004».

Таблица 4 Частотное распределение профиля образования в вузе

 

Наименование переменной Абсолютная частота, чел. Относительная частота, %
Технический    
Социально-экономический    
Гуманитарный    
Естественнонаучный    
Всего:    

Иногда в таблице распределения указывают лишь относительные часто­ты, опуская абсолютные.


Таблица 5 Частотное распределение затруднений во время обучения в УГТУ - УПИ


Помимо табличного представления частотных распределений обычно ис­пользуют и методы графического представления. Самый распространённый ме­тод графического представления одномерных распределений - это гистограм­ма, или столбиковая диаграмма. Каждый столбик соответствует интервалу зна­чений переменной, причём его середина совмещается с серединой данного ин­тервала. Высота столбика отражает частоту (абсолютную или относительную) попадания наблюдавшихся значений переменной в определённый интервал. Масштаб шкалы обычно выбирают так, чтобы общая высота гистограммы со­ставляла приблизительно 40-60% её ширины.

 

Наименование переменной %
Трудности из-за совмещения учёбы с работой и семейной жизнью  
Недостаток методической литературы  
Недостаток учебников  
Недостаток практического материала  
Неудобный график сессий  
Переносы занятий  
Проблемы во взаимоотношениях с руководителями и мето­дистами представительства  
Срывы занятий  
Неорганизованность в целом  
Отсутствие Интернета в представительстве  
Недостаток исследовательской практики  
Всего:  

 

 

50 л 40 -30-20-10 -п -           ---------    

 

   
   
   

каждые 5 лет


не со всеми


нет


каждый год


Гистограмма о желании участвовать во встречах выпускников УГТУ-УПИ

с преподавателями кафедры


Анализ связи между двумя переменными. Хотя результаты одномерного анализа данных часто имеют самостоятельное значение, большинство исследо­вателей уделяют основное внимание анализу связей между переменными. Са­мым простым и типичным является случай анализа взаимосвязи (сопряжённо­сти) двух переменных. Устойчивый интерес социологов к двумерному и мно­гомерному анализу данных объясняется желанием проверить гипотезы о при­чинной зависимости двух и более переменных. Так как возможности социоло­гов проверять причинные гипотезы с помощью эксперимента ограниченны, ос­новной альтернативой является статистический анализ неэкспериментальных данных.

В общем случае для демонстрации причинно-следственного отношения между двумя переменными необходимо выполнить следующие требования:

1) показать, что существует эмпирическая взаимосвязь между перемен­
ными;

2) исключить возможность обратного влияния переменных.

Убедиться, что взаимосвязь между переменными не может быть объясне­на зависимостью этих переменных от какой-то дополнительной переменной (или переменных).

Первым шагом к анализу взаимоотношений двух переменных является построение таблицы сопряжённости. Эта таблица содержит информацию о со­вместном распределении переменных.

Допустим, в результате одномерного анализа данных мы установили, что студенты сильно различаются по уровню наличия свободного времени: некото­рые говорят о его полном отсутствии, другие - о своей полной свободе. Мы предполагаем, что причина этих различий -- какая-то другая переменная, на­пример успеваемость.

Мы располагаем данными о наличии свободного времени и успеваемости для выборки студентов. Для простоты предположим, что обе переменные име­ют два уровня -- высокий и низкий. Для свободного времени воспользуемся двумя категориями - «нет свободного времени», «много свободного времени»;


для успеваемости -- «хорошая успеваемость», «плохая успеваемость». Табл. 6 показывает, как могло бы выглядеть совместное распределение этих двух пере­менных.

Таблица 6

Взаимосвязь между наличием свободного времени и успеваемостью

студентов

 

 

 

Наличие свобод­ного времени Успеваемость Всего
хорошая успевае­мость плохая успевае­мость
Нет свободного времени      
Много свободного времени      
Всего      

В таблице два столбца (для успеваемости) и две строки (для свободного времени), следовательно, размерность таблицы 2x2, кроме того, имеются до­полнительный крайний столбец (справа) и нижняя строка (маргиналы таблицы), указывающее общее количество наблюдений в данной строке или в столбце. В правом нижнем углу указана общая сумма, то есть общее число наблюдений в выборке. Существует неписаное правило: для той переменной, которую пола­гают независимой, отводится верхняя строка (горизонталь), а зависимую рас­полагают «сбоку», по вертикали.

Так как вывод о наличии взаимосвязи между переменными требует де­монстрации различий между подгруппами по уровню зависимой переменной, при анализе таблицы сопряжённости можно руководствоваться простыми пра­вилами.

> Нужно определить независимую переменную и пересчитать абсолютные частоты в проценты. Для этого нужно разделить их на маргинальные час­тоты и умножить на 100. Если независимая переменная расположена по горизонтали таблицы, считаются проценты по столбцу; если независимая переменная расположена по вертикали, проценты берутся от сумм по строке.


^ Далее сравниваются процентные показатели, полученные для подгрупп с разным уровнем независимой переменной, каждый раз внутри одной ка­тегории зависимой переменной (например, внутри категории имеющих много свободного времени). Обнаруженные различия свидетельствуют о существовании взаимосвязи между двумя переменными. Элементарная таблица сопряжённости размерности 2x2- это минималь­ное необходимое условие для вывода о наличии взаимосвязи двух переменных. Знаний о распределении зависимой переменной недостаточно. Варьировать должна не только зависимая, но и независимая переменная.

^ План практического занятия

1. Статистические методы анализа данных.

2. Методы анализа качественных данных.

^ Вопросы для обсуждения

1. Как интерпретировать результаты наблюдения?

2. Как интерпретировать данные интервью?

3. Может ли исследовательская предвзятость исказить анализ данных?

4. Являются ли математические модели надёжным методом проверки ис­
ходных суждений?

> Задания

1. Проведите наблюдение и сделайте 1 -2 полевые записи по выбранной
самостоятельно учебной теме с последующим анализом в письменной форме.

2. Проанализируйте данные табл. 7.


Таблица 7

Оценки требовательности преподавателей в разных группах по периодам

встреч с ними

 

 

Требовательность преподавателей, балл Хотели бы Вы участвовать во встречах выпускников с преподавателями кафедры? (%)
да, каждые 5 лет да, каждый год да, но не со всеми нет
         
         
    И    
         
         

^ Рекомендуемая литература:

1. Айвазян С. А. Прикладная статистика/ С.А.Айвазян, И.С. Енюков,
Л.Д. Мешалкин. Т.1-3. М: 1983, 1985, 1989.

2. Елисеева И.И.,. Логика прикладного статистического анализа/
И.И. Елисеева, В.О. Рукавишников. М., 1982.

3. Миркин Б.Г. Анализ качественных признаков и структур/
Б.Г. Миркин. М., 1980.

4. Татарова Г.Г. Методология анализа данных в социологии /
Г.Г. Татарова. М., 1998.

5. Толстова Ю.Н. Логика математического анализа социологических
данных / Ю.Н. Толстова. М., 1991.

6. Толстова Ю.Н. Анализ социологических данных: методология, деск­
риптивная статистика; изучение связей между номинальными признаками /
Ю.Н. Толстова. М., 2000.

7. Тьюки Дж.У. Анализ результатов наблюдений: разведочный анализ /
Дж.У. Тьюки. М., 1982.

8. Тьюки Дж.У. Анализ данных, вычисления на ЭВМ и математика/
Дж.У. Тьюки // Современные проблемы математики. М., 1977.


9. Тюрин Ю.Н. Статистический анализ данных на компьютере / Ю.Н. Тюрин, А.А. Макаров. М, 1998.

Ю.Фелингер А.Ф. Статистические алгоритмы в социологических иссле­дованиях / А.Ф. Фелингер. Новосибирск, 1985.



Поделиться:


Читайте также:




Последнее изменение этой страницы: 2016-07-14; просмотров: 1445; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.17.79.60 (0.033 с.)