Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Тема 6. Методы анализа социологических данныхСодержание книги
Похожие статьи вашей тематики
Поиск на нашем сайте
Анализ данных вообще - это, во-первых, совокупность действий, осуществляемых исследователем в процессе изучения полученных тем или иным образом данных с целью формирования определенных представлений о характере явления, описываемого этими данными. Исследователь пытается данные свернуть, сократить их количество, стремясь потерять при этом как можно меньше полезной информации, потенциально в них заложенной. Делается это обычно с помощью математических методов. Во-вторых, процесс изучения статистических данных (поиска статистических закономерностей, закономерностей в среднем) с помощью математических методов, не предполагающих вероятностной модели изучаемого явления. Противостоит вероятностно-статистическому подходу к обработке данных, опирающемуся на их вероятностную интерпретацию (как случайной выборки из генеральной совокупности) и использование вероятностных моделей для построения и выбора наилучших методов обработки. Получаемые с помощью вероятностно-статистического подхода выводы опираются на строго доказанные математические положения. В частности, этот подход обеспечивает корректный перенос результатов с выборки на генеральную совокупность (оценивание статистическое и проверка статистических гипотез). В методах анализа данных подобные возможности не заложены. Эти методы не удовлетворяют строгим математическим требованиям. Выбор наилучшего метода здесь почти всегда опирается на неформализуемые эвристические соображения. Поэтому проблема обоснования получаемых выводов здесь требует особого внимания. Особенно острой становится необходимость выделения точек соприкосновения содержания задачи и математического формализма, реализации человекомашинного диалога в процессе применения метода. К методам анализа данных относят и вероятностно-статистические методы в тех случаях, когда не удается проверить адекватность реальности, предполагаемой методом вероятностной модели. Выделение методов анализа данных обусловлено потребностями ряда наук (в том числе социологии), в которых, с одной стороны, велика потребность поиска статистических закономерностей, а, с другой, - предположения, лежащие в основе вероятностно-статистических методов, разработанных специально для решения таких задач, часто не выполняются. Существует мнение, что поскольку методы анализа данных с точки зрения строгой математики не являются достаточно обоснованными, то имеет смысл использовать их лишь на предварительном этапе анализа для уточнения представлений исследователя об изучаемом явлении, корректировки понятийного аппарата, формулировки гипотез и т.д. Однако методы анализа данных могут служить и средством получения фундаментального знания, выявления неизвестных ранее закономерностей, если перейти на новый уровень понимания самого математического формализма: считать, что адекватным решаемой задаче является не отдельный метод, а совокупность методов, применяемых в соответствии с определенными методологическими принципами. В-третьих, анализ данных отождествляется с понятием прикладной статистики, понимаемой как научная дисциплина, разрабатывающая и систематизирующая понятия, приемы, математические методы и модели, предназначенные для организации сбора, стандартной записи, систематизации и обработки статистических данных с целью их удобного представления, интерпретации и получения научных и практических выводов. В-четвёртых, анализ данных представляет собой процедуры поиска статистических закономерностей (свертки информации), не сводящиеся к применению формальных алгоритмов. В основе лежит комплексное использование математико-статистических методов с опорой на несколько методологических принципов. Первый принцип - вариация предпосылок, лежащих в основе выбираемых методов (любой метод опирается на определенную модель изучаемого явления, т.е. определенную систему предпосылок и постулатов): изменение таких предпосылок, рассмотрение последствий этого изменения, сравнение использования разных предпосылок и т.д. Актуальность реализации этого принципа объясняется тем, что для большинства методов проверка состоятельности заложенных в них моделей в социологических задачах является весьма проблематичной. Второй принцип - системный подход. В процессе анализа данных изыскиваются различные приемы для наиболее полного использования и эндогенной информации (т.е. данных, описывающих изучаемый объект), и экзогенной (т.е. данных, описывающих среду обитания объекта). Системный подход предъявляет к исследователю повышенные требования, поскольку носит принципиально междисциплинарный характер. Третий принцип - отказ от той точки зрения, что любое исследование имеет начало и конец. Анализ данных - способ существования данных, готовность к постоянному возврату к одним и тем же данным. В непрерывном процессе анализа данных предусматриваются разрывы, позволяющие извлекать накопленную информацию и принимать решения, связанные с управлением обработкой данных, с выбором дальнейших шагов анализа данных. Формальные операции перемежаются с неформальными процедурами принятия решения. С появлением новых данных возникают новые идеи, подходы, методы, уточняется понимание происходящих процессов и т.д. В социологии реализация этого принципа актуальна, т.к. социолог обычно не имеет той априорной модели изучаемого явления, которая является необходимой и для выбора формального аппарата анализа данных и вообще для проведения исследования, начиная с формулировки гипотез и разработки способа сбора данных. Методы, применяемые социологами для анализа данных, многообразны. Выбор конкретного метода зависит, в первую очередь, от характера исследовательских гипотез. Если целью является описание одной характеристики выборки в определённый момент времени, ограничиваются одномерным анализом, то есть описанием распределения наблюдений вдоль оси интересующего признака. Разнообразные техники многомерного анализа позволяют одновременно исследовать взаимоотношения двух и более переменных и в той или иной форме проверять гипотезы о причинных связях между ними. В реальном исследовании каждое уточнение исходных гипотез или выдвижение новой гипотезы в ходе анализа результатов приводит к необходимости выбора новой техники анализа данных. Помимо характера исследовательских гипотез на выбор методов статистического анализа влияет и природа полученных социологом данных. Уже говорилось о том, что разные уровни измерения социологических переменных определяют возможности и ограничения анализа. Одномерный анализ. Результаты измерения любой переменной могут быть представлены с помощью распределения наблюдений по отдельным категориям данной переменной. Результатом такого упорядочения наблюдений будет группировка. Группировка - это классификация или упорядочение данных по признаку подобия или различия. Если данные сгруппированы, можно посмотреть, какова абсолютная частота, то есть число наблюдений в данной вы- борке, попадающих в интересующую нас категорию, и относительная частота (процент). Доли процентов не существенны для интерпретации полученных результатов. Поэтому в представлении данных обычно используют процедуру округления. Определив необходимую степень точности, исследователь может округлить все полученные числовые значения до десятых долей или до целых процентов. В результате процедуры округления исследователь фактически устанавливает границы классов, объединяющих значения переменной в заданном интервале, и середины (центры) классов, то есть усреднённые значения для каждого интервала. Независимо от того, какие статистические методы и модели собирается использовать исследователь, первым шагом в анализе данных всегда является построение частотных распределений для каждой изучавшейся переменной. Полученные результаты принято представлять в виде таблицы частотного распределения для каждой существенной переменной. Примером табличного представления может служить приведённая ниже таблица, в которой представлены реальные данные опроса, проведённого кафедрой социологии и социальных технологий управления УГТУ-УПИ «Студент-2004». Таблица 4 Частотное распределение профиля образования в вузе
Иногда в таблице распределения указывают лишь относительные частоты, опуская абсолютные. Таблица 5 Частотное распределение затруднений во время обучения в УГТУ - УПИ
каждые 5 лет не со всеми нет каждый год Гистограмма о желании участвовать во встречах выпускников УГТУ-УПИ с преподавателями кафедры Анализ связи между двумя переменными. Хотя результаты одномерного анализа данных часто имеют самостоятельное значение, большинство исследователей уделяют основное внимание анализу связей между переменными. Самым простым и типичным является случай анализа взаимосвязи (сопряжённости) двух переменных. Устойчивый интерес социологов к двумерному и многомерному анализу данных объясняется желанием проверить гипотезы о причинной зависимости двух и более переменных. Так как возможности социологов проверять причинные гипотезы с помощью эксперимента ограниченны, основной альтернативой является статистический анализ неэкспериментальных данных. В общем случае для демонстрации причинно-следственного отношения между двумя переменными необходимо выполнить следующие требования: 1) показать, что существует эмпирическая взаимосвязь между перемен 2) исключить возможность обратного влияния переменных. Убедиться, что взаимосвязь между переменными не может быть объяснена зависимостью этих переменных от какой-то дополнительной переменной (или переменных). Первым шагом к анализу взаимоотношений двух переменных является построение таблицы сопряжённости. Эта таблица содержит информацию о совместном распределении переменных. Допустим, в результате одномерного анализа данных мы установили, что студенты сильно различаются по уровню наличия свободного времени: некоторые говорят о его полном отсутствии, другие - о своей полной свободе. Мы предполагаем, что причина этих различий -- какая-то другая переменная, например успеваемость. Мы располагаем данными о наличии свободного времени и успеваемости для выборки студентов. Для простоты предположим, что обе переменные имеют два уровня -- высокий и низкий. Для свободного времени воспользуемся двумя категориями - «нет свободного времени», «много свободного времени»; для успеваемости -- «хорошая успеваемость», «плохая успеваемость». Табл. 6 показывает, как могло бы выглядеть совместное распределение этих двух переменных. Таблица 6 Взаимосвязь между наличием свободного времени и успеваемостью студентов
В таблице два столбца (для успеваемости) и две строки (для свободного времени), следовательно, размерность таблицы 2x2, кроме того, имеются дополнительный крайний столбец (справа) и нижняя строка (маргиналы таблицы), указывающее общее количество наблюдений в данной строке или в столбце. В правом нижнем углу указана общая сумма, то есть общее число наблюдений в выборке. Существует неписаное правило: для той переменной, которую полагают независимой, отводится верхняя строка (горизонталь), а зависимую располагают «сбоку», по вертикали. Так как вывод о наличии взаимосвязи между переменными требует демонстрации различий между подгруппами по уровню зависимой переменной, при анализе таблицы сопряжённости можно руководствоваться простыми правилами. > Нужно определить независимую переменную и пересчитать абсолютные частоты в проценты. Для этого нужно разделить их на маргинальные частоты и умножить на 100. Если независимая переменная расположена по горизонтали таблицы, считаются проценты по столбцу; если независимая переменная расположена по вертикали, проценты берутся от сумм по строке. ^ Далее сравниваются процентные показатели, полученные для подгрупп с разным уровнем независимой переменной, каждый раз внутри одной категории зависимой переменной (например, внутри категории имеющих много свободного времени). Обнаруженные различия свидетельствуют о существовании взаимосвязи между двумя переменными. Элементарная таблица сопряжённости размерности 2x2- это минимальное необходимое условие для вывода о наличии взаимосвязи двух переменных. Знаний о распределении зависимой переменной недостаточно. Варьировать должна не только зависимая, но и независимая переменная. ^ План практического занятия 1. Статистические методы анализа данных. 2. Методы анализа качественных данных. ^ Вопросы для обсуждения 1. Как интерпретировать результаты наблюдения? 2. Как интерпретировать данные интервью? 3. Может ли исследовательская предвзятость исказить анализ данных? 4. Являются ли математические модели надёжным методом проверки ис > Задания 1. Проведите наблюдение и сделайте 1 -2 полевые записи по выбранной 2. Проанализируйте данные табл. 7. Таблица 7 Оценки требовательности преподавателей в разных группах по периодам встреч с ними
^ Рекомендуемая литература: 1. Айвазян С. А. Прикладная статистика/ С.А.Айвазян, И.С. Енюков, 2. Елисеева И.И.,. Логика прикладного статистического анализа/ 3. Миркин Б.Г. Анализ качественных признаков и структур/ 4. Татарова Г.Г. Методология анализа данных в социологии / 5. Толстова Ю.Н. Логика математического анализа социологических 6. Толстова Ю.Н. Анализ социологических данных: методология, деск 7. Тьюки Дж.У. Анализ результатов наблюдений: разведочный анализ / 8. Тьюки Дж.У. Анализ данных, вычисления на ЭВМ и математика/ 9. Тюрин Ю.Н. Статистический анализ данных на компьютере / Ю.Н. Тюрин, А.А. Макаров. М, 1998. Ю.Фелингер А.Ф. Статистические алгоритмы в социологических исследованиях / А.Ф. Фелингер. Новосибирск, 1985.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Последнее изменение этой страницы: 2016-07-14; просмотров: 1482; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.146.65.134 (0.013 с.) |