Лекція 7 «Кластерний аналіз як метод класифікації об’єктів спостереження» 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Лекція 7 «Кластерний аналіз як метод класифікації об’єктів спостереження»



 

Кластерний аналіз застосовується для розподілу багатьох об’єктів на задану або невідому кількість класів на основі певного математичного критерію якості класифікації. Cluster (англ. – “пучок”) – скупчення, група елементів, що характеризуються спільною якістю, властивістю. Критерій якості кластеризації відображає такі неформальні вимоги:

• у групі об’єкти повинні бути щільно пов’язані між собою;

• об’єкти різних груп мають бути далекими один від одного;

• за будь-яких рівних умов розподіл об’єктів на групи повинен бути рівномірним.

Сутність кластерного аналізу зводиться до групування (кластеризації) сукупності з різноманітними ознаками з метою одержання однорідних груп-кластерів. Перевага цього аналізу полягає в тому, що його математичний апарат дає змогу знайти й виділити реально існуюче в ознаковому просторі нагромадження об’єктів (точок) на підставі одночасного групування за великою кількістю ознак. Більше того, метод дає можливість виявити й описати структурні закономірності, забезпечивши формування однорідних класів об’єктів.

Основою формування ознакових просторів кластер-аналізу є вибір змінних. Цей важливий етап здійснюється у дві стадії. В основу першої з них покладено формування первинної гіпотези про набір ознак, які впливають на досліджуване явище; в основу другої – уточнення гіпотези за результатами фахових консультацій (опитувань) спеціалістів. Завершеною стадією вважається постановка завдання за умови її узгодженості з вимогами математичного апарату й можливостями обчислювальної техніки [4, с.28].

Прийнято виділяти три послідовних етапи моделювання: логіко-інтуїтивний аналіз, формалізація й квантифікація.

Логіко-інтуїтивний аналіз – це, по суті, традиційна дослідницька практика, коли спеціаліст, використовуючи свої знання, логіку й інтуїцію, створює модель досліджуваної ситуації або процесу. Як правило, ця модель конструюється на основі систематизації змістовних понять, тісно пов’язаних із предметною специфікою досліджуваного явища й емпіричного масиву інформаційних даних, що відносяться до нього.

Прикладом такої аналітичної моделі може служити систематизація проблематики міжнародних переговорів, запропонована Ф.Айклом. Його система виділяє такі основні типи переговорів: про продовження, про нормалізацію, про перерозподіл, про створення нових умов. Їх внутрішні складові автор систематизує в такий спосіб: предмет суперечки, основні характеристики процесу переговорів, наслідки затягування переговорів, наслідки досягнення угоди. Особлива графа виділяється для аналізу побічних наслідків переговорів [3, с.14].

Але навіть якщо змістовна модель забезпечує одержання значимих аналітичних і прогностичних результатів, з її допомогою дуже складно стежити за серйозними змінами, що відбуваються в досліджуваному об’єкті, особливо якщо вони мають бурхливий характер. Для розв’язання задачі спостереження за обстановкою необхідне перетворення змістовної моделі зі статистичної в динамічну.

Зазначене перетворення може бути здійснено тільки за допомогою формалізації змістовної моделі, під час якої відбувається значна зміна її форми – перехід від переважно дискрептивної до переважно матрично-графічної, а також і її вдосконалювання.

Для ілюстрації процесу перетворення змістовної моделі в один із простих варіантів формалізованої можна посилатись на приклад прикладного аналізу переговорного процесу. На етапі створення змістовної моделі експертами встановлюються такі моменти:

1. Виявлення можливих варіантів вирішення проблеми під час переговорів.

2. Кожний з елементів з урахуванням його практичних наслідків для держави розглядається з погляду його відповідності кожній цілі, що має пряме або непряме відношення до предмета переговорів.

3. Отримані в такий спосіб оцінки використовуються для визначення ступеня прийнятності варіантів (у цілому, прийнятні, відносно прийнятні, малоприйнятні й неприйнятні варіанти та їхні елементи) [6, с.34–35].

Виділені поняття (категорії) можуть бути зведені в матрицю зіставлення варіантів вирішення проблеми та цілей держав – учасників переговорів. Зіставлення пріоритетів окремих учасників переговорів дозволяє виявити ті варіанти (та їхні елементи), що в тому або іншому ступені були б прийнятні для всіх або більшості держав. При цьому ймовірна зона поступки включала б ті варіанти, які для всіх або більшості учасників були б найбільше, у цілому або відносно, прийнятні.

Описана вище аналітична процедура, проведена шляхом поетапної формалізації змістовної моделі переговорної концепції, і її перетворення в просту формалізовану модель переговорного процесу сприяють виявленню найбільш компромісних варіантів домовленостей і досягненню балансу інтересів учасників переговорів.

Володіючи дуже високим аналітичним потенціалом, формалізовані моделі не в змозі цілком вирішити задачі спостереження за зміною зовнішньополітичних ситуацій та істотних коливань динаміки міжнародних процесів. Ця задача зазвичай розв’язується на етапі квантифікації рубрик формалізованої моделі та її перетворення в квантифіковану.

Прикладом квантифікованої моделі може розглядатись модель, запропонована Т.Сааті для оцінки процесу взаємного контролю й досягнення угод між конфліктуючими суб’єктами міжнародних відносин. На основі сполучення системного аналізу, математичної техніки дослідження операцій і кібернетичного підходу автору вдалося побудувати, принаймні в першому наближенні, експериментальний “образ штучної реальності”, що відбиває більшість властивостей значних міжнародних конфліктів. Але пізнавальне значення цієї методики значно ширше, оскільки вона дозволяє за наявності системи спостереження за подіями оцінювати темпи еволюції окремих чинників, що формують міжнародну конфліктну ситуацію, допомагає на ранній стадії виявити ті з них, які будуть здійснювати зростаючий вплив на формування конкретних ситуацій не тільки на сучасному етапі, але й у майбутньому.

Автор висуває такі вимоги до побудови квантифікованих моделей цього класу: потреба розробки концептуальної схеми, що підлягає квантифікації і є спроможною відобразити більшість властивостей реального конфлікту (або іншого динамічного об’єкта спостереження); необхідність точного опису змінних, які вводяться, й одиниці їхнього виміру, при цьому поведінка об’єктів спостереження повинна бути виражена кількісно; ситуація, що моделюється під час експерименту, повинна розкладатись на ряд більш простих експериментальних ситуацій, які, якщо це можливо, повинні бути попередньо вивченими або близькими до вже вивчених. Квантифікована модель штучної міжнародної реальності, запропонована Т.Сааті, у загальному вигляді складається із двох симетричних ігор, у яких ходи робляться одночасно. Одна з них – гра з позитивною сумою “дилема ув’язненого”, що орієнтована на відносно умовне відображення міжнародної економіки. Інша – гра з негативною сумою за назвою “півні”, що нагадує протистояння двох країн, коли вони тримають курс на сутичку в надії, що їхній супротивник піде на поступки [5, с.1–4].

Побудова кваліфікованої моделі є достатньо конструктивною як засіб прикладного аналізу міжнародних ситуацій, що розвиваються динамічно. Проте, на думку деяких дослідників, адекватна квантифікація у сфері гуманітарного знання, у тому числі в рамках прикладного моделювання міжнародних ситуацій і процесів, не може бути застосована без урахування чинника системної нормативності моделювання.

Отже, метод прикладного моделювання широко використовується у сфері міжнародних відносин і дає змогу розробляти не тільки уточнені уявлення про світ як спрощену модель, але й дає змогу розробляти прогнози на майбутнє. Методологічною основою моделювання у сфері міжнародних відносин є системний підхід, який допомагає врахувати та виявити велику кількість різноманітних факторів, побачити нові перспективи та зекономити час. Також виділяють три етапи моделювання: логіко-інтуїтивний аналіз, формалізація та квантифікація. Відповідно виділяються й три класи моделей: змістовні, формалізовані та квантифіковані.

 

Використана література

  1. Введение в математическое моделирование: учеб. пособ. / под ред. П. В. Трусова. – М.: Логос, 2004. – С. 44–45.
  2. Системный подход: анализ и прогнозирование международных отношений / под ред. И. Г. Тюлина. – М., 1991. – 311 с.
  3. Ткачук В. Моделювання як метод аналізу політичних процесів / В. Ткачук // Вісник Львівського університету. Серія “Міжнародні відносини”. – 2000. – Вип. 2. – С. 10–15.
  4. Хрусталев М. А. Системное моделирование международных отношений / М. А. Хрусталев. – М., 1987. – 226 с.
  5. Шабров О. Ф. Системный подход и компьютерное моделирование в политологическом исследовании / О. Ф. Шабров // Полис. – 1996. – № 2. – С. 1–4.
  6. Шепелєв М. А. Методологія міжнародних досліджень / М. А. Шепелєв // Теорія міжнародних відносин. – К., 2004. – С. 34–62.

 

 

Лекція 8 «Використання дискриминантного аналізу у політичних дослідженнях»

Ключевым критерием определения различия между странами выступают комплексные индексы, которые формируются на основе тех или иных переменных, включенных в базу данных. В проекте выделяется пять индексов: индекс государственности, индекс внешних и внутренних угроз, индекс потенциала международного влияния, индекс качества жизни, индекс институциональных основ демократии.

Одна из основных проблем определения значений индексов заключается в методике их расчета. Неприемлемым выступает вариант «механического» соединения нормированных переменных и расчет индексов, например, на основе вычисления среднего значения переменных. В этом случае не учитывается то, что переменные потенциально имеют разный вес. Следовательно, результаты расчетов с приданием переменным одинаковых весов были бы некорректными.

В свете этой проблемы требовалась такая методика, которая позволила бы получать индексы с учетом разных весов переменных (параметров). В качестве такой методики был выбран дискриминантный анализ.

іВ статистике дискриминантный анализ используется для выявления того, какие переменные разделяют имеющиеся случаи (у нас – страны) на две и более группы или – какие переменные лучше предсказывают отнесение анализируемых случаев к той или иной группе. Эта процедура в некоторой степени сходна с многомерным дисперсионным анализом (MANOVA). Для двух групп дискриминантный анализ может рассматриваться также как процедура множественной регрессии[1].

Дискриминантный анализ заключается в следующем: на основании так называемой «обучающей выборки» необходимо найти линейную комбинацию весов и исходных параметров, наилучшим образом характеризующих различия между группами стран. Сумма параметров, умноженных на их вес, является дискриминантной функцией. Учет информации, содержащейся в наборе параметров, позволяет значительно улучшить разделимость стран на группы. Коэффициенты (веса) вычисляются так, чтобы максимизировать условное расстояние между группами. В рамках нашего исследования процедура дискриминантного анализа была использована следующим образом.

Индексы предполагают размещение стран в определенном континууме. Этот континуум имеет два полюса – например, страны с высоким качеством жизни и страны с низким качеством жизни. Остальные же страны размещены между этими полюсами. Такую структуру имеет практический любой рейтинг. В рамках нашего анализа подобные полюса выступили теми двумя группами, на которые разбиваются страны. Для проведения подобной процедуры и формируются «обучающие выборки» стран, являющихся эталонами одного и другого полюсов.

Процедура дискриминантного анализа при этом позволяет не только разбить страны на группы, но посредством расчета дискриминантной функции построить рейтинг стран. Кроме того, в рамках этой методики вычисляется вероятность отнесения стран к определенной группе. Ценность вычисления подобной вероятности состоит в том, что мы можем определить те страны, которые однозначно, с вероятностью в 1 принадлежат к одному или другому полюсу. А также те страны, которые составляют «серую зону» - вероятность их отнесения к обеим группам отличается от 0 и 1 (существует ненулевые вероятности отнесения стран в той или другой группе). Такие страны, как правило, сочетают в себе признаки обеих групп.

В качестве примера возьмем индекс институциональных основ демократии. В соответствии с полученным на его основе рейтингом 89 стран с вероятностью очень близкой к единице могут быть отнесены к группе стран с достаточными институциональными основами демократии – от Швейцарии до Лихтенштейна. С другой стороны, 53 страны относятся к этой группе с вероятностью близкой к нулевой – от Центральноафриканской Республики до Мьянмы. Между этими двумя полюсами находятся страны, принадлежащие к «серой зоне», хотя, образно выражаясь, их «серый» цвет может носить разный оттенок. Страны с вероятностью отнесения к каждой из групп, близкой к 0,5 являются наиболее неопределенными или «серыми». В качестве примеров могут служить Нигерия, Кения, Сенегал. Такие страны как Россия, ЮАР, Перу, Турция также находятся в «серой зоне», хотя они и классифицируются как государства с достаточными основаниями демократии, то есть склоняются к первой группе (вероятность отнесения этих стран к первой группе существенно выше, чем вероятность отнесения их ко второй группе). С другой стороны, такие случаи, как Камерун, Зимбабве, Азербайджан и др., классифицируются как страны с недостаточными институциональными основаниями демократии: находясь в «серой зоне» они склоняются ко второй группе[2].

Алгоритм проведения расчета индекса стран методом дискриминантного анализа включает в себя, таким образом, следующие шаги:

Выбор параметров, которые должны составлять тот или иной индекс.

Формирование «обучающей выборки»[3]: исходя из характера индекса, выделяются страны-антагонисты, которые потенциально составляют полюса рассматриваемой проблемы. В обучающую выборку отбиралось приблизительно по 20 стран, принадлежащих к каждому полюсу. Например, в случае индекса потенциала внешнего влияния выделяются страны, которые со всей очевидностью являются наиболее влиятельными, и страны, которые являются наименее влиятельными. В то же время, в обучающую выборку не включались страны с «аномальными» значениями, т.е. обладающие чрезмерно выраженными максимальными или минимальными характеристиками по соответствующему индексу (эти аномалии выявляются диаграммами Бокса-Дженкинса, основанными на статистических критериях). Например, а случае ряда переменных, входящих в индекс качества жизни, к таким аномалиям относится Люксембург, в случае параметров индекса потенциала внешнего влияния – США, с одной стороны, и малые государства (такие как Микронезия, Маршалловы острова и т.п.) – с другой.

Расчет значения дискриминантной функции для каждой страны с учетом весов параметров, а также вероятности принадлежности страны к тому или иному полюсу: принадлежность к странам с относительно высокой или относительно низкой государственностью, относительно высоким или низким потенциалом международного влияния, высокими или низкими угрозами, высоким или низким качеством жизни, достаточными или недостаточными институциональными основами демократии.

На основе значения дискриминантой функции, вычисляемой для страны по каждому из индексов, происходило формирование рейтингов стран по пяти индексам.

Рассмотрим в качестве примера алгоритм расчета индекса качества жизни.

Индекс состоит из семи параметров. Эти параметры берутся из данных международной статистики (ООН, Всемирный Банк и др.): они включают в себя все страны и получены в рамках единых источников. Переменные (параметры) включают в себя: ВВП на душу населения, ожидаемую продолжительность жизни, правительственные расходы на душу населения, детскую смертность до одного года, уровень образования, смертность от передающихся болезней, смертность от несчастных случаев.

Далее формируется обучающая выборка, состоящая из двух групп – стран, являющихся эталоном высокого и низкого качества жизни. На основании параметров стран, образующих обучающую выборку, вся совокупность стран разбивается на две группы, исходя из обозначенных выше переменных. Анализ показывает, что, предсказывая принадлежность стран к той или иной группе, переменные имеют разные веса.

На основе полученной дискриминантной функции и вероятности отнесения стран к той или иной группе, мы получаем следующие результаты: 42 страны могут быть однозначно отнесены к группе стран с высоким качеством жизни, хотя и эти страны существенно отличаются друг от друга: Люксембург получает максимальные 10 баллов, тогда как Венгрия – только 3,80. Далее идет небольшая прослойка стран «серой зоны» от Багамских островов до Панамы, куда входят также некоторые страны ЦВЕ и Латинской Америки. Львиная доля стран относится к группе с низким качеством жизни. Однако низкое качество жизни, например, в Бразилии (2,83 балла), существенно отличается от низкого качества жизни в Замбии (0,29 балла). Сравнивая отдельные страны, исследователь, может оценить, благодаря каким переменным та или иная страна набрала определенный балл.

 

[1] См. об этом такие ресурсы как StatSoft (http://www.statsoft.ru/home/textbook/modules/stdiscan.html), а также следующие издания: Пациорковский В.В., Пациорковская В.В. SPSS для социологов. Москва: ИСЭПН РАН, 2005. Стр. 328-335. Наследов А. SPSS: компьютерный анализ данных в психологии и социальных науках. Санкт-Петербург: Питер, 2005. Стр. 331-351.

[2] Проблема «серой зоны» многократно поднималась на ХХ Всемирном конгрессе Международной ассоциации политической науки в Фукуоке (Япония). По мнению многих участников, исследовательский интерес представляют не столько «чистые» демократии или «чистые» автократии, но страны, сочетающие в себе эти признаки. Проблема заключается в определении этой зоны, и степени сочетания демократических и автократических элементов в каждом конкретном случае. Применяемая процедура позволяет приблизиться к ответу на этот вопрос.

[3] В нашем проекте обучающие выборки стран формировались по итогам серии экспертных семинаров, проведенных на базе МГИМО-Университета и Российской ассоциации политической науки.

 

 



Поделиться:


Последнее изменение этой страницы: 2021-12-15; просмотров: 107; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.115.195 (0.018 с.)