Назначение и математико-статистические идеи факторного анализа. 
";


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Назначение и математико-статистические идеи факторного анализа.



В настоящее времени факторный анализ является неотъемлемой частью любой серьезной статистической компьютерной программы и входит в основной инструментарий всех наук, имеющих дело с многопараметрическим описанием изучаемых объектов.

Основная идея факторного анализа была сформулирована еще Ф. Гальтоном, основоположником измерений индивидуальных различий. Она сводится к тому, что если несколько признаков, измеренных на группе индивидов, изменяются согласованно, то можно предположить существование одной общей причины этой совместной изменчивости - фактора как скрытой (латентной), непосредственно не доступной измерению переменной.

Таким образом, главная цель факторного анализа – уменьшение размерности исходных данных с целью их экономного описания при условии минимальных потерь исходной информации. Результатом факторного анализа является переход от множества исходных переменных к существенно меньшему числу новых переменных – факторов. Фактор при этом интерпретируется как причина совместной изменчивости нескольких исходных переменных.

Если исходить из предположения о том, что корреляции могут быть объяснены влиянием скрытых причин – факторов, то основное назначение факторного анализа – анализ корреляций множества признаков.

Итак, можно сформулировать основные задачи факторного анализа:

1. Исследование структуры взаимосвязей переменных. В этом случае каждая группировка переменных будет определяться фактором, по которому эти переменные имеют максимальные нагрузки.

2. Идентификация факторов как скрытых (латентных) переменных - причин взаимосвязи исходных переменных.

3. Вычисление значений факторов для испытуемых как новых, интегральных переменных. При этом число факторов существенно меньше числа исходных переменных. В этом смысле факторный анализ решает задачу сокращения количества признаков с минимальными потерями исходной информации.

Модель главных компонент лежит в основе большинства методов факторного анализа и часто рассматривается как один из его самостоятельных вариантов. Анализ главных компонент преобразует набор коррелирующих исходных переменных в другой набор - некоррелирующих переменных. Проще всего понять суть этого метода, привлекая геометрические представления.

Анализ главных компонент можно представить, как преобразование информации, содержащейся в исходных данных. Главную компоненту можно определить, как направление, в котором наблюдается наибольший разброс объектов. Представляя объекты в единицах измерения по этой оси, мы теряем минимум информации об отличии объектов друг от друга. Чем сильнее взаимосвязь двух переменных, тем меньше исходной информации теряется при переходе от двух переменных к одной главной компоненте. Если две переменные не коррелируют, то компоненты (оси) являются равнозначными по информативности, и невозможно определить одну из них как «главную».

Проблемы факторного анализа:

1. Проблема числа факторов. Обычно заранее неизвестно, сколько факторов необходимо и достаточно для представления данного набора переменных. Сама же процедура факторного анализа предполагает предварительное задание числа факторов. Следовательно, исследователь должен заранее определить или оценить их возможное количество.

2. Проблема общности. Проблема общностей заключается в том, что они, как и число факторов, неизвестны до начала анализа, но должны каким-то образом задаваться заранее, так как величины факторных нагрузок зависят от величин общностей.

3. Проблема вращения и интерпретации. Факторная структура может быть представлена в виде точек-признаков в пространстве факторов. Координаты точки – это факторные нагрузки. В результате вращения каждая переменная имеет нагрузку только по одному фактору. По составу переменных производят интерпретацию факторов.

4. Проблема оценки значений факторов. После интерпретации факторной структуры допустима оценка значений факторов для объектов. Проблема состоит в том, что невозможно точно выразить общий фактор через исходные переменные, можно получить лишь оценку с различной надежностью, так как каждая из переменных содержит кроме общей характерную часть.

В заключение обзора математических идей и проблем метода следует отметить, что факторный анализ – сложная, но изящная математическая процедура, имеющая достаточное статистическое обоснование. Факторный анализ не добавляет новой информации к эмпирическим данным, только позволяет их интерпретировать.

 


 

Требования к исходным данным для факторного анализа.

 

Основное требование к исходным данным для факторного анализа – это то, что они должны подчиняться допущению о многомерном нормальном распределении[2] в совокупности. Для проверки этой гипотезы используют тест "сферичности" распределения данных Бартлетта, где оценивается предположение о диагональности матрицы корреляций. Если эта гипотеза не отвергается (т.е. наблюдаемый уровень значимости превышает 5%) – нет смысла в факторном анализе, поскольку направления главных осей случайны. На практике предположение о многомерной нормальности проверить весьма трудно, поэтому факторный анализ чаще всего применяется без такой процедуры, тем более, что ряд исследователей [Лоули, Максвелл, 1967] считает это допущение излишним.

К исходным данным предъявляются следующие требования:

1. в объем выборки должны включаться данные только по однородной совокупности объектов анализа, т.е. одного назначения и класса, используемых (изготавливаемых, функционирующих) в аналогичных условиях по характеру и типу производства, режиму работы, географическому району и т.д. В том случае, когда необходимо увеличить размер матрицы, исходные данные отдельных объектов могут быть приведены в сравнимый вид с большинством объектов по отличающимся признакам путем умножения их на корректирующие коэффициенты;

2. период динамического ряда исходных данных должен быть небольшим, но, по возможности, одинаковым для всех объектов. Устойчивый период упреждения (зона прогноза) обычно в два и более раза меньше периода динамического ряда. Например, по данным за 1985-1995 гг. можно разработать прогноз до 2000г., а в последующие годы по фактическим данным модель должна обновляться (уточняться);

3. исходные данные должны быть качественно однородными, с небольшими интервалами между собой;

4. следует применять одинаковые методы или источники формирования данных. Если динамический ряд имеет крупные структурные сдвиги (например, из-за изменения цен, ассортимента вы­пускаемой продукции, программы ее выпуска и т.д.), то все данные должны быть приведены в сравнимый вид или одинаковые условия;

5. отдельные исходные данные должны быть независимы от предыдущих и последующих наблюдений. Например, наблюдение не должно определяться расчетным путем по предыдущему наблюдению.




Поделиться:


Последнее изменение этой страницы: 2017-02-05; просмотров: 409; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 107.22.56.225 (0.004 с.)