Лабораторная работа 10. Метод наименьших квадратов 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Лабораторная работа 10. Метод наименьших квадратов



В ЛИНЕЙНОЙ МОДЕЛИ ИЗМЕРЕНИЙ

  Предположим, что вектор результатов измерений Y =[ y 1,…, yn ] T имеет следующую структуру:

Y = A Θ+ E,                                                                  (10.1)

где Θ = [ θ 1,…, θr ] T – вектор неизвестных, но вполне определенных параметров, подлежащий оцениванию; A = [ aij ] – известная матрица размерности n × r, rn, имеющая максимально возможный ранг r; E =[ ε 1,…, εn ] T – вектор случайных погрешностей измерений. Предположим, что компоненты вектора E – независимые случайные величины со средним 0 и дисперсией σ 2: ME =0, cov(E)= σ 2 I, где I – единичная матрица. Такая схема связи результатов измерений (откликов) и неизвестных параметров (факторов) называется линейной моделью измерений.

   Будем искать оценку вектора Θ из условия

Такой подход к оцениванию неизвестных параметров называется методом наименьших квадратов (МНК). Найдем производную  по правилам, обсуждавшимся в разд.6, и приравняем ее нулю:

откуда

                                    (10.2)

 Оценка является линейной функцией результатов измерений Y, т.е. случайной величиной. Рассмотрим ее вероятностные характеристики.

Таким образом,  является несмещенной оценкой параметра Θ. Матрица (ATA)-1 является симметричной, поэтому

.

Если вектор случайных погрешностей измерений E является гауссовым,  то как линейная функция гауссового вектора подчиняется r -мерному нормальному закону:

                                                      (10.3)

Если дисперсия σ2 неизвестна, то можно использовать ее несмещенную оценку

                                        (10.4)

которая в гауссовом случае оказывается независимой от .

    В гауссовом случае оценка по МНК является оценкой максимального правдоподобия и, тем самым, обладает целым рядом важнейших свойств эффективности. В негауссовых ситуациях при весьма общих предположениях о законе распределения погрешностей измерений она остается эффективной в классе оценок, линейных по y 1,…, yn, но, например, соотношение (10.3) выполняется лишь асимптотически при    

    Если в модели (10.1) погрешности измерений коррелированны, cov(E) = Σ, где Σ –симметричная невырожденная положительно-определенная матрица (все ее собственные числа строго больше нуля), то обе части (1) можно домножить на Σ-1/2:

                                                       (10.5)

В преобразованной таким образом модели вектор погрешностей Σ-1/2 E по-прежнему имеет среднее 0, но является некоррелированным:

cov(Σ-1/2 E) = M [(Σ-1/2 E) (Σ-1/2 E) T ] = Σ-1/2 M (EET) Σ-1/2 = Σ-1/2Σ Σ-1/2 = I.

Применяя к модели (5) оценку (2), получаем

Оценку называют оценкой Гаусса-Маркова. Преобразование, приводящее к модели (5), называется отбеливанием.

   Замечание. В качестве матрицы Σ-1 в (10.5) часто берут диагональную матрицу, диагональные элементы которой (весовые коэффициенты) отражают степень доверия к тому или иному измерению: чем менее достоверно измерение, тем меньше соответствующий весовой коэффициент.

    Как всякая линейная функция результатов измерений, оценка (10.2) может вычисляться рекуррентно, в реальном масштабе времени, подвергаясь уточнению по мере появления каждого нового измерения. Пусть -оценка (10.2), полученная на основе измерений y 1,…, yk, текущая оценка ее ковариационной матрицы в (3), Ak+ 1- (k +1)-я строка матрицы A, соответствующая измерению yk +1. Тогда

                                     (10.6) 

(рекуррентный МНК). В качестве начального приближения  берется произвольный вектор размерности < r ×1> и, например, матрица uI размерности < r × r > с достаточно большим множителем u.

Примеры

   1. Полиномиальное сглаживание. Результаты измерений yi, проведенных в моменты времени ti, i =1,…, n, приведены в табл. 1. Предполагается, что их можно аппроксимировать полиномом заданной степени r =2. Требуется получить на основе МНК оценки коэффициентов этого полинома.

Таблица 1

ti 0 0.25  0.5 0.75  1 1.25  1.5 1.75 2 2.25 2.5 2.75 3
yi 1.61 0.32 -0.29 0.25 -0.36 0.08 -0.1 0.78 1.22 1.48 1.43 3.16 4.64

 

  Решение. Модель измерений имеет вид

где a 0,…, ar – искомые коэффициенты (r =2). Поскольку речь идет о применении МНК, погрешности ε i можно считать некоррелированными и приближенно нормальными с нулевым средним и дисперсиями, которые, в отсутствие дополнительной информации, естественно считать равными. В матричной форме эти соображения приводят к модели (10.1), где aij = [ ti j ], Θ=[ a 0,…, ar ] T.

Пример выполнения работы

Лабораторная работа 10
clear; clc; t=[0 0.25 0.5 0.75 1 1.25 1.5 1.75 2 2.25 2.5 2.75 3]; y=[1.61 0.32 -0.29 0.25 -0.36 0.08 -0.09 0.78 1.22 1.48 1.43 3.16 4.64]; n=length(t); A(:,1)=ones(n,1); A(:,2)=t'; A(:,3)=t'.^2; teta=inv(A'*A)*A'*y'; y1=polyval([teta(3) teta(2) teta(1)],t); plot(t,y,'*','LineWidth',2); grid; hold on; plot(t,y1,'r','LineWidth',3); title('Аппроксимация полиномом степени 2','FontName','Courier New Cyr','FontSize',14); xlabel('t','FontSize',14); ylabel('y','FontSize',14);

  Замечание. В ИМС MatLab есть готовая процедура-функция p =polifit(t, y, r), решающая задачу аппроксимации пар точек (ti, yi) полиномом степени r, где p – вектор коэффициентов полинома в порядке понижения степени r.

 

Рис.10.1. Полиномиальное сглаживание

 

   2. Оценивание параметров гармонического сигнала. Гармонический сигнал с известной частотой ω и неизвестными амплитудой A и фазой φ измеряется с аддитивной гауссовой ошибкой в моменты времени ti, i =1,…, n. Требуется получить на основе МНК оценки амплитуды и фазы сигнала.

   Решение. Модель измерений yi, i =1,…, n имеет вид

или, в векторной форме, Y = A Θ + E, Y = [ y 1,…, yn ] T,

МНК-оценка вектора Θ получается по формуле (2), оценка дисперсии измерений σ 2 – по формуле (4). Далее,

Задачи для самостоятельного решения

   1. Модель измерений в обычных вероятностных предположениях имеет вид yi = atii, i =1,…, n, a – скалярный параметр, подлежащий оцениванию. Найти МНК- оценку  и ее дисперсию, минимизируя сумму квадратов невязок G (a) и получить тот же результат из общей формулы (10.2).

   2. Построить рекуррентный алгоритм вычисления оценки на основе явной формулы, полученной в задаче 3 и получить тот же результат из общих соотношений (6).

   3. В схеме задачи 10.3 рассматриваются две линейных модели с независимыми погрешностями измерений, имеющими нулевые средние и одинаковые дисперсии σ 2:

yi = atii, i =1,…, n, zj = btii, i =1,…, m,

причем известно, что a + b = c, c – известная постоянная величина. Требуется получить МНК-оценки параметров a, b. Минимизировать общую сумму квадратов невязок G (a, b) при ограничении a + b = c, используя метод неопределенных множителей Лагранжа.

 

ПРИЛОЖЕНИЕ

                 11. Статистические методы в экспертных оценка x

Слова «экспертные оценки» в последнее время приобрели популярность. Одни готовы прибегать к экспертному ме­тоду в случае любого затруднения. Другие считают его вредной выдумкой, мода на которую скоро пройдет.

Такого разнообразия во мнениях не бывает о предме­тах привычных, и можно подумать, что экспертные мето­ды - недавнее изобретение. Это и так, и не так. К мнению специалистов (т. е. экспертов) при решении сложных во­просов обращались всегда, и в этом нет ничего нового. Новым является лишь то, что этому опросу придают зара­нее и тщательно продуманную форму, организуют этот опрос определенным образом.

Традиционный способ знакомства с мнением специалистов - совещание. Его достоинства очевидны - это воз­можность не только высказать мнение, но и аргументи­рованно его защитить или оспорить. В результате реше­ние может быть принято после тщательного обсуждения; это уменьшает возможность ошибок. Но совещание как метод экспертного опро­са имеет свои недостатки: на нем может возобладать мне­ние какого-либо одного участника в силу влияния, которое он может оказать на других - с помощью своего выдаю­щегося красноречия, авторитета, служебного положе­ния и т. п.

Нередко поэтому предпочитают индивидуальный опрос специалистов. Обсуждение прово­дится лишь на последующих стадиях и в ограниченных размерах. Пример такой методики дает широко известный метод «Делфи». Метод был придуман при попытках угадать даты крупных прорывов в области управляе­мого термоядерного синтеза. К сожалению, пока ничего из предсказанного не сбылось. Возможно, это пример не­оправданного расширения сферы приложения метода.

Экспертные методы широко распространены в прак­тике, хотя представляют лишь один из примеров тех задач, в которых источником информации является чело­век. Постоянно проводятся экспертизы по оценке качества потребительских товаров. Судейство неко­торых видов спортивных соревнований (гимнастика, фи­гурное катание на коньках) тоже основано на экспертных методах. Все чаще проводят опросы различных групп населения для выяснения общественного мнения по томуили иному вопросу. Результаты при этом фиксируются не с помощью приборов, а по ответам чело­века  - испытуемого.

Главная особенность человека как источника инфор­мации состоит в том, что он плохо отвечает на вопросы количественного характера и гораздо лучше на вопросы качественного, сравнительного характера. Например, че­ловеку трудно оценить на глаз расстояние до далекого предмета, но гораздо легче сказать, какой из двух пред­метов ближе. Трудно оценить вес камня, но легко сказать, какой из двух камней легче и т. д.

В некоторых случаях количественные характеристики объектов и вовсе невозможны, доступны только качествен­ные. Скажем, из двух образцов пасты для зубов можно выбрать лучший, но очень сложно количественно оценить их достоинства.

Итак, в правильно построенном экспертном опросе по­ступающая информация обычно носит качественный, срав­нительный характер. В каждой экспертизе исследователь, учитывая цели опроса и возможности экспертов, может использовать специальные варианты вопросов. Можно, однако, указать определенный набор наиболее употребительных.

Парные сравнения. Из данной совокупности объектов поочередно выбираются пары объектов. Сравнивая выбран­ные объекты, человек для каждой пары решает, какой из объектов лучше (обладает более ярко выраженным заранее оговоренным свойством). Можно поставить задание и по-иному — попросить испытуемого отвечать на вопрос о сходстве этих объектов; допускаются ответы «похожи», «не похожи». Можно сравнивать выбранные объекты с конт­рольным образцом; задание - указать, который из двух объектов более похож на контрольный, и т. д.

Множественные сравнения. Из совокупности поочеред­но выбираются уже не пары, а наборы из нескольких объек­тов. Задания те же, что и при парном сравнении.

Ранжирование. Все объекты совокупности выстраива­ются по возрастанию (или убыванию) оговоренного при­знака.

Классификация. Вся совокупность объектов разделяется экспертом на несколько классов. Классы могут быть оп­ределены заранее, но могут и формироваться в процессе экспертизы.

Список этот нетрудно продолжить. Вошедшие в него вопросы достаточно просты и потому допускают математи­ческую трактовку. Мы займемся задачей упорядочения, поскольку для ее решения можно использовать уже знакомый аппарат ран­гов. Действительно, при упорядочении каждый объект по­лучает номер, т. е. ранг. Задача состоит в том, чтобы по совокупности данных экспертами упорядочений составить усредненное упорядочение, наиболее близкое к истинному.

Введем необходимые обозначения. Прежде всего, про­извольным образом занумеруем все объекты числами от 1 до п. Этой нумерации будем держаться в дальнейшем. Каждому из экспертов, которых тоже пронумеруем, независимо от других предлагаем упорядочить весь набор объектов. Де­леж мест не допускается. В результате получаем матрицу целых чисел , где ri j  — ранг объекта , данный ему экспертом . Строки этой матрицы, представляющие собой перестановки чисел , будем обозначать символами . Задача состоит в том, чтобы по матрице ‌‌‌ ‌‌ сделать возможно более достоверные выводы об истинном порядке следования объектов.

К ее решению сейчас существуют два подхода. Первый подход предлагает искать компромиссную точку зрения - нечто вроде равнодействующей всех высказанных мнений. Это мнение - в определенном смысле ближайшее к совокуп­ности высказанных. Математическое оформление этого за­мысла составляет содержание первого подхода - алгебраического.

Второй подход имеет статистический характер. Каж­дую данную экспертом ранжировку мы считаем несовер­шенным, искаженным вариантом правильного упорядочения. Ошибки, совершаемые разными экспертами при упорядо­чении, возникают случайно, в том смысле, какой принято придавать этому слову в математической статистике. Не­сколько вольно выражаясь, можно сказать, что при статис­тическом подходе каждого эксперта предлагается рассмат­ривать как некий измерительный «прибор», показания ко­торого сопровождаются случайной ошибкой.

Эта аналогия хотя и полезна, но является довольно да­лекой. Прежде всего «показания эксперта как прибора» имеют не числовой характер, эксперт дает только порядок объек­тов. Закон распределения случайной ошибки изучить довольно трудно, так как почти невозможны неза­висимые повторные измерения - высказавшись однажды о порядке объектов, эксперт едва ли изменит свою точку зрения при повторном опросе.

В дальнейшем нас будет в основном интересовать ста­тистический подход. Но прежде чем перейти к нему, наме­тим кратко линию исследований в алгебраическом подходе. Как уже говорилось, в этом подходе предлагается найти упорядочение, в каком-то смысле ближайшее к набору . Поэтому главной задачей является определе­ние расстояния между двумя перестановками, скажем, А и В.

Английские математики Кемени и Снелл предложили ряд простых и естественных свойств, которым должно удов­летворять любое расстояние между перестановками. Оказалось, что существует лишь одна функция , удовлетворяющая этим свойствам.

Определяется она любопытным образом. Для каждой перестановки определяется матрица, элементами которой служат числа 1 или 0. Элемент матрицы с номером (i, j) равен +1, если ранг объекта i меньше ранга объекта j, т. е. если объект i идет в упорядочении прежде объекта j. В про­тивном случае этот элемент равен 0. Диагональные эле­менты матрицы можно не определять. Обозначим через ‌‌‌‌|| ai j || такую матрицу, построенную по перестановке A, через || bi j ||— по перестановке В. Теперь введенное Кемени и Снеллом расстояние есть

                                              = .                                                (11.1)

Используя это расстояние, можно определить нечто вроде «центра» всех высказанных мнений, выбрав в этом ка­честве такую перестановку, сумма расстояний от которой до всех экспертных перестановок  — наименьшая. Такую перестановку A 0 называют медианой Ке­мени-Снелла. Итак, перестановка A0 называется медиа­ной Кемени-Снелла совокупности перестановок , если

                                                 

Ясно, что вычисление A0 в случае больших т, п представляет значительные вычислительные трудности.

Легко представить себе наглядно, что такое расстоя­ние между перестановками. Пусть буквами a, b, c, d,… обозначены объекты. Будем называть две перестановки со­седями (или соседними), если одна получается из другой переменной порядка двух рядом стоящих объектов. На­пример, соседями являются перестановки abc и bac, dabc и dacb и т. д. В то же время abc и cba соседями не являются, так же как dabc и adcb. Теперь изобразим каждую из n! перестановок точкой пространства. Соседние перестановки соединим отрезками единичной длины. Конструкции такого рода, состоящие из точек, называемых вершинами, и ребер, т. е. соединяющих некоторые точки отрезков, называют графами. В случае n = 3образующуюся конфигурацию - правильный шести­угольник - можно изобразить на плоскости. Для n = 4 объектов получается пространственная фигура — усечен­ный октаэдр. При больших п соответствующие графы нельзя нари­совать без искажений масштаба. Оказывается, расстояние Кемени-Снелла между лю­быми двумя перестановками равно длине кратчайшего пути по соответствующему графу.

Расстояние Кемени-Снелла  тесно связано с ранговым коэффициентом корреляции по Кендаллу; его традиционно обозначают τ:

                                                          .                                    (11.2)                            

Поэтому медиана Кемени—Снелла может определяться и иначе, как такое A0, что

                                                   

т. е. как последовательность A0, в среднем наиболее кор­релированная (по Кендаллу) с совокупностью .

Впрочем, в математической статистике более популя­рен коэффициент ранговой корреляции по Спирмену, тра­диционно обозначаемый ρ. Выберем для ρ форму, наиболее схожую с (11.2). Если   и  две перестановки целых чисел от 1 до п, то

                                           .                            (11.3)

Сумма S (А, В)=  тоже определенным образом выражает различие между перестановками А и В. Теперь последовательность A0, наиболее коррели­рованная по Спирмену с набором перестановок ,   может быть определена так:

                                                    

Оказывается, что соответствующий A0  порядок следования объектов может быть указан явно. Для этого от матрицы рангов || ri j ||‌‌ надо перейти к последовательности средних рангов. . (Здесь ). Объекты упорядо­чиваются в соответствии с порядком средних рангов, т. е. первым ставится объект, имеющий наименьший средний ранг, за ним - имеющий второй по величине средний ранг и т. д. Этот способ упорядочения называют «упорядочением по средним рангам». Практически он наиболее употребите­лен, хотя, прежде, чем применить тот или иной способ обработки, усреднения, полезно убедиться, что собранный статистический материал дает основания для этого действия.

Мы смотрим на данное экспертом упорядочение как на отражение объективной закономерности, как на ее реали­зацию, хотя и несовершенную, содержащую ошибки. Поскольку все экспертные упорядочения отражают одну за­кономерность, между ними в целом и попарно должно на­блюдаться какое-то сходство. Существование такого сход­ства мы хотим выявить предварительным анализом. По­следующая же обработка должна быть направлена на вы­явление той закономерности, которую отражают отдельные упорядочения.

Для измерения сходства двух упорядочений естественно использовать коэффициенты ранговой корреляции. На практике обычно используют коэффициенты Кендалла τ и Спирмена ρ, причем теория в обоих случаях идет па­раллельно.

Происхождение коэффициента ρ легко объяснить. Перепишем ранее данную для ρ формулу (16.3) в виде

                                   .                                  (11.4)                                     

Знаменатель этой дроби является просто другим выраже­нием для сумм

                                .

Величина , которую мы вычитаем из рангов ri, si,, есть среднее арифметическое рангов

                                            .

Следовательно, ρ (A, B) есть просто выборочный коэффициент корреляции, рассчитанной по совокупности   п   пар (ri, si), i =1, …, n.

  Обратим внимание на то, что значение ρ (равно как и τ) не зависит от первоначально выбранной нумерации; оно остается одним и тем же при любой нумерации объектов.

Коэффициент ранговой корреляции ρ был впервые при­менен Спирменом много лет назад, когда он пытался обна­ружить связи между двумя признаками, не допускающими точного количественного выражения. Допустим, речь идет об успехах детей в учебе и спорте. Можно составить два списка учащихся класса, в которых фамилии пойдут в порядке успеваемости и спортивных показателей. Возь­мем за основу нумерацию, данную первым списком. Номе­ра во втором списке окажутся при этом рангами, которые учащиеся получают при упорядочении по второму призна­ку. Если между двумя признаками нет никакой зависи­мости, не будет никакой связи и между номерами в двух списках. Это означает, что в качестве второй нумерации с равными шансами может появиться любая, т. е. вторая ну­мерация окажется чисто случайной по отношению к первой. Распределения коэффициентов ρ и τ в условиях чистой случайности может быть вычислено при малых численностях группы объектов п. В случае ρ для n ≤ 11 и в случае τ для n ≤ 12 имеются таблицы распределения вероятностей тесно связанных с ρ и τ величин. Например, вместо ρ табулировано распределение статистики . Отмеченная выше связь между S и ρ позволяет при необходимости использовать эти данные и для расчета распре­деления ρ.

При больших значениях   n возникает вопрос о подходя­щем приближении для распределения ρ. Доказано, что закон распределения случайной величины  при неограниченном возрастании п стремится к стандартному нормальному. Следовательно, при очень больших п можно пользоваться этой аппроксимацией. Однако при умеренных численностях п нормальная аппроксимация оказывается недостаточной.

Если упорядочения по двум признакам каким-либо образом связаны, коэффициенты ρ и τ обнаруживают тяготение к положительным значениям, если большая выра­женность одного признака сопутствует большему проявле­нию другого, и к отрицательным в противном случае. Про­верку гипотезы об отсутствии связи между двумя призна­ками (о независимости признаков, как еще говорят) можно провести, оценивая значимость отклонения ρ (или τ) от нуля. Если подозревается положительная связь, вычисляют , где ρ *—полученное по наблюденным упорядоче­ниям значение коэффициента Спирмена. Иными словами, вычисляют вероятность получить такое же или большее значение ρ.  Малые вероятности этого события указывают на значимость связи между признаками.

При числе ранжировок более двух независимость призна­ков, т. е. чистая случайность всех нумераций по отношению друг к другу, может быть проверена с помощью пред­ложенного Кендаллом коэффициента конкордации W. Сам Кендалл предложил для W формулу

                                                .                                    (11.5)

Поскольку справедливо неравенство

                                                               ,

знаменатель этой дроби не меньше числителя. Они равны, если все нумерации совпадают. При этом W =1. Если различия между ранжировками велики, суммы рангов ока­жутся более или менее близки друг к другу по величине, и поэтому числитель будет мал по сравнению со знаменате­лем. Коэффициент конкордации будет при этом близок к нулю. Увеличение W от 0 до 1 означает, что согласован­ность между ранжированиями усиливается.

Как обычно, появившаяся в эксперименте значимо от­личающаяся от нуля величина W свидетельствует против гипотезы о чистой случайности.

С выражением, стоящим в знаменателе дроби (16.5), мы уже встречались при обсуждении ρ. Заменяя знаменатель его значением (которое неизменно при всех ранжирова­ниях), получаем для W выражение

                                                 

Конечно, близкое к нулю значение W не доказывает, что признаки независимы. Так, для двух полностью проти­воположных упорядочений W оказывается в точности рав­ным нулю, а коэффициент корреляции | ρ |=1.

Обратим внимание на связь W с парными ко­эффициентами корреляции по Спирмену. Нетрудно доказать, что

                                                      ,

т. е. W есть средний по всей совокупности коэффициент ранговой корреляции по Спирмену.

Аналогичные результаты можно получить и при использовании τ Кендалла. В частности, в качестве меры согласия может употребляться тем же Кендаллом предложенный коэффициент U, очень незначительно отли­чающийся от среднего значения τ:

                                                     .

Максимальное значение U равно 1. Оно достигается при совпадении всех ранжировок. Минимальное значение U, к сожалению, отличается от нуля, хотя и немного. Конечно, вычислять U значительно труднее, чем W. По-видимому, по этой причине он употребляется реже.

Как можно использовать эти величины в экспертном ранжировании? Можно вычислить W по всей совокупности ранжировок, которой мы располагаем. Если эта величина, которую обозначим W *, оказывается близкой к нулю, т. е. если мала , вычисленная в предположении чистой случайности, то переходить к средним рангам (по всей совокупности) нет оснований. По самому определению W средние ранги в этом случае будут мало различаться между собой. Ранжировка, которую они опре­делят в этом случае, окажется неустойчивой - относитель­но небольшие изменения в исходном материале могут силь­но изменить результат.

Причиной того, что выборочное значение W мало и, следовательно, экспертные мнения плохо согласованы, может быть отсутствие объективной основы для сравнения объектов, для их упорядочения. Другой причиной может быть неоднородность экспертной группы, в которой при­сутствуют представители нескольких точек зрения. При механическом сложении различные мнения уравновеши­ваются, и компромиссного упорядочения не находится.

В большинстве случаев на практике выборочные зна­чения W далеко превосходят критические. Как правило, это не приносит особого удовлетворения, так как до всякого опыта мы были убеждены, что тот набор объектов, с кото­рым мы имеем дело, упорядочить можно. Вопрос не в этом, а в том, каков правильный порядок.

В литературе по экспертному оцениванию приходится порой сталкиваться и с такой рекомендацией: для повыше­ния надежности результатов усреднения предварительно выделить из всей группы экспертов более узкую подгруп­пу с высоким коэффициентом W. Усреднение затем произ­водить по этой подгруппе, а не вошедшие в эту подгруппу ранжировки не принимать во внимание, отбросить. Возмож­но, это неплохая рекомендация. К сожалению, научные ос­нования ее довольно туманны, да и вычислительные труд­ности велики.

Кроме упорядочения по средним рангам и медианы Кемени - Снелла, используют и другие методы. В рамках статистического подхода они находят свое объяснение.

Упомянем квантильный метод, в котором экспертная информация представляется особенно наглядно. В этом методе для каждого объекта A (j) строится кривая накопленных частот, и эти кривые далее сравниваются между собой.

  Кривая накопленных частот объекта A (j) строится следующим образом. Сначала подсчитываем, сколько раз при т ранжированиях объект A (j) занимал первое место. Получаем число G 1. Затем подсчитываем, сколько раз объект A (j) занимал место не ниже второго, т. е. сколько раз он был признан первым либо вторым. Получаем число G 2, G 2G 1.. Продолжая этот процесс обычным образом, под­считываем последовательно, сколько раз объект A (j) занимал место не ниже k, k =1, 2, …, n. Получаем последо­вательность чисел G 1, G 2,  …, Gn.

Далее на координатной плоскости отмечаем точки (1, G 1), (2, G 2), …, (k, Gn), …, (n, Gn), которые последовательно соединяем от­резками прямых. Полученную кривую и называем кривой накопленных частот объекта A (j). Окончательное упорядочение с помощью кривых на­копленных частот можно осуществить, пересекая их на каком-либо уровне горизонтальной прямой. Чаще всего выбирают средний уровень .

Статистический подход исходит из представления, что указанная экспертом ранжировка отклоняется от истинной лишь за счет действия случая. При этом у каждой из ранжировок имеется определенная вероятность оказаться выбранной, т. е. появиться в качестве ответа эксперта. Конечно, эти вероятности различны для различных пере­становок. По самому смыслу слова «эксперт» перестановки, более близкие к правильной, должны иметь большую ве­роятность. Далее, чем лучше, квалифицированнее эксперт, тем распределение вероятностей более сконцентрировано около истинной ранжировки. Плохой или, лучше сказать, «никакой» эксперт с равной вероятностью может назвать любое упорядочение. Такое упорядочение иногда назы­вают чисто случайным. Именно для этого случая вычислены распределения уже упомянутых коэф­фициентов ранговых корреляций ρ и τ.

Представление о том, что отступление от истинной, единственно правильной точки зрения происходят лишь случайно, не всегда согласуется с тем, что мы встречаем на практике. Иногда оказывается, что эксперты делятся на две (а то и более) группы, у каждой из которых свое пред­ставление о предмете, свое понятие об истине. В таком случае бессмысленно обрабатывать собранную коллекцию ранжировок как одно целое. Да и сами резуль­таты обработки приобретают неустойчивый характер: не­большие изменения исходного набора, например, исклю­чение нескольких ранжировок или добавление нескольких новых, могут значительно изменить конечный результат (медиану Кемени-Снелла или последовательность средних рангов). Описанная ситуация «нескольких точек зрения» более характерна для опросов общественного мнения, когда по некоторым пунктам нет суждений истинных или ложных, а есть лишь мнения.

Вернемся к экспертному ранжированию и статистиче­скому подходу и поговорим о законах распределения ве­роятностей среди всех n! перестановок. Естественно счи­тать, что правильное упорядочение объектов наиболее ве­роятно. Соседние с правильным упорядочения имеют ве­роятности меньшие, но превосходящие вероятности более дальних соседей, и т. д.

Возьмем произвольную пару объектов, которые обо­значим α и β. Допустим, что в правильной расстановке объект α  предшествует объекту β  (это, конечно, не озна­чает, что там они стоят рядом). Пусть А - какая-нибудь расстановка объектов, в которой α тоже предшествует β. Поменяем α и β местами, не тронув прочие объекты. Рас­становка А перейдет в новую расстановку, которую обоз­начим В. Что можно сказать о сопутствующем изменении вероятностей?

Будем предполагать, что при описанном переходе от А к В вероятность уменьшается. Распределение вероят­ностей, обладающее этим свойством, будем называть моно­тонным. Это свойство очень облегчает поиск правильного упорядочения, однако в каждой конкретной экспертизе наличие свойства мо­нотонности представляет собой предположение, которое может оказаться и ложным. Что можно ска­зать о проверке этого свойства, которая должна бы пред­шествовать его использованию?

Такая проверка неизбежно должна основываться на многократных повторных ранжированиях данного мно­жества объектов одним экспертом, причем ранжирования должны проводиться каждый раз независимо от результа­тов предшествующих, как бы заново. В практических экспертизах, сделать такое едва ли возможно: раз высказавшись, эксперт не изменит свою точку зрения. Получается, что проводить с одним человеком повторные независимые испытания



Поделиться:


Последнее изменение этой страницы: 2020-12-19; просмотров: 322; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.117.216.229 (0.081 с.)