Использование в информационной работе теории вероятностей и математической статистики 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Использование в информационной работе теории вероятностей и математической статистики

Поиск

 

Знание теории вероятностей и тесно связанной с ней математической статистики и умение применить их на практике является одним из самых важных и полезных элементов образования офицера информации. В огромном количестве случаев такие знания окажут неоценимую помощь в информационной работе, оградят от многих ошибок.

Большинство из нас специально не изучало теории вероятностей и математической статистики и либо слабо разбирается в высшей математике, либо вовсе не знакомо с ней. Многие ошибочно считают, что для уяснения теории вероятностей необходимо знание высшей математики, и потому избегают пользоваться ею, так как думают, что это им не под силу.

Для того чтобы рассеять это заблуждение, следует напомнить, что существуют три степени знакомства с теорией вероятностей, каждой из которых достаточно, чтобы с пользой применять эту теорию в нашей работе.

Во-первых, офицер информации может научиться «мыслить категориями теории вероятностей», уяснив смысл примерно двух десятков терминов, например, таких, как вероятность, кривая нормального распределения, среднее значение, медиана, мода, среднее квадратичное отклонение от среднего значения, средняя квадратичная ошибка, случайная ошибка, дисперсия, корреляция, статистическая значимость. Особенно важно понять характер различия между средними величинами, а также такие термины, как дециль, квартиль, ошибки выборочного метода, доверительные пределы и т. д. Таким путем разведчик получит представление о теории вероятностей и сможет здраво судить о соответствующих понятиях, хотя, возможно, никогда он не научится производить вычисления по методу математической статистики.

Во-вторых, он может хорошо разобраться в приведенных выше терминах и научиться производить большинство связанных с ними простых вычислений. Для этого не требуется обладать какими-то специальными математическими знаниями, кроме знания арифметики и элементарной алгебры.

В-третьих, он мог в такой мере раньше изучить или вновь освоить методы математического анализа, логику и математическую статистику, что он становится специалистом в этой области и может справиться с многими трудностями, связанными с применением теории вероятностей в информационной работе.

О том, как приобрести о теории вероятностей знания всех трех степеней, рассказывается в работах, указанных в списке литературы в конце книги.

Назначение настоящей главы можно определить так же, как Морони [69] определил назначение своей книги «Факты из цифр».

 

«В конце концов весь смысл такой книги, как моя, состоит в том, чтобы вызвать интерес к рассматриваемым в ней вопросам. Автор сочтет себя вполне удовлетворенным, если хотя бы некоторые читатели, охотно расстающиеся с автором и его книгой, вместе с тем получат некоторое представление о предмете и захотят поучиться у более опытных наставников, чьи имена указаны в библиографическом списке, являющемся своеобразной книгой почета».

 

(Это высказывание можно в полной мере применить к настоящей книге и ее автору.)

В приводимых ниже выдержках из книги Морони (курсив наш. — В. П.) говорится о том значении, которое имеет математическая статистика для работы с цифровым материалом, а также для проведения исследований в области естественных и общественных наук.

 

«Мы ближе всего подходим к статистике, когда производим в школе приближенные вычисления (к сожалению, развитию таких навыков уделяют все меньше внимания)…

Против чего я выступаю, так это против того, что учителя явно боятся знакомить детей с вопросами, на которые нельзя дать точный ответ. В результате детей плохо готовят к вступлению в реальную жизнь. Сомнительно, чтобы где-нибудь, помимо банка, где клерки пересчитывают грязными руками чужие медяки, точность, на которую способна арифметика, имела какую-либо ценность. Почему нас не обучают элементарным правилам обращения с цифровым материалом, являющимся плотью и кровью нашей повседневной жизни?..

Нет нужды долго раздумывать, чтобы убедиться в том, что в современной жизни вряд ли найдется область, где нельзя было бы с пользой применить, пусть в самой простой форме, научной статистики…

Я обращаюсь к молодежи и говорю: как можно скорее займитесь изучением статистики. Не отказывайтесь от этого по недопониманию ее важности или испугавшись тяжелой умственной работы…

Кем бы вы ни были, если в процессе работы вам приходится истолковывать фактический материал, вы можете обойтись без статистики, но ее незнание отрицательно скажется на результатах вашей работы».

 

В настоящей главе приводится несколько Примеров использования теории вероятностей и математической статистики при решении специальных информационных задач.

 

МЫСЛИТЬ КАТЕГОРИЯМИ ТЕОРИИ ВЕРОЯТНОСТЕЙ

 

«Теория вероятностей является незаменимым подспорьем в практической деятельности. Люди могут обходиться без специального изучения теории вероятностей лишь потому, что они интуитивно чувствуют ее законы».

Рапопорт [70].

 

«У всех нас в голове имеется прибор, учитывающий вероятные явления».

Фридман.

 

Многие явления, с которыми приходится иметь дело офицеру информации, являются только вероятными. Часто информационная работа разведки приносит особенно большую пользу благодаря умелому использованию данных о вероятных явлениях. В свете этих данных можно по-новому осмыслить тот или иной важный вопрос.

«Мышление категориями теории вероятностей» и восприятие мира через призму статистики помогает вырабатывать правильное представление о явлениях, которые мы изучаем, и является ценным методом решения многих задач. Ниже рассматриваются некоторые вопросы, связанные с теорией вероятностей, которые неизбежно должны возникнуть у человека, мыслящего категориями этой теории.

 

Вероятность

 

Офицер информации, мыслящий категориями теории вероятностей, поймет, что степень достоверности различных сведений, с которыми он имеет дело, может колебаться от почти полной достоверности до почти полной недостоверности. В соответствии с теорией вероятностей достоверность выражается как «вероятность=1» (например, можно почти определенно сказать, что завтра взойдет солнце), а недостоверность как «вероятность=0» (например, предположение о том, что данному человеку сегодня на голову упадет метеор, является настолько нереальным, что вероятность этого события, по существу, сводится к нулю).

Офицер информации поймет, что теоретически почти любое явление возможно, и вместе с тем ему будет ясно, что по соображениям практического характера следует заниматься только теми явлениями, которые характеризуются определенной степенью вероятности. Черчилль как-то сказал: «Невозможно вести войну наверняка». Разведчик-исследователь поймет, что люди, которые в своих рассуждениях и размышлениях постоянно опираются на маловероятные явления, выраженные словами «возможно, что…», лишь зря тратят время. В информационной работе не может получить сколько-нибудь широкого применения точка зрения, согласно которой любую проблему можно решить одним махом.

Человек, мыслящий с учетом требований теории вероятностей, всегда критически относится к следующему аргументу, часто выдвигаемому в спорах с целью прийти к соглашению: «В конце концов вся разница сводится к различию в степени». Он понимает, что различие в степени может на практике означать коренное отличие одного явления от другого. Например, предположим, что вы и я иностранцы, прибывшие на корабле в Нью-Йорк. Я высадился на берег, имея пять центов в кармане, вы — тысячу долларов. Мы находимся в одинаковом положении. У нас обоих есть деньги. Различие в нашем положении только в степени, в количестве денег, которыми располагает каждый из нас.

Тот, кто мыслит категориями теории вероятностей, добросовестно использует в работе возможности, связанные с «рассчитанным риском». Он не побоится пойти на разумный риск. С другой стороны, он не обманывает самого себя и других, делая вид, что в работе его нет никакого риска. Он отдает себе полный отчет в степени риска и заранее намечает, что следует предпринять, если имевшиеся опасения подтвердятся на практике. Располагая самым небольшим минимумом знаний в статистике, он может с большой пользой для дела приблизительно определить степень риска.

 

Невероятность

 

Человек, мыслящий с учетом требований теории вероятностей, поймет, что все время случаются совершенно невероятные явления. При игре в бридж, как подсчитал Уивер [72J, вероятность получения при следующей сдаче именно тех карт, которые оказались у вас на руках сейчас, составляет 1: 635 013 599 600. Такова же вероятность получения как посредственных карт, так и карт, состоящих целиком из козырей. Скэрн [71] об этом пишет так:

 

«Прежде всего обнаруживается, что тот факт, что вам вчера поразительно везло при игре в карты… не является таким уж удивительным явлением. При игре в крэпс игрок, поставивший на двух тузов и полагающий, что вероятность появления этих карт при следующей сдаче равна 1: 30, считает себя счастливчиком, если два туза появлялись подряд при четырех сдачах, и он делал ставку на них все четыре раза. Он счел бы себя еще более удачливым, если бы узнал, что вероятность такой сдачи равна 1: 1 679 615… Игроки забывают, что эта степень вероятности выхода данных карт в среднем составляет один раз на 1 679 615 сдач. Они забывают, что в тот вечер, когда несколько раз подряд вышла пара тузов, одновременно проходили тысячи других игр в крэпс и карты сдавались несколько миллионов раз. Более удивительным было бы положение, при котором в какой-нибудь игре не вышла бы пара тузов четыре раза подряд. Тот факт, что эта удача выпала на вашу долю, означает только, что вы принимали участие именно в этой игре».

 

Офицер информации, интересующийся теорией вероятностей, поступит правильно, прочитав небольшую статью Уивера [72], озаглавленную «Вероятность, редкость, интерес, удивление». Прочитав статью, разведчик поймет, почему Уивер противопоставляет стоящие в заголовке слова друг другу. Он пишет:

 

«Все ученые должны интересоваться вероятными явлениями; отнюдь не редко и, безусловно, с удивлением мы обнаруживаем ученых, которых удивляет тот факт, что невероятные явления имеют место. Ученые всегда вправе интересоваться такими явлениями, но лишь в редких случаях эти явления должны вызывать у них удивление».

 

 

Корреляция и совпадение

 

В приведенных выше примерах речь шла о единичных явлениях. При сравнительном изучении двух рядов величин можно высчитать коэффициент корреляции между ними.

Например, на свободном рынке обычно наблюдается большая степень корреляции между размером урожая и рыночными ценами на соответствующую продукцию сельского хозяйства. Часто корреляция привлекает наше внимание к причинно-следственным связям, существующим между изучаемыми двумя рядами величин. В области естественных и общественных наук установление существенной корреляции часто заставляет нас искать возможные связи между явлениями, которые в противном случае могли остаться незамеченными. Это особенно характерно для информационной работы.

С точки зрения разведки весьма близким к корреляции является положение, при котором несколько отдельных явлений весьма точно совпадают во времени. Например, у человека, остановившегося в гостинице, когда он спал, украли пять тысяч долларов. Вскоре после этого случая один из ночных сторожей гостиницы уплатил по закладной за свой дом и начал сорить деньгами. Здесь действуют в соответствии с давно известным принципом: Post hoc, ergo propter hoc («После этого — следовательно, вследствие этого»). Необходимо уяснить, какое значение имеет этот принцип.

Описанные нами три случая в равной мере могут привлечь внимание офицера информации и даже вызвать у него определенные сомнения. Вот эти три случая:

1) корреляция двух рядов событий;

2) совпадение во времени двух или нескольких событий;

3) случай, когда имеет место событие, которое a priori рассматривается как весьма невероятное (как в приведенном примере с картами, сдаваемыми при игре в бридж).

В каждом из трех случаев, естественно, могут иметь место или же могут быть придуманы самые нелепые корреляции. Так, Сэржент [78] пишет, что в северном полушарии существует обратная корреляция между среднемесячной температурой воздуха и количеством букв в названии месяца. Месяцы, содержащие много букв в названии, — декабрь, январь и февраль — холодные. Месяцы с короткими названиями — май, июнь, июль — жаркие. В жизни имеется бессчисленное количество забавных» но бессмысленных случаев корреляций и совпадений.

Вопрос: Каким образом должен офицер информации использовать три указанных случая? Следует ли их игнорировать в связи с имеющими место нелепостями? Или, с другой стороны, должен ли он считать, что они о чем-то свидетельствуют, поскольку данный высокий коэффициент корреляции или данное единичное явление могли случайно иметь место только в одном из ста (или миллиона) случаев?

Ответ: Правильное решение этого вопроса не исчерпывается выбором одного из двух предложенных выше выходов. Если обстоятельства оправдывают работу в данном направлении, офицер информации должен продолжить изучение вопроса.

Корреляция, совпадение или необычное явление сами по себе ничего не доказывают, но они могут привлечь внимание к отдельным вопросам и привести к дополнительному исследованию. Для разведки имеет значение только такое положение, при котором можно установить логическую связь между двумя рядами явлений или двумя совпадающими во времени явлениями либо же дать разумное объяснение какому-либо необычному единичному явлению. Для того чтобы вызвать интерес у разведки, необходимо открыть логическую связь между явлениями или дать им определенное объяснение.

Уайтхед [91] пишет:

 

«Самая распространенная ошибка связана с предположением о том, что в случае, когда проведены длительные и точные математические вычисления, можно с полной уверенностью считать результаты этих вычислений применимыми к какому-либо явлению природы».

 

Таким образом, офицер информации, знакомый с теорией вероятностей, правильно оценивает корреляции с высоким коэффициентом и в высшей степени необычные явления. Он знает, как извлечь ту пользу, которая может в них заключаться. Если данные явления представляют интерес толькоих необычным характером, он не станет зря тратить время на поиски причин, объясняющих, почему они имели место.

 

Распределение и дисперсия

 

Любой группе однородных измеримых величин, таких, например, как рост людей, коэффициент умственного развития, размер заработной платы, свойственно явление дисперсии: некоторые люди имеют высокий рост, другие низкий. Часто мы обнаруживаем, что наряду с существованием отдельных очень низких людей рост подавляющего большинства составляет примерно 1 м 75 см.

Человеку, мыслящему с учетом теории вероятностей, даже если он не знает высшей математики, знакома «кривая нормального распределения», изображенная на рис. 5. На этом рисунке отражена относительная частота повторяемости определенного роста, коэффициента умственного развития и размера заработной платы для любой данной группы явлений. Результаты широкого исследования группы однородных явлений, проведенного выборочным методом, должны графически выразиться в виде кривой, изображенной на рис. 5. Наиболее часто повторяющиеся значения должны сосредоточиваться по обе стороны от линии, изображающей среднее арифметическое значение для данных явлений.

Степень дисперсии может определяться различными путями: путем учета амплитуды, среднего квадратичного отклонения, среднего отклонения, вероятной ошибки и т. д. Соответствующие определения и формулы можно найти в любой книге по математической статистике (см. список литературы в конце книги).

Если результаты изучения частоты повторяемости явлений какой-либо группы изображаются в виде кривой, приведенной на рис. 6, офицер информации может с полным основанием считать, что фактически он изучал не одну, а две различные группы.

 

 

Рис. 5. Кривая нормального распределения. Иллюстрация нормы среднего квадратичного отклонения и среднего значения.

 

Рис. 6. Бимодальная кривая частоты.

 

Офицер информации, познакомившись с теорией вероятностей, поймет, что при изучении фактического материала можно извлечь ценную для разведки информацию с помощью такого «параметра», как среднее квадратичное отклонение. Он поймет также, что извлечь пользу из большого количества цифр, например из тысячи цифр, едва ли удастся, если не применить какой-либо обобщающий показатель — параметр. Помимо параметров, служащих для определения степени дисперсии, имеются параметры, характеризующие срединную тенденцию повторяемости величин данной группы. Самыми важными параметрами такого рода являются среднее арифметическое значение, медиана и мода. Все эти параметры иногда объединяют под общим названием «среднее значение». Эта категория является довольно любопытной В среднем значении получает выражение «лучшее из худшего и худшее из лучшего».

Руководствуясь приобретенным ранее" опытом, офицер информации, однако, никогда не принимает за чистую монету поверхностные рассуждения, основанные на средних значениях. В отчетах компаний часто можно встретить следующие заявления:

«Круг акционеров нашей компании весьма широк. Каждый акционер в среднем имеет 100 акций». У многих создается впечатление, что очень большое количество акционеров имеет примерно по сто акций каждый. Приведенное выше заявление обычно делается со специальной целью создать такое впечатление. В действительности подавляющая масса акций может находиться в руках весьма узкой группы акционеров. Вместе с тем правление компании могло провозгласить о своем намерении превратить рабочих и служащих в собственников компании и продать тысячам рабочих и служащих по 5—25 акций каждому. В результате акции могут распределяться следующим образом:

 

Директор А……………….. 40 000 акций

Директор Б……………….. 25000 акций

Директор В……………….. 20 000 акций

500 рабочих и служащих (по 20 акций у каждого) 10000 акций

500 рабочих и служащих (по 10 акций у каждого) 5 000 акций

 

1003 акционера владеют…………..100 000 акций

В среднем каждый акционер имеет 99,7 акций.

 

Разведчик, знакомый с теорией вероятностей, понимает, что медиана или мода лучше выражают срединную тенденцию повторяемости большого количества величин, чем среднее арифметическое значение.

Пожалуй, нагляднее всего сравнительная характеристика среднего значения, медианы и моды дана на схеме в книге Хаффа [73], воспроизведенной на рис. 7.

 

 

Рис. 7. Среднее значение, медиана, мода.

 

Разведчик, мыслящий с учетом теории вероятностей, понимает, что обычно отдельные величины группируются вокруг определенного среднего значения и по мере удаления от этого среднего значения дисперсия все более и более увеличивается. Он понимает, что величины, наиболее удаленные от среднего значения, могут существенным образом отличаться от основной массы величин данной группы. В каждом конкретном случае он четко указывает, что его интересует прежде всего основная масса величин или крайние для данной группы величины.

Например, разрабатывая курс лекций для студентов, не следует ориентироваться на самых способных или самых слабых студентов. Лекции, которые могут усвоить самые слабые из 200 студентов первого курса, покажутся совершенно неудовлетворительными студентам со средними способностями, составляющими 90 процентов. Точно так же лекции, которые могут заинтересовать двух-трех наиболее способных студентов, не будут усвоены основной массой студентов.

Напротив, при проектировании моста мы исходим из учета максимальной нагрузки. Мост может провалиться под тяжестью максимальной, а не средней нагрузки.

 



Поделиться:


Последнее изменение этой страницы: 2016-04-19; просмотров: 333; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.41.108 (0.015 с.)