Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Принцип избыточности и принцип разумной достаточности информации

Поиск

С рассмотренными проблемами качества информации тесно связано следующее правило, справедливое для любого исследования и для работы с информацией вообще. Если вы используете только один метод, один источник для получения информации, сведения, полученные вами, могут оказаться односторонними, неполными или попросту недостоверными. Во всяком случае, вы оказываетесь в полной зависимости от источника, не имея возможности проверить его полноту и достоверность

Это положение справедливо не только при информационной работе, организованной по типу исследования, но и при создании информационных ресурсов.

Любой естествоиспытатель знает, что для получения объективной и достоверной информации требуется независимое воспроизведение эксперимента или применение независимых методов. Хотя независимая проверка информации полезна всегда, на практике может оказаться невозможным продублировать канал получения информации в полном объеме. Отметим, однако, что в некоторых случаях проверка при помощи независимых методов или источников особенно важна. Это, в частности, ситуации, в которых вы:

- располагаете сведениями, которые с трудом вписываются в общую картину, или фактами, противоречащими друг другу;

- работаете в малознакомой предметной области;

- работаете в ситуации острого конфликта.

В реальной ситуации, однако, свои усилия по сбору информации приходится ограничивать “в ширину” — с точки зрения круга источников или методов, и “в глубину” — с точки зрения степени детализации, глубины проработки вопроса. Иначе информационный поиск, будучи увлекательным занятием, способен затянуться навечно. Естественным ограничителем здесь должен служить принцип разумной достаточности — достаточности с точки зрения поставленной цели. Успех всей информационной работы существенным образом зависит от нахождения правильного баланса между принципами избыточности и разумной достаточности.

Обработка и систематизация информации

Следующим этапом информационной работы является обработка и систематизация собранных сведений. Некоторые типы информации требуют специальных процедур ее обработки. Наиболее характерный пример — статистическая обработка количественных данных. Мы отделяем этап обработки информации от интерпретации, которая является процессом гораздо более неформальным, часто имеет дело с разнородными сведениями из различных источников. Данные, которые возникают в результате обработки, являются исходными для интерпретации. Результатом интерпретации, в свою очередь, являются выводы содержательного характера. Подходы к обработке специфичны для конкретных типов информации, и здесь мы не будем подробно останавливаться на этих вопросах.

Содержанием этого этапа, общим практически для всех типов информации, является ее тщательное документирование и (или) систематизация. Систематизация результатов — важный элемент информационной работы. Он предполагает организацию вашей информации в виде, удобном для работы, хранения и последующего обращения к ней. Это может быть компьютерная база данных, систематически организованная подборка литературы или просто таблица, содержащая результаты вашего собственного исследования. Именно на этом этапе, например, переносится из полевого журнала в таблицы результаты измерений, выполненных непосредственно в поле. В результате этого этапа информация должна быть организована таким образом, чтобы обратиться к ней можно было через некоторое, возможно, весьма продолжительное время.

Эффективная систематизация информации особенно важна в случае создания информационных ресурсов открытого доступа, которые будут использоваться широкой аудиторией в разнообразных целях. Продуманная классификация предметных областей при создании библиотеки, схема описания направлений деятельности в базе данных по организациям способны значительно облегчить поиск нужной информации. Более того, подобные схемы необходимы и для создателей ресурса как при его формировании, так и при дальнейшем поддержании, корректировке, обновлении и т.п. Так, например, если схема описания направлений деятельности организаций, в основном, выработана еще до начала сбора информации, это значительно облегчает формирование информационного ресурса, использование стандартных анкет при сборе информации и т.п. Отметим, что разработка качественной классификации нередко представляет собой сложную, трудоемкую задачу. Поэтому прежде, чем приступать к созданию собственной системы, полезно изучить классификации, уже существующие в данной области и, возможно, использовать одну из них. Это не только сэкономит ваши усилия, но и облегчит в дальнейшем обмен информацией с теми, кто применяет эту классификацию.

 

 

36.

Корреляционный и Регрессионный анализ

Корреляционный анализ

При изучении корреляций стараются установить, существует ли какая-то связь между двумя показателями в одной выборке (например, между ростом и весом детей или между уровнем IQ и школьной успеваемостью) либо между двумя различными выборками (например, при сравнении пар близнецов), и если эта связь существует, то сопровождается ли увеличение одного показателя возрастанием (положительная корреляция) или уменьшением (отрицательная корреляция) другого.

Иными словами, корреляционный анализ помогает установить, можно ли предсказывать возможные значения одного показателя, зная величину другого.

До сих пор при анализе результатов нашего опыта по изучению действия марихуаны мы сознательно игнорировали такой показатель, как время реакции. Между тем было бы интересно проверить, существует ли связь между эффективностью реакций и их быстротой. Это позволило бы, например, утверждать, что чем человек медлительнее, тем точнее и эффективнее будут его действия и наоборот.

С этой целью можно использовать два разных способа: параметрический метод расчета коэффициента Браве-Пирсона (r) и вычисление коэффициента корреляции рангов Спирмена (rs), который применяется к порядковым данным, т.е. является непараметрическим. Однако разберемся сначала в том, что такое коэффициент корреляции.

Коэффициент корреляции — это величина, которая может варьировать в пределах от +1 до -1. В случае полной положительной корреляции этот коэффициент равен плюс 1, а при полной отрицательной — минус 1. На графике этому соответствует прямая линия, проходящая через точки пересечения значений каждой пары данных:

В гуманитарных науках корреляция считается сильной, если ее коэффициент выше 0,60; если же он превышает 0,90, то корреляция считается очень сильной. Однако для того, чтобы можно было делать выводы о связях между переменными, большое значение имеет объем выборки: чем выборка больше, тем достовернее величина полученного коэффициента корреляции. Существуют таблицы с критическими значениями коэффициента корреляции Браве-Пирсона и Спирмена для разного числа степеней свободы (оно равно числу пар за вычетом 2, т. е. n-2). Лишь в том случае, если коэффициенты корреляции больше этих критических значений, они могут считаться достоверными. Так, для того чтобы коэффициент корреляции 0,70 был достоверным, в анализ должно быть взято не меньше 8 пар данных (h=n-2=6) при вычислении r и 7 пар данных (h=n-2=5) при вычислении.

Регрессионный анализ

– статистический метод, используемый для исследования отношений между двумя величинами.

Регрессия в математической статистике – зависимость среднего значения одной величины (y) от другой величины (или нескольких величин) x. В отличие от строгой функциональной зависимости y = f(x) в регрессионной модели одному и тому же значению величины x могут соответствовать несколько значений величины y, иными словами, при фиксированном значении x величина y имеет некоторое случайное распределение.

Регрессионный анализ используется для определения общего вида уравнения регрессии (наиболее часто используется линейная модель), оценки параметров этого уравнения, а также проверки различных статистических гипотез относительно регрессии.

Регрессионная модель основана на предположении о том, что величина x является контролируемой величиной, значения которой задаются во время эксперимента, а величина y является наблюдаемой в ходе эксперимента.

В аналитической химии линейный регрессионный анализ используется при построении градуировочной модели. В качестве величины x выбирается содержание определяемого компонента (которое является установленной величиной для серии образцов сравнения), а в качестве наблюдаемой величины y выступает аналитический сигнал, который подчиняется случайному распределению.

Необходимо отметить, что в том случае, если величина x также является случайной, то для изучения связи между величинами используются методы корреляционного анализа.

В аналитической химии также применяется множественный регрессионный анализ - при исследовании многомерных зависимостей (например, при построении многокомпонентной градуировки и т.д.)

 

31.

Интерпретация информации

Итак, необходимые цифры или факты добросовестно собраны, результаты измерений аккуратно обработаны и сведены в таблицы. Собраны и упорядочены выписки из литературных источников, копии статей. Следующий этап работы — интерпретация собранной информации. Интерпретация представляет собой заключительную стадию собственно информационного исследования. Далее следует уже практическое использование полученной информации — подготовка конкретных материалов, их распространение, организация конкретных действий.

Установить смысл, значение собранной информации — фактов, цифр, документов — в этом и состоит задача интерпретации. Без этого информация не может служить основой для принятия решений, практических действий. Любой отдельный факт — лишь фрагмент общей картины, а осмысленные решения, как правило, могут приниматься на основании картины в целом. Именно на этапе интерпретации ранее собранные фрагменты должны сложиться воедино. Для этого необходимо правильно соотнести собранные сведения и, возможно, понять, какой еще информации не хватает.

Эта стадия информационной работы наиболее трудно поддается формализации. Именно здесь требуется, вероятно, наибольшее напряжение творческой энергии, привлечение знаний и опыта, накопленных в ходе предшествующей работы. И именно на этой стадии часто допускаются существенные ошибки, которые могут свести на нет все ваши усилия.

Процесс интерпретации, являясь центральным, узловым моментом информационной работы, нередко заставляет возвращаться к этапам сбора и обработки информации, чтобы добавить недостающие фрагменты картины. Это возвращение может иметь форму короткого обращения к справочнику, но может и потребовать большой дополнительной работы. Например, собрав воедино доступную информацию о качестве воды в реке из государственных источников, вы можете обнаружить в ходе интерпретации, что ее недостаточно для ответа на интересующие вас вопросы. Поэтому вам придется самостоятельно организовывать программу наблюдений.

Для того, чтобы раскрыть смысл полученных величин, их полезно сопоставить с аналогами разного рода — с региональным фоном, с величинами, наблюдавшимися в аналогичных ситуациях (городах, природных комплексах и т.д.). Также следует соотнести реальные результаты с теми, получить которые вы ожидали, и попытаться объяснить расхождение, если таковое обнаружится. Полезно сопоставить результаты с аналогичными значениями для прошлых лет (при наличии соответствующих данных). Это поможет увидеть тенденции изменения ситуации. Особое внимание следует уделить тем фактам или величинам, которые не находят объяснения в рамках построенной картины. Такие факты могут указывать как на ошибки, допущенные при измерениях, так и на наличие “неучтенных” или “переоцененных” факторов воздействия.

Как и систематизацию, интерпретацию, по возможности, следует начинать параллельно со сбором информации. Как уже отмечалось, интерпретация может показать недостаточность собранных сведений, заставив вернуться к предыдущим этапам работы с информацией. Кроме того, для интерпретации может потребоваться знание каких-либо дополнительных обстоятельств или деталей, важность которых трудно предвидеть во время сбора информации.

 


10.



Поделиться:


Последнее изменение этой страницы: 2016-08-14; просмотров: 374; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.188.154.238 (0.019 с.)