Базы и банки данных в исторических исследованиях 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Базы и банки данных в исторических исследованиях



Историческая информатика больше всего внимания уделяет созданию баз и банков данных (БД) для исторических исследований. Эта работа необходима для организации и упорядочения огромного числа первичных данных массовых источников, отработки принципов их хранения и накопления, превращения в постоянно действующий архив МЧД. Здесь можно решать вопросы стандартизации, методики и техники для получения сопоставимых результатов. Огромная подготовительная работа, которую исследователи проводят на начальной стадии своего обращения к массовым источникам, в случае создания постоянно действующего архива МЧД не будет пропадать втуне. Другим историкам, обращающимся к тем же источникам для решения своих задач, приобретенный опыт может оказать несомненную пользу. Сбор и накопление информации создают возможности и для того, чтобы широкий круг исследователей на основе собранных материалов мог решать и свои, стоящие перед ними задачи. Таким образом, создание БД следует рассматривать как важный шаг на пути к синтезу исторической информации, равно как и совершенствование программного обеспечения — систем управления базами данных (СУБД).

Наряду с историками-исследователями проблемами создания информационно-поисковых, справочных автоматизированных систем занимаются работники разного рода хранилищ информации. В нынешней практике управления возникает все больше документов в электронной форме записи. Проблемы их хранения и использования занимают сегодня умы архивных работников, а будущим историкам электронной эры придется уже иметь дело с архивами МЧД на практике.

Очень важно подчеркнуть одно важное обстоятельство, отличающее историков в работе с БД. Если процессы современной информатизации идут как бы вширь и в этом процессе принимают участие практически все общество, то мало кто, кроме историков, заинтересован в разработке БД, обращенных в прошлое, в глубь минувших десятилетий и веков.

Первоначально базы данных в исторических исследованиях создавались тем же путем, что и в других науках. Запись количественных переменных в БД никогда не представляла проблемы, однако содержание массовых источников никогда ими не ограничивается. Запись описательных переменных основывалась на принципах оцифровки и кодирования информации исторических источников, т. е. перевода информации с языка исторических документов, а также материалов социологических, экономических и других исследований на язык стандартной компьютерной обработки. С точки зрения теории информации такое кодирование было способом представления ее разнообразия. Кодирование обычно предусматривало компактные формы записи информации с целью оптимизации ее хранения, поиска, методов анализа. Однако интересы историков заключались прежде всего в выборе таких систем кодирования, которые обеспечили бы наиболее естественное и свободное отображение информации, содержащейся в источниках. Это было обусловлено тем, что историкам приходилось иметь дело с исследованием объектов, характеристики которых заранее не известны, а область значений изучаемых переменных практически невозможно предусмотреть.

Разработка систем кодирования в исторических исследованиях все более превращалась в большую проблему, выливалась в создание специальных книг (макетов) кодирования значений признаков (исторически меняющихся видов производств, занятий, образования, профессиональной подготовки и т. п.), составление словарей, классификаторов, перечней и пр., причем содержание их постоянно расширялось, так как объекты исследования не являлись изолированными по отношению ко всему обществу и требовали дополнительной информации. Но, пожалуй, наибольшая трудность в системе представления данных исторических источников была связана с их неполнотой, отрывочностью, необходимостью постоянного и систематического поиска новых данных и дополнения существующих БД.

Историк, который стремится к изучению индивидуальных, характерных черт общественных систем и процессов, был заинтересован также в расширении круга изучаемых признаков и показателей, ибо это означает, что чем больше их выделяется, тем индивидуальнее и конкретнее предстает исследуемый объект. В исторических исследованиях необходимо было не просто зафиксировать произвольное количество переменных, но и обосновать их выбор, выстроить иерархию, системно упорядочить их относительно друг друга. Сложность состояла и в том, что необходимые переменные не обязательно прямо находили отражение в источнике, а косвенно. Таких косвенных свидетельств в массовых источниках с неупорядоченной структурой очень много.

Но и при работе с массовыми источниками, данные которых были более или менее систематизированы и содержали определенный набор информации, возникало немало проблем. Дело в том, что заданная в источнике структура признаков и показателей не обязательно совпадала с целями и задачами исследования. В этом случае вставал вопрос об отборе необходимых для него переменных. Правда, историк часто заранее не знает, какие именно из них представляют интерес, и на этой почве тоже возникало несколько методологических сложностей и возможных альтернатив в дальнейшей работе.

Еще одной спецификой исторических исследований была необходимость отражать происходящие в обществе изменения. По мнению некоторых авторов, именно это обстоятельство делает позиции историков диаметрально противоположными по отношению к другим общественным наукам и вынуждает их прибегать к описательному методу. Программные средства большей частью рассчитаны на обработку синхронных данных, хотя нигде не разъясняется, что имеется под этим в виду. Очевидно, что получаемые результаты можно распространить только на устойчивые во времени процессы. Создание БД на основе массовых источников, относящихся к определенному моменту времени, а также содержащих ретроспективную информацию, представляло меньше проблем, чем обработка документальных комплексов, растянутых во времени и содержащих диахронные данные. Разницу можно почувствовать при обращении к материалам переписи населения (единовременного обследования) и текущей демографической статистики, которая основана на постоянном и продолжительном учете различных изменений, происходивших в жизни людей от рождения до смерти. Обычно эта проблема решается в рамках создания динамических БД, где время (как правило, год) рассматривается в качестве независимой переменной. Однако создание таких БД представляет значительные источниковедческие трудности, даже если они включают в себя всего несколько показателей общественного развития. Еще больше сложностей возникает при обработке информационно насыщенных документальных комплексов, таких, например, как годовая отчетность промышленных предприятий. Вряд ли можно рассчитывать, что подобные источники когда-либо будут обработаны полностью. Выход находится в определении неких базисных системообразующих структур и создании нескольких БД через определенные интервалы времени, равносильные приемам направленной выборки. К сожалению, в этом случае историк может зафиксировать происшедшие изменения, но не всегда может сказать, почему они произошли. Использование таких БД потребует обращения к другим источникам и органически влечет за собой применение навыков традиционного источниковедения.

Таким образом, при создании БД для исторических исследований явно обозначались специфические черты, которые нужно было учитывать. Только создание компьютеров третьего и последующих поколений и различного рода вспомогательных устройств, связанных с информационным обеспечением исследований, расширение компьютерной памяти, совершенствование систем управления базами данных позволило существенно продвинуться вперед в разработке массовых исторических источников и создавать программные продукты, более приспособленные к ремеслу историка.



Поделиться:


Последнее изменение этой страницы: 2017-02-08; просмотров: 2018; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 44.200.23.133 (0.002 с.)