Разработка методики построения классификатора 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Разработка методики построения классификатора



Рис. 4.5. Схема процесса разработки классификатора

На первом этапе «Разработка ТЗ на проектирование» выполняются две работы. Первая из них связана с определением состава, назначения и сферы действия классификаторов, исполь­зуемых в системе. Перечень классификаторов определяется на ос­нове анализа реквизитного состава первичных и результатных до­кументов и выделения всей совокупности реквизитов-признаков.

Далее определяют назначение классификаторов. Каждый клас­сификатор может быть предназначен для однозначной иденти­фикации объекта, передачи информации на расстояние по кана­лам связи или для поиска и логической обработки первичной информации с целью получения и выдачи результатной инфор­мации.

По сфере действия выделяют следующие виды классификато­ров: международные, общегосударственные (общесистемные), отраслевые и локальные классификаторы.

Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязатель­ны для передачи информации между организациями разных стран мирового сообщества. СМЭС представляет собой множество стандартных решений по классификационным группировкам и кодированию специальной и экономической информации и фор­мированию источников этой информации. В состав СМЭС вхо­дят классификации Организации Объединенных наций (ООН) и ее специализированных образований, в том числе:

• Международная стандартная отраслевая классификация всех видов экономической деятельности (МСОК);

• Классификация основных продуктов (КОП);

• Международная стандартная торговая классификация (МСТК);

• Классификация по широким экономическим категориям (КШЭК);

• Классификация функций органов управления (КФОУ);

• Классификация функций правительства;

• Классификации продовольственных и сельскохозяйственных организаций (РАО);

• Классификации международной организации труда (МОТ);

• Классификации ООН по вопросам образования, науки и куль­туры (ЮНЕСКО);

• Международная стандартная классификация образования

(МСКО).

К числу классификаций, разработанных другими международ­ными организациями, относятся:

• Классификация международного энергетического агентства

(МЭА);

• Классификация Совета таможенного сотрудничества;

• Система описания и кодирования товаров;

• Классификация Всемирной туристической организации (ВТО);

• Классификация деятельности, связанной с туризмом.

К классификациям Европейского сообщества и других меж­дународных региональных организаций относят:

• Классификацию Европейского сообщества (ЕС);

• Общую отраслевую классификацию экономической деятель­ности в рамках ЕС (КДЕС) и другие.

Второй класс классификаторов образуют общегосударствен­ные (общесистемные) классификаторы, обязательные для орга­низации процессов передачи и обработки информации между экономическими системами государственного уровня внутри страны, состав которых будет рассмотрен в следующем разделе.

Для выполнения процедур обработки информации и переда­чи ее между организациями внутри отрасли используют отрас­левые классификаторы. В пределах отдельных предприятий ис­пользуют, как правило, локальные классификаторы.

Выполнение работ второго этапа связано с определени­ем состава исходных данных и требований к разрабатываемым классификаторам.

К исходным данным, используемым в процессе проектирова­ния классификаторов, относятся:

• состав задач, для которых разрабатывается классификатор;

• состав объектов классификации и мощность исходного мно­жества;

• состав признаков классификации и число значений каждого

признака;

• наименования отдельных группировок и объектов;

• динамика процесса изменяемости состава задач, объектов и признаков.

К требованиям, которым должны удовлетворять разрабаты­ваемые классификаторы, можно отнести:

• полноту охвата объектов и признаков классификации каждым классификатором;

• согласованность признаков деления множеств объектов с ал­горитмами обработки экономической информации;

• взаимную однозначность наименовании объектов и их кодо­вых обозначений;

• простоту кодирования и возможность автоматизации класси­фикации и кодирования;

• возможность увязки с другими классификаторами и система­ми обозначений;

• эффективность использования классификатора при обработ­ке информации.

Содержанием второго этапа является «Разработка ме­тодических материалов проектирования», которая включает преж­де всего разработку основных критериев и принципов построения каждого классификатора. К критериям построения классифика­тора относятся такие, как:

• критерий отнесения того или иного объекта к конкретному классифицируемому множеству;

• степень охвата кодируемого множества объектов.

Принципы построения классификатора определяются струк­турой классификатора, т.е. количеством ветвей, выходящих из каждой классификационной группировки, количеством ступеней и числом уровней классификации. Классификатор считается од­нородным, если на каждой ступени из каждой классификацион­ной группировки выходит одинаковое количество ветвей.

Кроме того, на этом этапе разрабатывается система взаимо­действия классификаторов разных уровней, предназначенных обес­печивать взаимодействие ЭИС с внешней средой. Эта работа пред­ставляет собой разработку некоторого транслятора перехода от одного классификатора к другому. Но чтобы его создать, необхо­димо провести выбор некоторой системы взаимодействия различ­ных классификаторов, ориентированных на некоторую номенкла­туру объектов. Существуют следующие системы взаимодействия:

а) система равноправных классификаторов, характеризуется тем, что на каждом уровне управления для целей обработки ин­формации используется свой локальный классификатор, а для получения или передачи информации из внешней среды исполь­зуется соответствующий транслятор. Недостаток данной системы заключается в том, что та система, которая имеет на входе наибольшее количество потоков информации от различных орга­низаций, должна иметь наибольшее количество трансляторов;

б) система приоритетных классификаторов, применяется для предприятий одной отрасли. При этой системе на каждом пред­приятии этой отрасли и на каждом уровне управления имеются локальные классификаторы. Обмен информацией осуществляет­ся в терминах классификатора вышестоящего уровня. Эта систе­ма дает уменьшение количества трансляторов независимо от чис­ла входных и выходных потоков. Однако трудности возникают при передаче потоков информации между предприятиями, отно­сящимися к разным отраслям;

в) система классификаторов-посредников, применяется при межотраслевом управлении. На каждом объекте любого уровня управления обработка ведется в терминах своего локального клас­сификатора, а обмен - в терминах одного классификатора-посред­ника. Преимущества такой системы заключаются в необходимо­сти создания только одного транслятора для каждого предприя­тия и в обеспечении возможности централизованного ведения классификатора-посредника, что дает минимальное количество ошибок при кодировании информации и обеспечивает информа­ционную совместимость ЭИС разных уровней;

г) система единого классификатора, для обработки информа­ции на всех предприятиях, входящих в состав экономической макросистемы, и для передачи этой информации между ними возможна только гипотетически, но реально ее нельзя осуще­ствить из-за необходимости кодирования всей информации, су­ществующей в стране, используя очень громоздкие классифика­торы.

К факторам, влияющим на выбор способа увязки классифи­катора, относятся следующие:

• объем и характер обрабатываемой информации;

• объем и характер потоков получаемой и передаваемой инфор­мации;

• минимум трудовых и стоимостных затрат на разработку и эк­сплуатацию системы ведения классификаторов.

На этом же этапе осуществляется разработка методик пост­роения классификаторов, отражающих методы и последователь­ность выполнения отдельных операций по созданию классифи­каторов, содержание которых зависит от выбранных критериев и принципов их построения.

Третий этап связан с работами по организации сбора и обработки исходных данных, необходимых для составления клас­сификаторов. К их числу относится разработка инструктивных материалов по сбору и обработке исходных данных:

• определение перечня решаемых задач, использующих класси­фикаторы;

• выделение классифицируемых объектов;

• определение состава признаков классификации и значений признаков;

• осуществление лингвистической обработки этих данных (уда­ление синонимов, омонимов, полисемии, антонимов и др.);

• согласование используемой терминологии в исходных данных

с ГОСТами.

Другой работой, которую выполняют на этом этапе, являются сбор и обработка данных согласно разработанным инструкциям.

На четвертом этапе «Составление классификаторов и системы их ведения» осуществляется построение эталонной и ра­бочей формы классификатора и системы ведения классифика­тора.

Эталонный классификатор должен быть согласован, отпеча­тан типографским способом и распространен всем пользовате­лям для кодирования информации первичных документов.

Рабочие классификаторы наносятся на машинные носители в необходимых разрезах, передаются пользователям и заносятся в файлы справочников баз данных для выполнения процедуры автоматического заполнения машинных форм первичных доку­ментов и для декодирования результатной информации, получа­емой после ее обработки.

К задачам, решаемым системой ведения классификатора, от­носятся:

• актуализация классификатора, т.е. постоянное пополнение и изменение объектов классификации и кодирования;

• своевременное оповещение всех пользователей о всех проис­ходящих изменениях;

• реструктуризация, или пересмотр структуры классификато­ра, при котором осуществляются контроль за дублировани­ем объектов классификации, контроль и выявление тупико­вых ветвей, не ведущих к объекту, оптимизация резервных ветвей по всем уровням иерархии или по всем аспектам клас­сификации;

К проблемам, связанным с проектированием системы веде­ния классификаторов, относятся:

• разработка организационной структуры системы ведения, т.е. службы, которая отвечает за пополнение классифика­торов;

• разработка юридических основ внесения изменений в класси­фикатор;

• разработка информационного и программного обеспечения системы.

Все работы по проектированию классификаторов заканчи­ваются экспериментальной проверкой и внесением коррективов, утверждением, изданием и рассылкой классификаторов всем пользователям в функциональные подсистемы.

 

4.4 Понятие Единой системы

классификации и кодирования (ЕСКК)

Для обеспечения информационной совместимости ЭИС раз­ных уровней разработана Единая система классификации и коди­рования (ЕСКК). ЕСКК предназначена для выполнения следую­щих функций:

• централизованной разработки общесистемных (общегосудар­ственных) классификаторов;

• пополнения и обновления, своевременного и систематического оповещения организаций обо всех изменениях, внесенных в классификаторы;

• ответов на разовые запросы;

• оптимизации структуры классификаторов;

• проведения работы по созданию информационно-поисковых языков.

Схема структуры ЕСКК приведена на рис. 4.6. В состав ЕСКК входят три составные части. Первая ее часть «Комплекс нормативно-технических и методологических материалов» включает в себя документы, которые регламенти­руют:

• состав системы, цели системы, задачи и всю используемую тер­минологию системы;

• принципы и методы классификации и кодирования;

• категории и сферы действия классификаторов;

Рис. 4.6. Схема структуры ЕСКК

• принципы сопряжения и взаимодействия классификаторов;

• структуру работ по созданию и внедрению системы.

Второй частью является «Комплекс общесистемных клас­сификаторов (ОК)», в который входят следующие группы класси­фикаторов:

1. Классификаторы о природных и трудовых ресурсах:

• профессии рабочих;

• должности служащих;

• кадров;

• специальностей;

• полезных ископаемых и т.д.

2. Классификаторы о продуктах труда и производственной деятельности:

• промышленной и сельскохозяйственной продукции;

• строительной продукции;

• деталей;

• услуг: в промышленности, строительстве, сельском хозяйстве, транспорте, материально-техническом снабжении;

• услуг населению.

3. Классификаторы структуры народного хозяйства и объек­тов административно-территориального деления:

• предприятий и организации;

• отраслей народного хозяйства;

• стран;

• органов государственного управления;

• объектов административно-территориального деления;

• пунктов погрузки и разгрузки.

4. Классификаторы управленческой информации и докумен­тации:

• единиц измерения;

• технико-экономических показателей;

• управленческой документации;

• технической документации, обозначений стандартных и тех­нических условий;

• технологической документации;

• операций и деталей.

Все общесистемные классификаторы в зависимости от исполь­зуемой системы классификации в процессе их проектирования построены по двум принципам.

Первый принцип основывается на идентификации объектов внутри классификационных группировок. Для примера рассмотрим структуру Общесистемного классификатора промыш­ленной и сельскохозяйственной продукции (ОКП), который осно­вывается на использовании иерархической системы классифика­ции и состоит из двух блоков: блока наименования и блока иденти­фикации. Блок идентификации состоит из классификационной, регистрационной и контрольной части кода (рис. 4.7). Классифи­кационная часть включает группировки по следующим призна­кам:

• класс;

• подкласс;

• группа;

• подгруппа;

• вид.

Рис. 4.7. Схема структуры ОКП

Второй принцип основан на применении раздельной идентификации и классификации и фасетной системе классифика­ции, что отражается в структурной формуле классификатора, ко­торая включает три блока: идентификации, классификации и наи­менования. Для примера рассмотрим структуру Общесистемно­го классификатора предприятий и организаций (ОКПО). Этот классификатор основан на использовании фасетной системы клас­сификации. Он состоит из трех блоков (рис. 4.8):

1) блока идентификации, включающего в себя код отрасли, регистрационный номер предприятия и контрольную часть кода;

2) блока наименования;

3) блока классификации, состоящего из следующих фасетов:

• фасета подчиненности - Ф1, в котором можно выделить при­знаки: код министерства, код управления, код треста;

• фасета административно-территориальной принадлежности -Ф2;

• фасета отраслевой принадлежности - ФЗ.

В составе автоматизированной системы ведения общесистем­ных классификаторов (АСВОК) можно выделить три типа под­систем: объектные, функциональные и обеспечивающие.

 

Рис. 4.8. Схема структуры ОКПО

Объектные подсистемы объединяют предприятия, отрасли, отраслевые институты, которые отвечают за передачу информа­ции об изменениях, происходящих в заданной номенклатуре, чис­ло которых может быть равно числу общесистемных классифи­каторов.

Функциональные подсистемы объединяют однотипные техно­логические процессы по ведению общесистемных классификато­ров и включают в свои состав подсистемы сбора, хранения, вне­сение коррективов; регулярного обслуживания абонентов; обслу­живания по разовым запросам; развития АСВОК, включая оптимизацию структуры классификаторов, устранение недействи­тельных ветвей классификаторов, стандартизацию терминологии.

Обеспечивающие подсистемы состоят из типового набора под­систем, к которым относят программное, техническое, информа­ционное и лингвистическое обеспечение.

В состав информационного обеспечения АСВОК входят: тезаурус; сводные эталонные файлы классификаторов; дополни­тельные эталонные файлы дополнений и исключаемых позиций; файлы поисковых образов позиций классификаторов; файлы не­занятых позиций; таблицы сопряжения классификаторов; вспо­могательный файл организаций, ответственных за ведение клас­сификаторов; таблицы периодичности оповещения организаций и вспомогательные файлы интересов абонентов.

4.5 Технология использования штрихового кодирования экономической информации

Развитие международных торговых и производственных свя­зей приводит к росту товарных /информационных потоков, ко­торые необходимо обрабатывать в условиях территориальной разбросанности производителей и потребителей продукции. Трудности учета информации о свойствах товара на его упаков­ке, наличие неточностей в сопровождающей его документации, отсутствие достоверной и своевременной информации у постав­щиков продукции о поступлении товара к покупателю вызывают необходимость автоматизации маркировки товаров, считывания информации и осуществления идентификации о них. Целью штри­хового кодирования является отражение основных информаци­онных характеристик товара в штрих-кодах, которые обеспечи­вают реальную возможность проследить за их движением к по­требителю, что дает повышение эффективности управления про­изводством.

Технология штрихового кодирования предназначена для осу­ществления автоматизированной записи, считывания и иденти­фикации информации об объектах или деловых процессах [2, б]. Эта технология основана на использовании двоичного кода для записи и запоминания, предварительно разработанных смысло­вых кодов в виде последовательностей, состоящих из нулей и еди­ниц, отраженных кодированными штрихами. Поэтому штрихо­вой код - это последовательность чередования широких и узких, темных и светлых полос, которым присвоены логические значе­ния 1 и 0 (широким линиям и широким промежуткам присваива­ется логическое значение 1, узким - 0).

В различных странах мира применяют три системы штрихо­вого кодирования:

UPC - универсальный товарный код, разработанный в США и применяемый в странах Америки;

EAN - товарный код, созданный в ЕС на базе UPC, соответ­ствующий названию Европейской ассоциации товарной нумера­ции, получившей в настоящее время статус Международной орга­низации (EAN International);

UCC/EAN - единый стандартизированный штриховой код, созданный организациями США и Канады (Uniform Code Council) и EAN International.

Коды типа EAN и UCC/EAN широко применяются во всех странах мира, включая Российскую Федерацию.

В каждой системе существуют свои виды кодов: UPC-12, EAN-8, EAN-13, EAN-14, UCC/EAN-128 (Code 39).

UPC-12 - это двенадцатиразрядный код, имеющий следую­щую структуру:

Ф = [X]: [ХХХХХ]: [ХХХХХ]: [К]

 

EAN-8 - восьмиразрядный код, который используется для ' кодирования малогабаритных упаковок, имеющий структуру:

EAN-13 - тринадцатиразрядный код, используемый для ко­дирования продукции, имеющий следующую структуру:

EAN-14 - четырнадцатиразрядный код с прямоугольным кон­туром, используемый для идентификации транспортной упаков­ки и имеющий такую же структуру, что и код EAN-13, но включа­ющий дополнительный первый разряд, предназначенный для кодирования от 1-й до 8-й специфики упаковки (например, 1 отра­жает групповую упаковку, 2 - упаковку партий в контейнер и т.д.).

Code 39 может варьироваться до 40 разрядов и не имеет фик­сированной длины. Этот код получил свое название по сочетае­мости трех широких элементов и шести узких в каждом знаке кода. Для отображения кода используются 43 символа, включая про­писные буквы, цифры от 0 до 9 и семь особых знаков (-.$/+% пробел).

UCC/EAN-128 является современной версией кода Code 39, используемого для описания полной характеристики предмета поставки, не имеющего фиксированной длины и позволяющего комбинировать использование различных систем кодирования. В структуре кода можно выделить пробелы между компонента­ми кода, стартовый знак, обеспечивающий использование наи­более полного набора знаков, знак функции, позволяющий авто­матически контролировать отличие символики кода от других символик, данные и контрольное число.

Применение штриховых кодов UPC-12, EAN-8, EAN-13, EAN-14 регулируется международными и национальными орга­низациями. В Российской Федерации такой организацией явля­ется Ассоциация автоматической идентификации, в состав кото­рой входит более 2000 членов. Эта организация устанавливает номера предприятий в кодах EAN-13 и EAN-14 и коды продуктов в коде EAN-8. Код страны присваивается EAN International. Использование кодов UCC/EAN-128 (Code 39) регулируется со­ответствующими международными и национальными стандар­тами.

Использование штриховых кодов обеспечивает совместную деятельность производителей и потребителей товаров на едином товарном рынке по всей цепочке взаимосвязанных партнеров. Эта технология предоставляет защиту продукции путем ее оператив­ного учета, управление потоками информации о передвижении и использовании продукции, поиск сведений об этих процессах по запросу или в реальном масштабе времени на основе идентифи­кации любого объекта, принимающего участие в этом процессе. Кроме того, эта технология ускоряет обмен информацией как внутри организации, так и между организациями с помощью ме­тодов и средств электронного обмена данными (ЭОД).

Вопросы для самопроверки

1. С какой целью разрабатываются классификаторы?

2. Какие бывают классификаторы?

3. Чем отличается иерархическая система классификации от фа-сетной?

4. Что такое информационный язык? Что такое дескриптор и тезаурус? Перечислите типы отношений между терминами.

5. В каких случаях используются регистрационные системы ко­дирования и какие системы относятся к этому классу?

6. Для чего используются классификационные системы кодиро­вания, какие системы входят в эту группу?

7. Что включается в систему ведения классификаторов?

8. Что такое ЕСКК и какова его структура?

9. Каков состав ОК? Каковы принципы организации ОК?

10. Каково назначение АСВОК и какова ее структура?

11.Какое назначение штрихового кодирования?

12. Перечислите типы и виды штрих-кодов?



Поделиться:


Последнее изменение этой страницы: 2016-04-08; просмотров: 2147; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.113.197 (0.064 с.)