Обучение пространствам данных 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Обучение пространствам данных



Лакмусовой бумажкой для понятия пространства данных является то, можно ли разработать соответствующий курс. Естественно, что, по мере выполнения исследований, основания пространств данных будут существенно развиваться, но мы полагаем, что уже сейчас имеется достаточный для курса материал. Кроме обзора основных моделей данных и языков запросов, следовало бы рассмотреть следующие темы: проблемы неоднородности и различных источников; архитектуры интеграции данных и обмена данными; запросы как механизм трансляции данных; алгоритмы полуавтоматического сопоставления схем; разные понятия качества обслуживания; поддержка запросов в стиле "лучшее, что возможно" и интеграция запросов к структурированным и неструктурированным данным. Важным компонентом такого курса было бы использование и анализ удачных примеров пространств данных (например, Sloan Digital Sky Survey).

Промышленные перспективы

В большой степени понятие пространств данных инспирировано проблемами, стоящими сегодня перед индустрией. В действительности, имеется много примеров, когда индустрия уже сделала шаги в этом направлении, но эти шаги являются изолированными, и имеется очевидная потребность в более широком представлении, которое приведет к более понятной абстракции системы и набору методов.

Например, начинает набирать силу корпоративная интеграция информации (Enterprise Information Integration). Компании, специализирующиеся в этой области, производят системы для обработки запросов к нескольким источникам данных внутри организации. Имеется несколько примеров продуктов, которые создают индексы над несколькими источниками данных для достижения целей, которые мы упоминали выше (например, Master Data Management, компонент продукта NetWeaver компании SAP). Имеются проекты, направленные на раскрытие источников данных предприятия, и только немногие компании изучают различные аспекты управления корпоративными метаданными. Интересно, что средства поиска персональных компьютеров также распространяются на корпоративный уровень, поступая совсем из другого сектора индустрии.

Заключение

Наиболее острые проблемы управления информацией в организациях сегодня произрастают из наличия в организациях многих разнотипных, но часто взаимосвязанных источников данных. В этой статье мы предложили идею пространств данных и разработки платформ поддержки пространств данных (DataSpace Support Platforms, DSSP) как средства решения этих проблем. Назначением DSSP является освобождение разработчиков от потребности постоянной повторной реализации основных функций управления данными при работе со сложными, разнородными, взаимосвязанными источниками данных, во многом подобно тому, как традиционные СУБД обеспечили аналогичные возможности для работы со структурированными реляционными базами данных. Однако, в отличие от СУБД, в DSSP не предполагается наличие полного контроля над данными в пространстве данных. Вместо этого, DSSP позволяет управлять данными системам-участникам, но обеспечивает новый набор служб надо всеми системами, удовлетворяя их требования автономности.

Пространства данных можно считать "зонтиком" для большей части исследований, которые уже активно ведутся в сообществе баз данных; на самом деле, в этом и состояла одна из исходных целей. Однако мы также попытались очертить несколько новых исследовательских возможностей, которые происходят из более целостного представления возникающих проблем "данных повсюду". Исследовательское сообщество баз данных однозначно решило заняться решением этих проблем, и мы предвидем непрерывный прогресс в расширении области применения технологии управления данными.

Литература

1. Phil Bernstein, Michael Brodie, Stefano Ceri, David DeWitt, Mike Franklin, Hector Garcia-Molina, Jim Gray, Jerry Held, Joe Hellerstein, H V Jagadish, Michael Lesk, Dave Maier, Jeff Naughton, Hamid Pirahesh, Mike Stonebraker, and Jeff Ullman. The Asilomar Report on Database Research. ACM SIGMOD Record, 27(4):74-80, 1998.

2. Serge Abiteboul, Rakesh Agrawal, Phil Bernstein, Mike Carey, Stefano Ceri, Bruce Croft, David DeWitt, Mike Franklin, Hector Garcia Molina, Dieter Gawlick, Jim Gray, Laura Haas, Alon Halevy, Joe Hellerstein, Yannis Ioannidis, Martin Kersten, Michael Pazzani, Mike Lesk, David Maier, Jeff Naughton, Hans Schek, Timos Sellis, Avi Silberschatz, Mike Stonebraker, Rick Snodgrass, Jeff Ullman, Gerhard Weikum, Jennifer Widom, and Stan Zdonik. The Lowell Database Research Self-Assessment. Commun. ACM, 48(5):111-118, 2005.

 



Поделиться:


Последнее изменение этой страницы: 2017-02-07; просмотров: 181; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.25.74 (0.007 с.)