Журнал ВРМ World

Мировая история развития технологий управления эффективностью бизнеса – обзоры зарубежных публикаций

Метаданные и организация прохождения данных: XML: Глобальный стандарт метаданных

Сегодня уже никого не удивить наличием Хранилища данных. Зато почти каждый
практик отметит как важно, чтобы DWH имело выход в Internet. Действительно, в
этом случае без проблем обеспечивается работа с данными DWH через Web, а также
реализация решений в сфере е-бизнеса, то есть связь DWH с другими системами,
как внутри компании, так и вне ее. Специалисты компании "Intersoft Lab" провели
серьезную работу по изучению возможностей организации обмена данными через
Internet и остановили свой выбор на технологии XML, как наиболее прогрессивном
средстве, обеспечивающем связь DWH и Web. Отрадно, что зарубежные авторы не
только не опровергают, а напротив, подтверждают сделанные выводы.
Предлагаемая для ознакомления статья описывает язык XML с точки зрения его
возможностей как нового стандарта метаданных в Web. Автор рассматривает
корпоративные сети и Интернет как базы данных и доказывает, что для управления
этими постоянно расширяющимися и усложняющимися средами необходима новая
технология, отражающая не только содержание данных, но и их структуру. Имя этой
технологии - XML. Статья представляет собой достаточно общий обзор языка XML
как средства, позволяющего значительно упростить работу в Web. Она наверняка
будет полезна читателям, которые интересуются новыми подходами к организации
данных в DWH и Интернет.

XML (eXtensible Markup Language) является сегодня одной из самых популярных областей в сфере технологий. По сути дела, трудно найти журнал, не содержащий одну или несколько статей по этой теме. В данной статье мы рассмотрим, как XML влияет на индустрию метаданных в целом, а также причины, по которым XML-технология обязательно коснется каждой корпорации в мире.

Многие компании (Sun Micro-systems, в частности) уверены в том, что сеть (network) - это и есть база данных. Если это так, то получается, что Web-страницы в Интернете - это самая большая база данных из всех. С решениями в сфере е-бизнеса, которые к 2002 году по прогнозам разовьются в более чем $100-миллиардную индустрию, и с пользователями Web, число которых к 2002 году достигнет 329 миллионов, эта база данных будет расти в экспоненциальной пропорции.

Web - это также самая большая распределенная среда в мире. В процессе своего роста эта неоднородная среда будет становиться все менее и менее управляемой и контролируемой. Многие компании уже сейчас понимают, что должен быть некий путь для гомогенизации всех этих несопоставимых между собой данных. Метаданные предлагают решение этой проблемы, и имя ему XML. XML и его стандарты пытаются решить проблему неоднородности данных. XML был разработан консорциумом World Wide Web (W3C) для решения проблемы гомогенизации путем добавления тэгов данных, описывающих данные (метаданные) Web-страницы в HTML (HyperText Markup Language). Для понимания принципа работы тэгов данных давайте используем XML для описания сведений о неком учебнике:


<Book>
    <Name>The Complete XML Guide</Name>
    <Author>
        <Name>John Smith</Name>
        <Title>Jr.</Title>
    </Author>
    <Year>2000</Year>
    <Publisher>John Wiley & Sons</Publisher>
    <PubCity>New York</PubCity>
    <Edition>First</Edition>
</Book>

Как мы видим, подход, основанный на тэгах, предлагает гибкий и эластичный механизм для управления метаданными, связанными содержанием информации (т.е., каждое имя тэга описывает характеристики данных, к которым он относится). Сила XML заключается в возможности ввода данных Web в любом порядке, потому что именно тэги данных, а не их местоположение, описывает значение данных.

XML также имеет такое большое значение еще и потому, что он представляет собой даже более объемное описание метаданных, чем стандарты метамодели, разработанные в свое время компаниями Meta Data Coalition и Object Management Group. В основном это оттого, что XML доступен гораздо большей аудитории. Сейчас все усилия направлены на сближение XML со стандартами метамодели, разработанными либо Meta Data Coalition, либо Object Management Group, либо и теми и другими. Это очень удобно для корпораций, поскольку дает им возможность управлять своей системой в Web, пока та еще не стала слишком большой для управления. Да, Web является нашей системой будущего. Как мы уже говорили, Web является самой большой базой данных и распределенной системой в мире. Он также представляет собой самую большую из когда-либо создававшихся систему поддержки принятия решений. Основная проблема, связанная сегодня с Web, заключается в поиске необходимой информации. Например, несколько месяцев назад я хотел выяснить, нет ли в Интернете книг, посвященных метаданным. С этой целью, я запускал различные поисковые системы с указанием в качестве критерия поиска темы метаданных. Результаты поиска вернули целые тысячи страниц, якобы удовлетворяющих данному критерию. Однако не одна из страниц не содержала ничего похожего на книгу по метаданным. Должен признать, что я прекратил просмотр найденных материалов после того, как зашел в сотню или чуть более ссылок, указанных в результатах поиска. В этой ситуации тэги данных в XML однозначно бы определяли те сайты, где информация по метаданным стоит в заголовке книги.

Задачей XML являются обеспечение "клея" (или метаданных), привносящих определенное содержание во все элементы Web. XML позволит поисковым машинам Интернет просматривать Web-страницы и отбирать среди них действительно совпадающие с критериями запроса. Все это даст корпорациям возможность общаться со всеми путем доступа к просмотру Web-сайтов компании, через заказной (незапланированный, ad hoc) обмен транзакциями электронной торговли и напрямую с помощью интерфейсов на базе XML. Без XML компании не смогли бы обмениваться документами (Web-страницами) через Интернет без создания специальных индивидуальных программных интерфейсов или физического вмешательства.

Помните, что XML, как и стандарты метамодели, находятся еще в процессе становления; но и те и другие развиваются очень быстро под давлением рынка, требующего скорейшей разработки более современных решений. И XML имеет большой успех в качестве глобально стандарта метаданных в Web.

Автор: Дэвид Марко