Консалтинг и автоматизация в области управления
эффективностью банковского бизнеса

Журнал ВРМ World

Хранилище данных на SQL Server 2000 и компоненты OLAP

Microsoft® SQL Server™ 2000 имеет ряд компонент (как показано на рисунке), позволяющих трансформировать OLTP-данные и предоставлять OLAP-информацию лицам, принимающим решения.


Extensible Markup Language и OLE DB

Extensible Markup Language (XML) является стандартом, определяющим язык форматирования и представления данных, не зависящий от специфических средств хранения данных или приложений. Его значение как стандарта для передачи данных между приложениями и по Интернет постоянно растет. SQL Server 2000 имеет возможность возвращать выборки (result sets) по запросам как XML-документы, а также извлекать данные из XML-документов и хранить их в соответствующих таблицах базы данных. OLE DB представляет собой общую спецификацию доступа к данным, созданную Microsoft. Многие продукты, обеспечивающие хранение данных (такие, как большие таблицы, базы данных или другие серверные приложения), имеет провайдеров OLE DB, используемых приложением OLE DB для доступа к данным. Приложения, использующие OLE DB API, могут работать с любыми данными, для которых существует провайдер OLE DB. OLE DB может представлять свои данные как XML-документы. Кроме того, OLE DB 2.5 имеет многомерные расширения, позволяющие провайдерам OLE DB раскрывать информацию, содержащуюся в многомерных кубах.

XML и OLE DB являются важными механизмами для обмена данными между различными компонентами Хранилища данных SQL Server 2000. Определения некоторых концептуальных моделей, использованные рядом компонент, основаны на XML.

Microsoft ActiveX® Data Objects (ADO) представляют собой объектный API, соответствующий OLE DB, но являющийся более кратким и простым с точки зрения программирования. Как и OLE DB, ADO может возвращать свои данные в виде XML-документов, а также поддерживает многомерные расширения.

Множество приложений используют ADO в своих API для доступа к OLTP-данным.

Реляционная машина базы данных SQL Server 2000

Машина базы данных SQL Server 2000 используется в основном в OLTP-системах, а также для хранения промежуточных данных при трансформации OLTP-данных для их хранения в Хранилище или витрине данных и для хранения и управления данными в Хранилище или витрине данных.

Сервисы трансформации данных (Data Transformation Services)

Data Transformation Services (DTS) представляют собой компоненту, созданную для получения данных из одного OLE DB-источника данных, выполнения некоторых действий (например, агрегации данных - SUM, MIN, MAX, AVG) и сохранения их в целевом OLE DB-источнике данных. DTS состоит из пакетов, определяющих конкретный объем работы, составляющий логический этап работы. Пакеты имеют множество соединений с источниками данных, задачами, подлежащими выполнению и технологическими процессами, объединяющими соединения и задачи. Примеры задач включают копирование данных из исходного соединения в целевое соединение, трансформацию данных из исходного соединения и помещение трансформированных данных в целевое соединения, выполнение над соединением некоторого набора скриптов Microsoft ActiveX или операторов Transact-SQL.

DTS преобразует OLTP-данные, хранимые в реляционных таблицах, в различные структуры, используемые в качестве основы для многомерных кубов. Несмотря на то, что данные в базах данных OLTP хранятся в таблицах сущностей и отношений, данные в Хранилище данных OLAP хранятся в таблицах фактов и измерений. Таблицы фактов хранят меры, отображаемые в многомерных кубах, а таблицы измерений хранят информацию об элементах (dimension members). DTS является мощным инструментом для любой системы, обязанной неоднократно обращаться к данным в одном формате и трансформировать их в другой формат. Использование DTS не ограничено созданием Хранилищ данных, мощности и возможности компоненты великолепно подходят и для трансформации OLTP-данных в данные Хранилища данных OLAP.

Analysis Services и Data Mining

Analysis Services представляют собой простой интегрированный и масштабируемый набор компонент, позволяющий создавать многомерные кубы и имеющий прикладные программы, содержащие доступ в кубам. Analysis Services поддерживают различные механизмы хранения для кубов. Кубы могут храниться в реляционных базах данных (ROLAP), как отдельные высокофункциональные многомерные структуры данных (MOLAP) или как гибрид этих двух механизмов (HOLAP). Analysis Services поддерживают мастера, облегчающие выполнение таких задач, как определение измерений и кубов.

Analysis Services поставляют данные из многомерных кубов в приложения через провайдера OLE DB. Провайдер Analysis Services поддерживает многомерные расширения, определенные как часть OLE DB 2.5, а также ActiveX Data Objects (многомерные) (ADO MD) API.

Кроме того, Analysis Services поддерживают стандартные для конкретной области бизнеса алгоритмы data mining. Data mining поддерживает новые сложные инструменты выявления тенденций в данных и прогнозирования будущих результатов.

English Query

English Query позволяет конечным пользователям формулировать англоязычные вопросы по информации, хранящейся в базах данных SQL Server 2000 или Хранилищах данных и OLAP-кубах. Администратор English Query определяет логические и семантические отношения между различными таблицами и столбцами базы данных или кубами, измерениями и мерами Хранилища данных. Приложение может быть запрограммировано таким образом, чтобы оно предлагало конечному пользователю ввести англоязычный запрос в символьное поле формы. Затем символьная строка передается машине English Query. Эта машина анализирует вопрос в соответствии с логическими определениями данных, созданными администратором. При запросе к OLAP-кубам, машина English Query возвращает приложению SQL-оператор, извлекающий необходимую информацию из базы данных. При запросе к Хранилищу или витрине данных машина English Query возвращает MDX-запрос. Приложение выполняет SQL-оператор или MDX-запрос и возвращает результаты конечному пользователю.

Meta Data Services

SQL Server 2000 Meta Data Services хранят модель, отражающую структуру данных в базах данных и Хранилищах SQL Server 2000. Эта информация используется в основном инструментами быстрой разработки сторонних фирм, способными либо создавать прототипы приложений либо обеспечивать шаблоны приложений, основанные на информации модели Meta Data Services.