Журнал ВРМ World

Мировая история развития технологий управления эффективностью бизнеса – обзоры зарубежных публикаций

Хранилища данных и Интернет: Web-броузеры могут быть весьма выгодным средством обеспечения доступа потребителей и сотрудников к Хранилищу данных

В этом номере Журнала Клуба знатоков мы предоставляем читателям возможность
ознакомиться с подборкой материалов по весьма актуальной проблеме - доступу к
Хранилищам данных через Интернет. Технология эта только начинает свой путь по
дорогам российского бизнеса, и в этом мы уже традиционно немного отстаем от
западных компаний.
Первая статья, написанная автором еще в 1996 году, расскажет вам о самой
технологии соединения Хранилищ данных и Интернет, о ее преимуществах и
проблемах, а также даст вам представление о том, с чего начинали первые
поставщики интернет-решений в области Хранилищ данных. Заметим при этом, что в
нашем "опоздании" есть свои преимущества - нам дан шанс избежать ошибок и взять
на вооружение успехи наших зарубежных коллег.

За прошедший год самыми популярными темами в области компьютеризации стали Интернет и Хранилища данных. С точки зрения маркетинговой перспективы альянс этих двух технологий так же естественен, как арахисовое масло и мармелад, и так же захватывающе интересен, как союз Цезаря и Клеопатры. Не желая упустить шумно пропагандируемые технологии, поставщики выстраиваются в очередь со своими продуктами, - иногда задолго до того, как те готовы, - и практически каждый поставщик на рынке Хранилищ данных уже почти готов предложить свою собственную интернет-стратегию.

Вопрос в том, стоит ли подключать Хранилище к Интернет? Ответ: необычайные преимущества доступа к Хранилищам данных через Интернет практически не отличаются от преимуществ использования Интенет для любых других приложений:

  • До сих пор существует множество клиентских платформ: Windows 3.x, Windows 95, Windows NT, OS/2 и MacOS, к тому же эти операционные системы установлены на компьютерах с различными объемами памяти, дискового пространства, различной скоростью процессора и видеоадаптерами. Поддержка всех этих платформ с помощью разработки традиционных приложений требует расхода времени и денег. Использование доступа в Интернет в качестве клиентского интерфейса приложения переносит тяжесть проблем совместимости на поставщиков web-броузеров.
  • Практически каждый желающий может найти способ выхода в Интернет, освобождая таким образом компании от необходимости расширять свои сети для охвата всех потенциальных пользователей.
  • Стоимость средств OLAP обычно варьируется в пределах от 500 до 1000 долларов или более за одно рабочее место, при этому большинство клиентов используют только малую толику всех возможностей этих средств. Web-броузеры стоят от 20 до 50 долларов и могут быть легко загружены с web-сайта поставщика.
  • С помощью Интернет корпорации могут выгодно снизить стоимость сети и ее обслуживания примерно до 19,95 долларов в месяц.
  • В отличие от созданных на заказ интерфейсов приложений, разработанных с помощью Visual Basic фирмы Microsoft или PowerBuilder компании Powersoft, Web-броузер может использоваться любым приложением, обеспечивающим шлюз в Интернет-переводчик для HTML и API сервера данных. Одновременно с доступом в Интернет пользователи получают электронную почту, новости пользовательской сети и другие дополнительные возможности, не требующие дополнительной оплаты.

Доступ к Хранилищам через Интернет представляет собой открытое решение, допускающее использование любого web-броузера (Netscape Navigator, Syglass Mosaic, Microsoft Internet Explorer, CompuServe и Prodigy, или Web-серверы, например, Netscape Communication, Commerce server, web-сайт O'Reilly & Associates и Microsoft Internet Information server.

Само собой разумеется, внешний вид и возможности представления клиента (client presentation) могут быть расширены за счет применения Java-апплетов для создания более мощных приложений и использования языка JavaScript фирмы Netscape. Для проектирования страниц можно использовать любой web-инструмент. При этом в качестве бесплатного приложения web-броузеры предоставят вам множество атрибутов, особенно полезных в аналитических приложениях:

  • Локальное кэширование страниц, необычайно улучшающее время отклика для повторяющегося анализа.
  • Просмотр частичных результатов по мере загрузки страницы, особенно полезное для "анализа со скоростью мысли".
  • Возможности асинхронной обработки, сжатия и кодирования данных, которые могут отсутствовать в инструментах клиент-серверного OLAP, средств создания запросов или отчетов.

В двух словах - Интернет может быть крайне рентабельным способом расширения связей, что ведет к значительной экономии вследствие роста масштабов бизнеса.

Плюсы и минусы

Нет сомнений, что доступ через Интернет имеет ряд объективных преимуществ по сравнению с существующей клиент-серверной архитектурой, однако при этом имеются некоторые настолько же явные недостатки. Существует общее мнение, что понятие универсального клиента, не зависящего от физической среды, в которой он реализован, является отличной идеей, время которой наконец настало. В конце концов, онлайновые службы и провайдеры интернет-служб, фактически популяризировали такой подход, создав практически повсеместный доступ более чем для 10 миллионов людей только в США (и число это продолжает стремительно расти).

Каждый, кто подсоединен к Интернет, одновременно хотя бы теоретически связан со всеми другими его пользователями. С учетом быстрого развития Интернет и особенно фактического появления стандартов (таких, как Navigator и Java) весь процесс выглядит довольно радужно. Какой же может оказаться обратная сторона?

Шесть месяцев назад практически каждый руководитель информационно-технологического подразделения компании имел стандартный ответ - недостаток безопасности. Мысль о выводе конфиденциальной корпоративной информации в дикий, необузданный, созданный "поколением Икс" Интернет была слишком пугающей.

Криптографические схемы и серверы безопасности несколько уменьшили беспокойство, однако феноменом, который окончательно утвердит данную проблему, может оказаться приманка следующего десятилетия - Итранет (внутренняя сеть предприятия). Безопасность легко поддерживалась с помощью всей архитектуры, программного обеспечения и приложений Интернет и путем помещения всего этого за брандмауэром (firewall), защищая таким образом от настырного любопытства непрошеных гостей.

Другим серьезным вопросом, на который не было ответа, было то, как конкретно сделать так, чтобы корпоративные базы данных могли работать в Интернет. Протоколы CGI (Common Gateway Interface) для передачи сообщений от и к Web-серверам требовали написания кода на языке Си, что являлось анахронизмом в мелких информационно-технологических подразделениях.

Еще одной проблемой в использовании Интернет для доступа к Хранилищам данных является неопределенность взаимодействия между web-броузером и web-сервером, то есть привычный для соединения с источником данных клиент-серверный тип соединения не существует в Интернет. Web-сервер выполняет функцию сервера передачи сообщений, откликаясь на получаемые сообщения и в свою очередь связываясь с другими ресурсами в сети или отвечая Web-броузеру.

Если каждый запрос к базе данных через web-броузер требовал бы соединения и логина к базе данных, совокупные накладные расходы были бы просто губительны для web-сервера, и, в итоге, для пользователя. Решить проблему можно, если поставщики программного обеспечения для Хранилищ данных приложат усилия к написанию интернет-шлюзов с использованием CGI API.

Интернет-шлюзы для Хранилищ данных работают следующим образом: Когда пользователь генерирует запрос OLAP, тэги, описывающие продукт, вставляются в HTML и передаются на Web-сервер. Затем все это передается на интернет-шлюз, генерирующий запрос в API OLAP-сервера. Процесс идет в обратном направлении к пользователю, передавая возвращенные данные интернет-шлюзу, конвертирующему их в HTML и отсылающему на Web-сервер.

Обслуживая соединение сервера с источниками данных и отслеживая каждое клиентское сообщение через Web-броузеры, аналитическая машина OLAP контролирует весь процесс взаимодействий, порождающих проблему неопределенности Интернет. Очевидно, что, поскольку у нас нет возможности выяснить, активен ли клиент до сих пор, то должно быть какое-то подобие ограничения времени ожидания, подразумевающее разрыв связи по прошествии некоторого времени, в течение которого клиент был неактивен. Все эти проблемы кажется решены в трех продуктах, которые мы рассмотрим далее.

Но есть еще кое-что. В средствах OLAP стандартная манипуляция, называемая "углубление" (drill down) создает серию аналитических процессов, каждый из которых содержит все более детальную информацию обо всем или о части предыдущего процесса. Часто это представлено как серия окон, перекрывающих друг друга шаг за шагом и отражающих происходящее более привычным образом. Такое отображение предыдущих процессов анализа часто называется "средой взаимодействия".

Точное воспроизведение этого в Web-броузере требует некоторой ловкости. Поскольку броузеры как правило отображают в точности то, что запрошено в HTML, переданном Web-сервером, а не обновляют существующую страницу, интернет-шлюзам таких продуктов придется создавать гораздо более сложные страницы, которые будут выглядеть как перекрывающие друг друга окна, что гораздо проще сделать в находящемся на клиенте графическом пользовательском интерфейсе. Это будет иметь и практическое применение.

А как же быть с диаграммами? Визуализация данных является ключевым элементом аналитической обработки. Традиционным методом представления графики web-броузерами является отображение ее в виде загружаемых с сервера графических файлов. Безусловно, никто не согласится ждать, пока передастся GIF-файл объемом в 200 Кб, особенно при скорости модема в 28,8 Кб\с. Поэтому для динамического изображения диаграмм в клиенте с использованием небольшого пакета данных с сервера, в продукты должны быть встроены дополнительные возможности, скорее всего - включающие апплеты диаграмм, разработанные на Java, или другие современные технологии - такие, как ActiveX фирмы Microsoft.

Три интернет-продукта скоро будут выпущены фирмами Arbor Software, Information Advantage и MicroStrategy. Они содержат лишь малый набор характеристик клиента, имеющийся сегодня в клиентских средствах поставщиков, но каждый из них может в ближайшем будущем предложить хотя бы некоторые полезные возможности. Слишком детальное описание этих средств представляется излишним, поскольку они быстро развиваются и расширяют свои возможности. Вместо этого я сделаю описания краткими и включу функции работы с Интернет в описание расширенной архитектуры приложения каждого инструмента.


Arbor Essbase Web
Предложение фирмы Arbor является возможно самым амбициозным проектом из всех ранних интернет-продуктов. Он включает не только манипуляции OLAP (например, углубление (drill down), обратная углублению процедура drill up, перемещение сквозь данные (drill across), использование pivot, плоскостных и объемных срезов (slice and dice) и создание фиксированных и динамических отчетов), а также ввод данных, включая и возможность конкурирующей многопользовательской записи - характеристику, отличающую его от остальных.

Заявляя цену Essbase Web в $10 000 за один сервер баз данных (не Web-сервер), фирма Arbor явно рассматривает этот инструмент как средство продвижения Essbase-доступа в массы с небольшими предельными затратами. Поскольку фирма Arbor продает Essbase только как сервер, то он не имеет клиентского пакета, который мог бы быть использован при продаже интернет-шлюзов этой же фирмы. Таким образом, Essbase перспективен с точки зрения бизнеса.

Интернет-продукты заменяют не административные модули и модули разработки, а только средства доступа пользователей к запросам и обновлению.


Information Advantage WebOLAP
Information Advantage использует сервер-центрированную архитектуру сообщений, состоящий из мощной аналитической машины, генерирующей SQL для "вытаскивания" данных из реляционных баз данных, манипуляций с результатами и передачи их клиенту.

Поскольку вся аналитика продукта сосредоточена в сервере, реализация WebOLAP для создания интернет-ориентированного клиента не заставила себя ждать. Архитектура инетнет-продукта фирмы Information Advantage аналогична архитектуре Essbase и также включает в себя интернет-шлюз между Web-сервером и аналитической машиной, однако в данном случае Хранилище данных и аналитическая машина разделены, тогда как Essbase объединяет в себе и склад данных и аналитическую машину. Первый релиз продукта поддерживал не все манипуляции, входящие в Essbase Web фирмы Arbor.


MicroStrategy DSS Web
Флагманский продукт этой фирмы, DSS Agent, изначально был ориентирован на Windows. Однако фирма MicroStrategy достаточно плавно перенесла его сначала на NT, а теперь уже представляет этот проудкт как один из первых OLAP-средств с интенет-доступом. DSS Agent, совместно с DSS relational OLAP Server, средством моделирования данных DSS Architect data modeling tool и средством проектирования DSS Executive design tool для построения диспетчерских информационных систем, динамически генерирует SQL и при выполнении сложного анализа не создает "куб", как многие другие продукты, а динамически генерирует SQL и опирается на сервер реляционной базы данных.

При вставке шлюза между web-сервером и машиной DSS-сервера MicroStrategy может заменять интерактивный внешний интерфейс DSS Agent на web-броузер, передающий запросы на API DSS-сервера.

В отличие от Arbor, фирма MicroStrategy продает комплект клиентских продуктов, объем продаж которого может сократиться, когда компании начнут лицензирование этого интернет-продукта. Набор клиентских продуктов предлагает широкий спектр возможностей, которые возможно не будут повторяться в интернет-продукте, по крайней мере, в ближайшее время.

К таким особенностям относится менеджер метаданных DSS Architect, а также средства разработки для создания сложных шаблонов (систем измерений и фактов), метрики (необработанных или вторичных фактов) и фильтров.


Кажется очевидным, что все поставщики Хранилищ данных заявят о своей поддержке идеи доступа к Хранилищам через Интернет, одновременно согласуя свои разработки с подходами трех первых поставщиков таких решений.

Сервер-центрированные инструменты, например Information Advantage and Prodea Beacon от Platinum Technology и многомерные базы данных - Essbase, Oracle Express, Gentia фирмы Planning Sciences, Acumate ES компании Kenan Technologies, Holos компании Holistic Systems и Pilot Server фирмы Pilot Software - оказываются в отличном положении и могут извлечь максимум выгоды из своей архитектуры в контексте обеспечения легкого доступа с стороны web-броузера. Удивительно, но множество сервер-центрированных инструментов уже должны были объявить о выходе такого продукта.

Относительно того, почему остальные не сделали то же самое, мы можем только догадываться. Вероятно, аналитическая машина в качестве среднего яруса между клиентом и сервером баз данных недостаточно для быстрой реализации интенет-технологий. Я подозреваю, что многим из этих инструментов, построенных вокруг патентованных схем сообщений и не имеющих открытых API, немного сложно приноровиться к неопределенной природе Интернет.

Клиент-центрированные средства, например Business Objects, Esperant фирмы Software AG, PowerPlay компании Cognos или Brio Query от Brio Technologies могут оказаться в затруднении, если Интернет станет наиболее популярным подходом. Поскольку при выполнении значительной части анализа они полагаются на клиента - обычно на машину Windows или Mac - имеющего дисковое пространство, память и производительность при обработке данных, а Интернет мало чем может помочь в поддержке "толстого" клиента.

Для получения преимуществ от их архитектуры, этим поставщикам, помимо разработки интенет-шлюзов, придется еще и подсоединить свои машины к серверу.

Другой поставщик клиентского OLAP-средства, Select Star из Нью-Йорка, пошел по другому пути. В его пока что не имеющем названия предложении, выход которого запланирован через несколько месяцев, Select Star предпочел обеспечить более общецелевой набор инструментов для разработки Интернет-приложений. И хотя этот инструментарий опирается на его клиент-ориентированную машину OLAP, StarTrieve, компания Select Star рассчитан на гораздо более широкую область применения, чем просто OLAP.

Сегодня и завтра

Когда вы оцениваете эти продукты, пожалуйста, помните, что те характеристики, что вы видите сегодня, не должны быть определяющим фактором. Гораздо важнее выбрать инструмент, подходящий к архитектуре вашего Хранилища данных, если вы хотите получить "архитектурное" решение.

Во-вторых, покупайте компанию, а не продукт. Сейчас, на ранней стадии разработки, возможности первых релизов продуктов не могут служить показателем качества, отличающим одного поставщика от другого в лучшую или худшую сторону. Очевидно, что Интернет не исчезнет и может сыграть значительную роль в технологии Хранилищ данных, возможно даже очень скоро. Также очевидно, что существующие клиент-серверные подходы в ближайшее время вряд ли будут вытеснены чем-то другим.

Автор: Нил Рэйден