Консалтинг и автоматизация в области управления
эффективностью банковского бизнеса

Журнал ВРМ World

Обоснование Хранилища данных

Среда электронного бизнеса (e-business), основанная на технологии WWW, имеет огромный потенциал. Ведь глобальная сеть является чрезвычайно мощным средством доставки информации. В действительности, однако, мощь этой технологии - всего лишь возможность доставлять информацию. А для того, чтобы полностью раскрыть потенциал этой Web-среды e-бизнеса, необходимо создать инфраструктуру, которая выполняла бы требуемую обработку данных. Эта инфраструктура, которая лучше всего поддерживает Web-окружение, называется корпоративной информационной фабрикой (corporate information factory). В сердце этой фабрики располагается Хранилище данных.

На рисунке 1 показана базовая инфраструктура, предназначенная для Web-реализации оболочки e- бизнеса.




Рис.1. Web-среда и инфраструктура поддержки


Основа корпоративной информационной фабрики - Хранилище данных. А Хранилище данных - это то место, где хранятся корпоративные структурированные, интегрированные, исторически накопленные данные.

Хранилище данных выполняет множество функций, но его основное предназначение - предоставление информации в кратчайшие сроки и с минимумом затрат. Другими словами, без Хранилища данных стоимость информации достигает заоблачных высот, а время, необходимое для ее получения, будет крайне велико. Для успешного же продвижения Web-среды электронного бизнеса требуется, чтобы доступ к информации был недорогим и не занимал много времени.

Так как же Хранилище данных снижает стоимость информационного обеспечения? Каким образом Хранилище может значительно увеличить скорость предоставления информации? Ответить на эти вопросы вовсе не так просто, как может показаться на первый взгляд при беглом рассмотрении структуры корпоративной информационной фабрики.

Чтобы объяснить, как Хранилище данных выполняет свои важнейшие функции, давайте представим себе относительно простой информационный запрос, сформированный, например, в производственной компании, которая не располагает Хранилищем данных. Для ее финансового аналитика нужны данные о продажах за последний квартал. Является ли этот запрос допустимым? Вполне. И что же требуется для получения такой информации?




Рис. 2. Получение информации из приложений

Из рисунка 2 видно, что, чтобы получить желаемую информацию, необходимо обратиться к множеству различных источников. При этом, некоторые данные хранятся в IMS (Information Management System, Информационно-управляющая система), доступ к другим реализуется через VSAM (Virtual Storage Access Method, Виртуальный метод доступа), а третьи могут быть в файлах базы ADABAS. Помимо этого, ключевая структура файлов в европейской и азиатской кодировках отличаются друг от друга. Наконец, файлы с данными о запасных частях и товарообмене могут использовать разные даты закрытия. Для того, чтобы получить искомую информацию, необходимо не только обратиться к 10 программам и последовательно анализировать полученные данные, но и интегрировать их. В результате, весь этот процесс займет полгода и обойдется в 250 тысяч долларов.

Такие цифры характерны для средних и крупных компаний. Хотя в некоторых случаях эти показатели сильно занижены. Однако, в действительности, вопрос состоит не в том, сколько времени или средств нужно, чтобы обратиться к данным. На самом деле принципиально важно, сколько потребуется ресурсов, чтобы получить доступ к многим единицам информации.

На рисунке 3 показано, что происходит, если запрашивается семь различных типов информации.



Рис. 3. Получение информации из приложений для семи различных запросов

Затраты, которые были разъяснены на рисунке 2, теперь следует умножить на семь (или на число запрашиваемых единиц информации). При разработке процедур получения информации никому в голову и не придет мысль не ограничиваться только требуемой информацией, а рассмотреть возможность предоставления и других информационных единиц. По этой причине всякие раз, как возникает необходимость в новом типе информации, процесс, представленный на рисунке 2, начинается с самого начала. В результате, стоимость информации катастрофически повышается.

Однако, представим себе, что вышеупомянутая организация имеет Хранилище данных. Предположим, что нужно обработать запрос на семь единиц информации. Сколько бы времени ушло на выполнение этой задачи, и во что бы она обошлась в этом случае? На рисунке 4 рассмотрена такая ситуация.



Рис.4. Получение отчета с помощью Хранилища данных

В случае Хранилища данных можно задавать множество информационных запросов. Структурированные и интегрированные данные Хранилища идеальны для многократного представления. Так, один аналитик может изучить данные, представленные в одном виде, а другой - в другом. Все, что для этого требуется, - это один раз создать эту инфрастуктуру. Финансовый аналитик сможет за 30 минут отыскать единицу информации, например консолидированные продажи. А, если эти данные сложно вычислять, то на это может уйти всего один день. В зависимости от сложности запроса и того, как определяются затраты, доступ к данным может стоить от 100 до 1000 долларов. Сравните эти цифры с теми, что могли бы быть, если организация не располагала бы Хранилищем данных, и вам станет ясно, почему Хранилище позволяет получать данные быстро и без особых затрат.

Разумеется, основное различие между наличием Хранилища данных и его отсутствием состоит в том, что в первом случае информационная структура, необходимая для обращения к данным, создается только один раз. Если же у вас нет Хранилища данных, то вам придется всякий раз, как возникнет потребность в новых данных, строить эту инфраструктуру.

В действительности, ни одна компания не работает только с частью информации. На самом деле, происходит как раз обратное - большинству компаний требуется множество видов информации. И эти потребности в новых видах и структурах данных растут с каждым днем. Если попытаться посмотреть на картину в целом - не ограничиваясь стоимостью одной единицы информации, а учитывая все данные - становится очевидным, что Хранилище данных существенно снижает бремя, которое несут информационные системы организаций. На рисунке 5 показано преимущество наличия Хранилища данных в ситуации с множеством типов данных.



Рис. 5. Получение семи отчетов с помощью Хранилища данных

Из рисунка 5 видно, что Хранилище данных действительно снижает затраты на получение информации и значительно повышает скорость, с которой можно получать данные.

Однако, во многих организациях предпочитают концентрироваться только на решении текущих задач, не рассматривая проблему в целом. В таких организациях принято не заглядывать вперед - не дальше "будущего вторника". Такой "близорукий" подход ограничивается потребностью лишь в одной единице информации, и организации видят возможности инфраструктуры Хранилища данных только в этом суженном ракурсе. На рисунке 6 изображена подобная ситуация.



Рис. 6. Когда вас интересует один единственный отчет, кажется, что дешевле получать информацию напрямую из приложений, не создавая Хранилище данных

Если посмотреть на рисунок 6, то может показаться, что гораздо проще не создавать Хранилище данных - если организацию интересует только быстрое решение проблем. В краткосрочной перспективе дешевле обратиться за данными к приложениям, а не строить Хранилище данных. Вы можете услышать сотни отговорок, почему в компаниях избегают заглядывать вперед:

  • Хранилище данных очень большое.
  • Мы слышали, что Хранилища данных на самом деле не работают.
  • Все, что нам нужно - это быстро получить информацию, даже низкого качества.
  • У меня нет времени создавать Хранилище данных.
  • Если я построю Хранилище данных и заплачу за него, позже кто-нибудь из моих коллег будет использовать мои данные, за которые он не заплатил, и так далее.

До тех пор, пока в организациях будут придерживаться этого "близорукого" подхода, в них никогда не внедрят Хранилище данных. Но как только в компании посмотрят на ситуацию в долгосрочной перспективе, положение изменится коренным образом. На рисунке 7 показано такое перспективное мышление.



Рис. 7. Когда смотришь на ситуацию в перспективе, видно, что создание Хранилища данных позволяет значительно сократить потребление ресурсов

Если посмотреть на рисунок 7, ставится понятно, что, когда потребности в информации рассматриваются с точки зрения перспективы, Хранилище данных оказывается гораздо менее дорогостоящим решением по сравнению с краткосрочным подходом. Величина времени, необходимая для доступа к информации, есть нечто неуловимое, а ее ценность с трудом поддается измерению. Никто не станет спорить, что информация сегодня, прямо сейчас, более полезна и значима, чем через полгода. На самом деле, спустя год, я просто забуду, зачем вообще она мне была нужна. Так что, вряд ли что-нибудь может быть лучше, чем Хранилище данных, если говорить о скорости и легкости доступа к информации.

Итак, Web-среда является очень перспективным окружением. Но для того, чтобы раскрыть потенциал Web-технологии, доступ к информации должен быть быстрым и недорогим. Инфраструктура Хранилища