- 31 октября 2004 г.
Оцените, насколько совершенно ваше Хранилище данных
В статье рассматривается так называемая модель совершенствования Хранилищ
данных, разработанная The Data Warehousing Institute. Эта модель позволяет
оценить, на какой стадии находится проект по развитию хранилища данных, его
перспективы и направления дальнейшего движения.
Многие из нас управляли проектами Хранилищ данных многие годы. Кто-то добился создания стратегических систем, которые по достоинству оценили как пользователи, так и руководство. А кто-то, наоборот, тщетно старается заинтересовать пользователей в своих Хранилищах данных и получить финансирование на их развитие, в то время как пользователи нуждаются в лучше организованной и более точной информации.
Так что же отличает успешные решения от проблематичных? Как выглядит ваша инициатива по созданию Хранилища данных по сравнению с другими аналогичными проектами в вашей отрасли? Что необходимо для того, чтобы поднять ваше Хранилище данных на следующий уровень?
Многие руководители проектов по созданию Хранилищ данных задаются сегодня этими вопросами1. К сожалению, на них нет быстрых или легких ответов. Но для облегчения задачи организация TDWI (The Data Warehousing Institute, Ассоциация по продвижению технологии Хранилищ данных) разработала модель совершенствования Хранилища данных, которую можно использовать для оценки собственного прогресса. Эта модель позволяет быстро понять, на какой стадии ваш проект по использованию Хранилища данных находится в настоящий момент и куда нужно двигаться дальше.
Шесть стадий
Модель совершенствования включает шесть стадий: "зачатие", "младенчество", "детство", "юность", "зрелость" и "мудрость". Ценность Хранилища данных для бизнеса возрастает, по мере того как оно успешно проходит каждую из этих стадий (рис. 1).
Рис.1. Модель совершенствования Хранилища данных.
Большинство организаций сейчас находятся на стадиях "детства" и "юности".
Стадии определяются целым набором характеристик: уровень, аналитическая структура, восприятие руководителями, типы аналитики, управление, финансирование, технологическая платформа, организация внесения изменений и управление ими (для этого мы заимствовали концепции из модели развития функциональных возможностей, разработанной Software Engineering Institute). В данной статье мы обсудим лишь некоторые из этих характеристик.
Организации проходят через эти шесть стадий с различной скоростью; в каждой из них могут одновременно присутствовать признаки нескольких стадий. По существу, никто не может ожидать ясной и точной смены этих стадий. Тем не менее, в развитии любого проекта Хранилища данных или бизнес-аналитики есть две поворотные точки, которые на рис. 1 обозначены как "трещина" и "пропасть". Многие проекты Хранилищ данных или бизнес-аналитики останавливаются в этих точках. Они замирают, находясь одной ногой в прошлом, а другой в будущем, не в состоянии совершить скачок. В результате им так и не удается в полной мере воспользоваться преимуществами последующих стадий.
Основной путь преодолеть эти препятствия - изменить восприятие руководителей. Чтобы пересечь трещину, руководители должны понять, что Хранилища данных и бизнес-аналитика - это не просто система внутренней отчетности, и что электронные таблицы и базы данных персональных компьютеров, на которые они опираются в ведении бизнеса, на самом деле подрывают продуктивность и эффективность их деятельности. Чтобы преодолеть пропасть (что гораздо труднее), руководители должны воспринимать Хранилища данных и бизнес-аналитику как жизненно необходимый корпоративный ресурс, которым они сами (а не IT-отдел) обладают, руководят и который они же финансируют.
Но мы сейчас забегаем вперед. Разрешите мне кратко рассказать о каждой стадии и ее основных характеристиках.
Стадия "зачатия": внутренняя отчетность
Большинство организаций имеют управленческие системы внутренней отчетности, в которых генерируется стандартный набор статичных отчетов. Они печатаются и регулярно распространяются среди персонала, обычно еженедельно, ежемесячно или раз в квартал. Поскольку программы для получения данных из существующих систем (или операционного склада данных), которые необходимы для генерации отчетов, пишутся вручную, IT-отдел не может быстро реагировать на требования о специальных отчетах. Это негативно влияет на имидж информационных технологий и разочаровывает пользователей, которым нужен быстрый доступ к информации для выполнения своих задач. Такая неповоротливость особенно чувствительна для бизнес-аналитиков, чья деятельность заключается в обработке цифр от имени руководителей, и для искушенных пользователей, знающих, как обращаться с корпоративными информационными системами. Беря инициативу в свои руки, они "обманывают" информационные технологии, извлекая данные из исходных систем и загружая их в электронные таблицы или базы данных персональных компьютеров. Это подводит нас к следующей стадии.
Стадия "младенчества": "Табличные витрины" (Spreadmarts)
Табличные витрины - это электронные таблицы или базы данных персональных компьютеров, которые функционируют как суррогатные витрины данных. Каждая из них включает индивидуальный набор данных, показателей и правил, которые несовместимы с другими табличными витринами, управленческими отчетами или аналитическим системами. Так как электронные таблицы распространены повсеместно, дешевы и просты в использовании, табличные витрины распространяются как сорняки: организации имеют десятки, если не сотни или тысячи таких "вредных" аналитических структур2.
Табличные витрины не позволяют организации (или исполнительному директору) получить ясную и цельную картину состояния дел в корпорации. Тем не менее, избавиться от них проблематично, поскольку они обеспечивают возможность хорошего локального управления с минимальными затратами, затрудняя, таким образом, пересечение трещины между первой и второй стадиями. На самом деле, те, кто использует табличные витрины, могут не обеспечивать строгий контроль своих аналитических структур до достижения двух последних стадий, когда новые процессы развития и аналитические возможности совмещают интересы на местах с интересами всей корпорации (рис. 2) 3.
Рис. 2. Локальный контроль и корпоративные ценности.
Только когда организация достигает двух последних стадий, локальное управление и рыночная капитализация компании начинают развиваться в одном направлении.
Стадия "детства": витрины данных
На этой стадии отделы осознают необходимость обеспечить оперативной информацией всех своих работников, а не только бизнес-аналитиков и руководителей, которые в основном пользуются преимуществами табличных витрин.
Витрина данных - это общая аналитическая структура, которая обычно поддерживает область работы одного приложения, бизнес-процесса или отдела. Сотрудники отдела обобщают требования к информации и приспосабливают каждую витрину к своим нуждам. Затем они обеспечивают персонал, работающий с информацией, средствами интерактивной отчетности (например, инструментами OLAP, средствами формирования незапланированных запросов или параметризованных отчетов). Эти средства позволяют сотрудникам углубляться в данные и исследовать их пространственную структуру "вдоль и поперек", чтобы выявить тренды и получить более детальную картину событий, являющихся движущими силами тех процессов или задач, которыми эти сотрудники управляют.
Тем не менее, витрины данных часто оказываются жертвой тех же проблем, которые влияют на табличные витрины. Каждая витрина содержит индивидуальные определения и правила и получает данные напрямую из исходных систем. Эти так называемые независимые витрины данных делают важную работу по обеспечению локальных нужд. Тем не менее, другие отделы уже не могут использовать их данные для своих целей. Таким образом, необходим механизм интеграции витрин данных без угрозы для локальной автономии. А это уже - признак стадии "юности".
Стадия "юности": Хранилища данных
После создания третьей витрины данных большинство отделов осознают необходимость стандартизации определений, правил и измерений для того, чтобы в будущем избежать кошмара интеграции. Стандартизация витрин данных может осуществляться централизованным или децентрализованным способом с помощью одной из восьми возможных стратегий4. Наиболее часто встречающаяся стратегия - создание центрального Хранилища данных с логически зависимыми витринами, которые работают с той же базой данных, что и Хранилище. Этот тип Хранилища обычно называется Хранилище данных с архитектурой "звезда" (hub-and-spoke).
Интерактивная отчетность и анализ
В отличие от однопредметных витрин данных, Хранилища данных предполагают более глубокий анализ, поскольку пользователи могут формулировать запросы, не взирая на функциональные границы, такие как финансы и операции, и таким образом получать новые срезы информации, недоступные при распределении данных по операционным и аналитическим изолированным структурам.
Для лучшего мониторинга процессов, в которых участвуют несколько отделов, и цепей создания добавленной стоимости организации используют приложения инструментальных панелей, которые поддерживают системы оповещения, углубленного изучения данных для детальных отчетов и распределенных запросов для извлечения данных из систем, не входящих в Хранилище, а также обеспечивают более оперативное пополнение Хранилищ данных. Эти приложения позволяют организациям предоставить возможности Business Intelligence не только технически образованным опытным пользователям, но и другим сотрудникам. В результате руководители рассматривают Хранилища данных и Business Intelligence как тактический способ увеличить эффективность бизнес-процессов, обеспечить информацией большее количество пользователей и принимать решения, основанные на реальных фактах.
Стадия "зрелости": корпоративное Хранилище данных
Хотя Хранилище данных предоставляет много новых преимуществ, оно не решает проблему аналитических изолированных структур. Большинство организаций сегодня имеют многочисленные Хранилища данных, приобретенные в результате внутреннего развития, слияний или приобретений. Как и табличные и независимые витрины данных, Хранилища отдельных филиалов содержат перекрывающиеся и непоследовательные данные, что создает препятствия для свободного обмена информацией внутри или между бизнес-пользователями и процессами, которыми они управляют.
Интеграционная машина
На стадии "зрелости" организация стремится получить данные, которые, с одной стороны, являются полными и исчерпывающими, а с другой - точными и непротиворечивыми. Руководители рассматривают данные как корпоративное актив, такой же ценный, как персонал, оборудование и финансы. Они отводят для этой цели одно из Хранилищ данных или создают корпоративное Хранилище с нуля. Такое корпоративное Хранилище данных работает как интеграционная машина, которая последовательно включает в себя все остальные аналитические структуры. В завершение гибкий слой Business Intelligence объединяет данные корпоративного Хранилища с внешними данными, которые обычно не загружаются в корпоративное Хранилище по той или иной причине (например, подача данных в режиме реального времени или Web данные). Некоторые организации со стратегией развития, основанной на приобретении других компаний, используют средства корпоративных Хранилищ данных и бизнес-аналитики как основной метод интеграции приобретенных организаций.
Управление и оценочные панели
На стадии "зрелости" корпоративное Хранилище данных служит стратегическим ресурсом корпорации для интеграции данных и поддержки жизненно важных приложений, которые способствуют развитию бизнеса. Для управления этим ресурсом руководители организуют сильную программу управления. Руководители поручают подчиненным осуществлять контроль ключевых элементов данных и назначают комитеты на всех уровнях для управления развитием и расширением корпоративного Хранилища. Что касается аналитики, организация применяет каскадные оценочные панели для того, чтобы деятельность каждого сотрудника и все бизнес-процессы соответствовали корпоративной стратегии. Оценочные панели часто венчают приложения инструментальных панелей, способствуя улучшению существующих показателей и ранжированию инициатив и бюджетов, направленных на поддержку стратегических целей.
Окупаемость инвестиций
На стадии "зрелости" инвестиции в Хранилища данных начинают окупаться. Корпоративное Хранилище данных выигрывает от экономии, обусловленной ростом масштабов производства, и ускоренного развития, что способствует быстрой разработке приложений, необходимых для выполнения новых задач (рис. 3). Кроме того, пользователи обнаруживают новые и неожиданные области применения Хранилищ данных, даже не предусмотренные разработчиками. Это неожиданное расширение сферы применения способствует дальнейшему росту окупаемости инвестиций.
Рис. 3. Окупаемость инвестиций и совершенствование Хранилищ данных.
Хранилища данных начинают окупаться на 4-й и 5-й стадиях.
Стадия "мудрости": бизнес-аналитика
Когда Хранилище данных становится стратегическим ресурсом корпорации, помогающим управлять бизнесом с помощью постоянно растущего набора приложений, необходимых для выполнения новых задач, можно считать, что ваша работа выполнена, и это действительно так! Но есть и дополнительные возможности увеличить стратегическую значимость вашего корпоративного Хранилища данных, развивая этот ресурс как вовне, так и вглубь.
Интерактивные экстрасети
Сегодня многие компании уже открывают свои Хранилища данных для потребителей и поставщиков, расширяя и объединяя цепи создания добавленной стоимости за пределами отдельной организации и используя новые возможности на рынке. Следующее поколение приложений для работы в экстрасетях уже не будет ограничиваться статичными отчетами об объемах операций на счете. Они будут предоставлять потребителям и поставщикам простые, но мощные средства интерактивной отчетности, которые позволят сравнивать и сопоставлять свою деятельность и ее эффективность с другими группами по множеству показателей. Некоторые компании, такие как Owens & Minor, создали новые организационные единицы для оказания услуг в области Хранилищ данных и информационного анализа и в результате добились значительных перемен в своем бизнесе.
Web-сервисы
В то же время создатели корпоративных Хранилищ данных превращают аналитические данные и функции бизнес-аналитики в Web-сервисы, которые их разработчики (как внешние, так и внутренние по отношению к организации) могут использовать при соответствующем разрешении. Появление BI-сервисов превращает корпоративные Хранилища данных и их приложения в средство, которое может использоваться в масштабах всего рынка и легко встраивается в любое приложение. С помощью BI-сервисов сотрудникам уже не придется постоянно менять среду при анализе данных. Данные, информация и детальные выборки, необходимые им для выполнения работы, будут встроены в операционные приложения, которыми они ежедневно пользуются.
"Двигатели" принятия решений
BI-сервисы также позволят компаниям получить полную выгоду от своих вложений в статистический анализ и моделирование. Они могут превратить модели в "двигатели" принятия решений, встроенные во внутренние и внешние приложения. Даже сотрудники, не имеющие статистических навыков, смогут загружать информацию в эти "двигатели" и незамедлительно получать рекомендации. Сегодня "двигатели" принятия решений уже лежат в основе нескольких мощных программных средств, в том числе средств для выявления подлогов, Web идентификации и автоматизированных систем предоставления кредитов.
После того как ваше Хранилище данных достигает стадии "мудрости", его ценность экспоненциально возрастает, в то время как его присутствие становится незаметным. Как BI-сервис, Хранилище данных и аналитический сервер отходят на задний план, становясь важной инфраструктурой, о которой никто не вспоминает до той поры, пока она вдруг не перестает работать в результате какого-либо сбоя. Наша экономика уже сделала товаром многочисленные услуги, такие как электричество, утилизация стоков, вода и транспорт. Возможности глубокого анализа, предоставляемые средствами бизнес-аналитики, станут следующими в этом списке.
Независимо от того, достигли ли вы уже стадии "мудрости" или все еще пытаетесь преодолеть трещину между стадиями "младенчества" и "детства", эта модель совершенствования поможет вам правильно выбрать направление движения и покажет перспективы вашего пути. Модель может показать, где вы находитесь, насколько далеко вы продвинулись и куда необходимо идти дальше. Она обеспечивает ориентиры, чтобы помочь вам оставаться благоразумными и невозмутимыми среди того хаоса и борьбы, с которыми мы сталкиваемся ежедневно.
Литература
- TDWI опубликовал несколько подробных отчетов, в которых можно найти дополнительную информацию по обсуждаемым проблемам. Автор бы посоветовал обратиться к их отчету 2003 г. "Smart Companies in the 21st Century: The Secrets to Creating Successful Business Intelligence Solutions" ("Умные" компании 21-го века: секреты создания успешных решений бизнес-аналитики). Создатели этого 40-страничного отчета используют количественный анализ, чтобы показать, что именно отличает успешные решения в разработке Хранилищ данных и бизнес-аналитики от неудачных. Этот отчет доступен по адресу http://www.tdwi.org/research.
- Наше последнее исследование показало, что в среднем организации имеют 2,1 Хранилищ данных, шесть "независимых" витрин данных, 4,5 операционных складов данных и 28,5 табличных витрин, которые они хотели бы объединить. Данные из отчета TDWI "In Search of a Single Version of Truth: Strategies for Consolidating Analytic Silos" (В поисках единственно верного решения: стратегии для консолидации аналитических хранилищ), июль 2004 г. Этот отчет доступен по адресу http://www.tdwi.org/research.
- Дополнительную информацию по контролю над распространением табличных витрин можно найти в работе "Reeling in Spreadmarts" (Табличные витрины наступают) - исследование ситуации и предложения TDWI, 2004 г.
- За дополнительной информацией можно также обратиться к отчету TDWI "In Search of a Single Version of Truth: Strategies for Consolidating AnalytЗаic Silos" (см. п. 2).
Автор: Уэйн Экерсон (Wayne Eckerson)