Для кредитных учреждений растущий объём данных затрудняет получение чёткого представления об эффективности бизнеса. Поскольку они стараются оптимизировать отчётность – как внутреннюю, так и внешнюю – для расширения возможностей проведения анализа, даже консолидация данных из нескольких операционных систем является серьёзной проблемой. Одновременно усложняются запросы нормативных органов, и многие банки теперь должны предоставлять отчётность в соответствии с множеством местных, региональных и глобальных нормативных требований, каждое из которых может предъявлять различные требования с точки зрения поддерживаемых данных.
И крупным финансовым организациям, которые эксплуатируют несколько бизнес-систем, обрабатывающим значительные объёмы данных, и небольшим банкам, тем не менее сталкивающимся со сложными требованиями к формированию отчётности и выполнению анализа, очевидна ценность хранилища данных. Действительно, хранилище упрощает задачу агрегирования и преобразования данных, «готовит» их для использования в различных приложениях.
Согласно исследованиям Gartner, 76% бюджета любого BI-проекта тратится на внедрение хранилища данных. Во многих статьях, посвященных рискам, возникающим в ходе проектов по внедрению хранилищ, утверждается, что успех проекта зависит от множества присущих этой технологии факторов. В соответствии с данными отчёта Gartner, опубликованного в
Ключевой вопрос для высшего IT-руководства в банках – это выбор между построением хранилища данных своими силами или приобретением коммерческого продукта. Как правило, критерии принятия решения включают в себя соответствие функциональности бизнес-требованиям, надёжность и практичность, начальную цену и стоимость эксплуатации, время развёртывания и риски, масштабируемость и адаптируемость к будущим требованиям, стоимость и риски поддержки и сопровождения. Банки, планирующие внедрить хранилище данных, зачастую пытаются построить его собственными силами, с учётом некоторых или всех перечисленных ниже факторов:
Для каждого пункта в пользу выбора собственного решения есть соответствующий аргумент за выбор коммерческого решения:
Кроме того:
Лучшее в своём классе решение будет обладать внушительным списком прецедентов развёртывания и клиентских отзывов, что поможет с определённой точностью спрогнозировать сроки реализации и стоимость проекта.
Многие из проведённых выше рассуждений одинаково хорошо сгодятся как для обоснования отказа, так и принятия положительного решения о покупке промышленного хранилища данных. Но принять правильное решение, возможно, поможет статистика – следует помнить о том, что по оценке экспертов 60% проектов по разработке собственного хранилища данных не оправдывают ожиданий. Однако, в данном конкретном случае есть ещё более важный фактор, который следует рассмотреть. Это – модель данных. Создание модели данных для корпоративного хранилища таит множество специфических и существенных проблем.
В общем, этапы построения хранилища данных выглядят следующим образом:
Наиболее важной частью хранилища является модель данных: по сути, это - то, что определяет, насколько полезным хранилище будет для бизнеса. Поскольку изначально нет возможности удостовериться, что все необходимые данные собраны в хранилище, и что между ними правильно определены отношения, компании, разрабатывающие собственное хранилище, должны создать информационную модель на основании имеющихся предположений, а затем перейти к следующим после первого этапам. Только на восьмом этапе – в процессе разработки бизнес-логики – возможно проверить верность предположений. Если окажется, что необходимы изменения (а они будут необходимы), придётся повторить все этапы с нуля.
Уже только по этой причине технически сложно, долго и дорого разрабатывать модель данных, которая будет работать как сейчас, так и по мере изменения бизнес-требований. Выбирая сторонний продукт, основанный на обширной, динамичной и расширяемой встроенной модели данных, специально предназначенной для индустрии финансовых услуг, можно избежать всех неопределённостей, рисков и затрат.
Использование наилучшего решения также предоставит доступ к инновационным подходам, которые обычно выходят за рамки внутреннего проекта, в том числе к виртуализации данных, при котором данные содержатся в хранилище в собственном формате. Это, как правило, сокращает до 95% этап трансформации во время ETL-процесса (Extract, Transform, Load, извлечение, преобразование и загрузка данных) и обеспечивает полную прозрачность для аудита любых генерируемых отчётов вплоть до источника данных.