Консалтинг и автоматизация в области управления
эффективностью банковского бизнеса

Журнал ВРМ World

Новые подходы к управлению данными: мнение экспертов

В последнее время многие эксперты отмечают рост интереса к комплексному управлению данными. Причины этого интереса варьируются. Некоторых оно интересует в связи с управлением средствами НСИ, бизнес-анализом (BI) или другими IT-инициативами. Другие обратились к управлению данными, для того чтобы обеспечить особые выгоды бизнесу, предотвратить риски или улучшить качество и цельность данных.

Модель данных

Независимо от проблем, которые побуждают компании обращаться к комплексному управлению данными, сам процесс реализации этой программы имеет много общих моментов: организационная структура с поддержкой руководства, участие разных отделов, соответствующие политики, процедуры и практики, поддерживающие технологии.

Джонатан Гейгер (Jonathan Geiger), автор трех книг и многочисленных статей по хранилищам данных, считает, что важное место в этой программе должны занимать модели данных. Они должны быть равнозначными по сравнению с другими компонентами программы по комплексному управлению данными. Сердцевиной этой программы является потребность рассматривать данные как актив. Действительно, другие программы по управлению активами подразумевают формализованный подход для организации информации об активе – управление финансовыми активами использует план счетов; управление кадрами использует организационные планы и т.д. Точно так же управление данными должно поддерживаться моделью данных. Специалисты выделяют разные уровни модели данных.

Модель предметной области (Subject-Area Model)

Ее построение начинается с концепции планирующего, в которой предметные области обеспечивают структуру для организации активов данных. Так же, как план счетов рисует схему активов и задолженностей в бухгалтерском балансе, а доходы и расходы - в отчете о прибылях и убытках, предметные области определяют 15-20 главных классов информации. Обычно предметные области включают продукты, местоположения, клиентов, человеческие ресурсы и т.п. Другая важная предметная область, особенно в контексте комплексного управления данными, - это информация.

В отличие от модели данных бизнеса, модель предметных областей может быть разработана быстро - за несколько часов или дней. Примерные объекты внутри каждой предметной области должны быть включены в определение, чтобы улучшить его понимание сотрудниками. При желании можно также обозначить основные связи между предметными областями. Помимо того, что предметные области помогают в разработке моделей данных, они также вносят свой вклад в структуру комплексного управления данными. В частности:

Поддержка в расстановке приоритетов: предметные области могут быть использованы для установления областей данных, которые необходимо рассмотреть в первую очередь. Один из способов определения этого – независимая оценка возможного влияния каждой предметной области и уровня удовлетворенности по отношению к факторам, комплексного управления данными. Например, если управление данными внедряется с целью улучшить согласованность аналитических отчетов, каждая предметная область может быть оценена, основываясь на влиянии на бизнес качественных данных, используемых в отчетах (где 5 – высокая степень) с учетом степени доступности этих данных в настоящий момент (где 5 – низкая степень). Результат этих двух показателей даст информацию об относительных приоритетах предметных областей в поддержке достижения поставленных целей. 

Назначение ответственных за сопровождения данных: один из подходов для определения лиц, ответственных за сопровождение данных – назначить их, основываясь на данных, с которыми они работают. (Другой подход отталкиваться от  подразделений, которые они представляют). Предметные области обеспечивают базу для осуществления таких назначений.

Модель данных бизнеса (Business Data Model)

Эта модель представляет данные компании и связанные бизнес-правила, независимые от бизнес-процесса и организационной структуры. Только одна модель такого рода существует в компании. Она обычно создается как «логическая» модель в третьей нормализированной форме. Эта модель прописывает значения информации, собранной и выверенной в результате действий по комплексному управлению данными. Она включает:

  • Индивидуальные атрибуты данных, сгруппированные внутри объектов.
  • Определения для каждого атрибута и объекта.
  • Отношения между объектами, их обязательность и мощность.
  • Другие «метаданные», получаемые в ходе процесса моделирования.
Системная модель данных (System Data Model)

Эта модель обычно извлекается из модели данных бизнеса, чтобы охватить данные в масштабах определенной системы. В ходе перехода объекты и атрибуты данных могут быть скорректированы, основываясь на масштабе и цели системы. Кроме того, поскольку эта модель, в конце концов, будет внедрена, она денормализуется, основываясь на требованиях к производительности и использовании разрабатываемой системы.

Технологическая модель (Technology Model)

Эта модель трансформирует системную модель в физическую, которая отражает платформу и СУБД, на которой реализуется модель. На этом уровне могут быть включены типы данных и другие физические характеристики. Когда эта модель разрабатывается с использованием инструмента моделирования данных, последний может нередко использоваться для генерирования языка описания данных (DDL), который создаст конечную схему.

Выводы

Эффективная программа комплексного управления данными требует возможности организации данных и хранения критически важной информации о данных, и модель данных позволяет удовлетворить большую часть этих потребностей. На самом высоком уровне модель обеспечивает структуру, а на низшем уровне (технологий) она обеспечивает параметры для физической структуры.

Эта модель должна быть усилена соответствующим бизнес-процессом и возможностью управлять другой информацией о данных (например, метаданными). Некоторые метаданные могут храниться в инструменте моделирования данных, хотя нередко требуется более удобное средство (репозиторий) для улучшения эффективности управления метаданными и предоставления их пользователям.

Качество данных – вечная и важная тема

Качество данных – необходимый элемент для получения ожидаемых результатов от внедрения BI. Согласно прогнозам аналитиков, понимание этого и стремление повысить качество данных - тенденция, которая будет по-прежнему актуальна о в 2012 году.

Борис Эвельсон (Boris Evelson) из Forrester Research полагает, что получение практических результатов от проектов по внедрению BI станет основным лейтмотивом в 2012 году.

IT-специалисты ведущих компаний признают, что ориентации на нескольких крупных поставщиков, которые, согласно исследованиям Gartner, больше заинтересованы в сохранении status quo, чем в предложении чего-то нового, уже недостаточно, чтобы решить потребности компании в области качества данных. И поэтому они обращаются к специализированным компаниям.

Согласно другому важному прогнозу эксперта, BI перейдет в руки конечных пользователей, но этот процесс должен контролироваться и управляться на должном уровне. Это является продолжением тенденции, начавшейся несколько лет назад, и связано с признанием компаниями важности участия обычных пользователей в проектах по качеству данных и управлению данными.

Бизнес-проекты обычно сильнее ограничены по срокам, чем IT-проекты, и могут иметь более размытые цели. Например, одному отделу нужно определить всех клиентов в определенном сегменте, чтобы адекватно среагировать на запуск нового продукта конкурентом. В то же время юристам нужно проверить его соответствие законодательству страны и т.д. IT-отделу сложно быстро осуществить анализ данных такого рода – обычно все запросы пользователей выстраиваются в очередь, и менее приоритетная задача может быть решена слишком поздно. Это негативно скажется на бизнесе. Но если бы пользователь участвовал в проекте с самого начала, то IT-отделу было бы проще решить задачу.

Специализированные платформы качества данных позволяет бизнес-пользователям взять на себя ответственность за управление данными и решение вопросов качества данных. Некоторые из этих специализированных инструментов позволяют пользователям быстро извлечь качественные данные. Такие инструменты также способствуют формированию подхода, основанного на данных, который необходим для успешного управления данными и НСИ. Способность поставщика передать это знание сотрудникам компании могут внести огромный вклад в способность организации управлять данными и преодолеть разрыва между бизнесом и IT.

Качество данных рассматривается как главный фактор, способствующий успешному управлению данными, НСИ и BI-проектами, а также является ключевым компонентом многих проектов по отчетности и выполнению требований органов регулирования и надзора.

Качество данных в 2012 году 

Мнение Эвельсона разделяет и другой эксперт - Кларк Паттерсон (Clarke Patterson). Он также отмечает рост интереса к качеству данных во всех отраслях и ожидает, что в 2012 году он будет только расти. В частности Паттерсон выделяет три тенденции.

Комплексное управление данными продолжит набирать обороты

Управление данными вышло на передний план в 2011 году. Компании все больше видят ценность данных для различных направлений бизнеса и будут пытаться управлять ими эффективно, чтобы максимизировать отдачу от данных. Будь то улучшение принятия решений, оптимизация работы пакетов приложений или устранение проблем, вызванных «большими данными», комплексное управление данными станет для компаний решением, к которому они обратятся, чтобы убедиться в том, что их усилия принесут лучшие результаты.

Возрастет значимость сопровождения данных

Увеличение важности управления данными приведет к тому, что сопровождение данных (data stewardship) обретет ключевую роль в большинстве организаций. Паттерсон считает, что до настоящего дня сопровождение данных было больше практикой, а не специфической ролью внутри компаний. Однако по мере того, как будут появляться более формальные программы по управлению данными, этот подход перестанет быть адекватным.

Ценность качества данных станет очевиднее

По мнению Паттерсона, чем больше компании пытаются улучшить операционные затраты, повысить доходы и управлять рисками, не улучшая качество данных, тем лучше они будут понимать, что качество данных само по себе является ключевым компонентом для претворения всех этих целей в жизнь.

Станет яснее, что управление НСИ, усилия по оптимизации приложений и управлению будут хороши ровно настолько, насколько качественны данные, на которых они основываются. Управление качеством данных таким образом выйдет на первый план.

Заключение

Эксперты отмечают рост интереса к комплексному управлению данными. При этом некоторые из них обращают внимание на то, что эффективность этого процесса можно значительно увеличить за счет использования моделей данных. В то же время никакие усилия в этом направлении не принесут ожидаемых результатов, если не учтен ключевой фактор – качество данных.

Публикации

  1. Джонатан Гейгер. Роль модели данных в комплексном управлении данными (Jonathan G. Geiger. The Data Model’s Role in Data Governance). 10 января 2012 г.
  2. 2012 год – год качества данных? (Is 2012 the year of delivery for data quality?). Январь 2012 г.
  3. Кларк Паттерсон. Гадая на чайных листьях: прогнозы на качество данных в 2012 г. (Сarke Patterson. Reading The Tea Leaves: Predictions For Data Quality In 2012). 20 января 2012 г.