Журнал ВРМ World

Мировая история развития технологий управления эффективностью бизнеса – обзоры зарубежных публикаций

Тенденции программного обеспечения в области визуализации данных для бизнес-пользователей

Одной из наименее исследованных тем OLAP-технологий являются системы и
способы визуализации информации в OLAP-приложениях. Сегодня мы предлагаем
вниманию читателя статьи, освещающие методы исследования аналитической
информации с помощью графических средств. Первая статья расскажет о развитии
этих технологий, их сегодняшнем состоянии и перспективах.

Понятие визуализации данных описывает графические изображения, генерируемые программой, в которой контент изображения определяется считыванием цифровых данных. Обычно данные представлены в числовой форме, но существуют и программы, способные визуализировать понятия, заложенные в текстовых документах. Такие программы организуют геометрические фигуры - точки, линии, круги и прямоугольники - таким образом, чтобы они представляли собой интерпретацию считываемых программой данных. Атрибуты - относительное расстояние, размер и цвет - отражают отношения между геометрическими фигурами. Визуализация данных завоевала значительную популярность в среде бизнес-пользователей, поскольку она поддерживает ряд важных бизнес-задач - например, процессы принятия решений, управление знаниями и управление бизнес-процессами. В последние годы программное обеспечение в области визуализации данных для бизнес-пользователей развивается под действием трех тенденций:

  • Разработка сложных видов диаграмм. Большинство визуализаций данных построено на основе диаграмм стандартного типа. Это либо элементарные секторные диаграммы, либо сложные графики рассеяния. За последние годы перечень видов диаграмм, поддерживаемых программами, существенно расширился.
  • Повышение уровня взаимодействия с визуализацией пользователя. Пару лет назад большая часть визуализаций представляла собой статичные диаграммы, предназначенные исключительно для просмотра. Сегодня на передний план выходят динамические диаграммы, уже сами по себе являющиеся пользовательским интерфейсом, в котором пользователь может напрямую и интерактивно манипулировать визуализацией, подбирая новое представление онлайновой информации.
  • Увеличение размеров и сложности структур данных, представляемых визуализацией. Элементарная секторная диаграмма или гистограмма визуализирует простые последовательности числовых информационных точек. Однако новые усовершенствованные типы диаграмм способны визуализировать тысячи таких точек и даже сложные структуры данных - например, нейросети.

Рисунок 1 демонстрирует график этих тенденций, одновременно встраивая в их контекст ряд функциональных свойств, общих для всех программ визуализации данных. Этот график отражает и тенденцию перехода от форм элементарной визуализации данных (rudimentary data visualization, RDV) к усовершенствованным формам (advanced data visualiztion, ADV) - на Рисунке 1 это показано перемещением от нижнего левого к верхнему правому углу изображения. Элементарные формы визуализации данных (секторные диаграммы, гистограммы и презентационная графика) присутствовали в программах многие годы, тогда как более современные формы (с интерактивными пользовательским интерфейсами, возможностями drill-down и взаимодействия с данными) достаточно новы. Пунктирные линии на Рисунке 1 показывают жизненный цикл элементарных и усовершенствованных форм визуализации данных, выделяя три этапа этого цикла: созревание, развитие и активизацию.




Рисунок 1: Тенденции визуализации данных

Развитие диаграмм - прокладка курса

Базовые диаграммы, обычно включающие секторные диаграммы и гистограммы, являются одновременно и старейшими, наиболее распространенными формами визуализации данных и, в то же время, - самыми элементарными. Презентационная графика, призванная произвести необходимое впечатление на читателей презентаций и отчетов, придавала базовым диаграммам броский внешний вид за счет трехмерных изображений, анимации и различных цветовых эффектов - например, градиентной заливки.

Поскольку потребности пользователей весьма многообразны, визуализационные программы поддерживают самые различные типа диаграмм. Например, известно, что бизнес-пользователи предпочитают секторные диаграммы и гистограммы, тогда как ученых больше устраивают визуализации в виде графиков рассеяния и диаграмм констелляции. Пользователи, работающие с геопространственными данными, сильнее заинтересованы в картах и прочих трехмерных представлениях данных. Электронные инструментальные панели в свою очередь, больше популярны среди руководителей, использующих бизнес-аналитические технологии для контроля за показателями работы компании. Такие пользователи нуждаются в более наглядной визуализации в виде "спидометров", "термометров" и "светофоров".

Средства создания диаграмм и презентационной графики предназначены главным образом для визуализации данных. Однако возможности такой визуализации обычно встроены и во множество различных других программ и систем - в инструменты репортинга и OLAP, средства для text mining и data mining, а также в CRM-приложения и приложения для управления бизнесом. Для создания встроенной визуализации многие поставщики реализуют визуализационную функциональность в виде компонент, встраиваемых в различные инструменты, приложения, программы и web-страницы (в том числе инструментальные панели и персонализированные страницы порталов).

Бизнес-программы для создания диаграмм прошли путь от статичных и весьма поверхностных диаграмм до интерактивных визуализаций, включающих возможности взаимодействия с данными и drill down. Такая мощная функциональность присутствует в программном обеспечении новой категории - корпоративных системах создания диаграмм (enterprise charting systems, ECS). С помощью этих систем пользователи могут разрабатывать и использовать аналитические приложения с диаграммами, способными обеспечить визуализацию данных, соответствующую требованиям бизнес-анализа (business intelligence) на уровне предприятия.

Помимо бизнес-применения визуализация данных используется и как неотъемлемая часть программ, предназначенных для различных научных исследований. Визуализация данных способствует изучению математических, статистических, географических и пространственных данных. При этом ряд программ визуализации данных для бизнес-пользователей позаимствовали типы своих диаграмм у ученых. Сюда относятся, например, графики рассеяния и диаграммы констелляции.

Однако, в отличие от ученых, обычно спокойно воспринимающих сложную техническую функциональность программ, требующую иногда некоторых специфических знаний - например, знакомства с языками программирования или статистикой, бизнес-пользователи нуждаются в маскировке такой функциональности простым пользовательским интерфейсом. Визуализация данных для бизнес-пользователей должна предлагать информацию в простой и понятной форме, не требующей особых навыков для ее непосредственного применения в управлении бизнесом - в частности, при анализе или исследовании поведения потребителей, категорий продуктов или работы предприятия.

Следует отметить, что представление множества синхронных визуализаций более уместно при обработке сложных множеств данных (особенно многомерных), которые было бы затруднительно представить единственным изображением. В таких случаях диаграммы необходимо увязывать между собой, чтобы изменения, сделанные пользователем в одной из них, отражались во всех остальных диаграммах.

Возьмите данные в свои руки - буквально

Наиболее впечатляющим изменением в визуализации данных стал переход от статических диаграмм, предназначенных исключительно для просмотра, к динамическим онлайновым визуализациям, допускающим взаимодействие пользователя с данными. Пользователь может пополнять интерактивную визуализацию самыми последними данными (аналогично процессу выпуска отчетов) или работать с ее контентом (аналогично работе с приложением).

Например, базовое взаимодействие позволяет пользователю вращать диаграмму или изменять ее тип в поисках наиболее полного представления данных. Кроме того, пользователь может менять визуальные свойства - например, шрифты, цвета и рамки. В визуализациях сложного типа - например, графиках рассеяния или диаграммах констелляции - пользователь может выбирать информационные точки с помощью мыши и перемещать их, облегчая тем самым понимание представления данных.

Более совершенные методы визуализации данных часто представляют диаграмму или любую другую визуализацию как составной уровень. Пользователь может углубляться (drill down) в визуализацию, исследуя подробности обобщенных ею данных или углубляться (drill down) в OLAP, data mining или другие сложные технологии.

Сложное взаимодействие позволяет пользователю изменять визуализацию для нахождения альтернативных интерпретаций данных. Взаимодействие с визуализацией подразумевает минимальный по своей сложности пользовательский интерфейс, в котором пользователь может управлять представлением данных, просто кликая на элементы визуализации, перетаскивая и помещая представления объектов данных или выбирая пункты меню. Инструменты OLAP или data mining превращают непосредственное взаимодействие с визуализацией в один из этапов итерационного анализа данных. Средства text mining или управления документами придают такому непосредственному взаимодействию характер навигационного механизма, помогающего пользователю исследовать библиотеки документов.

Визуальный запрос является наиболее современной формой сложного взаимодействия пользователя с данными. В нем пользователь может, например, видеть крайние информационные точки графика рассеяния, выбирать их мышкой и получать новые визуализации, представляющие именно эти точки. Приложение визуализации данных генерирует соответствующий язык запроса, управляет его принятием базой данных и визуально представляет результирующее множество. Пользователь может сфокусироваться на анализе, не отвлекаясь на составление запроса.

Рассматривая мышь как продолжение человеческой руки, сложное взаимодействие с визуализацией буквально вкладывает данные в руки пользователя и помогает ему удерживать их. Курсор мыши находится на визуализации, а не в выпадающем меню. Глаза пользователя направлены на визуализацию, вместо того чтобы метаться между визуализацией и диалоговыми окнами. Таким образом пользователь получает возможность сосредоточиться на поиске и анализе информации вместо того, чтобы возиться с пользовательским интерфейсом.

Тысяча информационных точек

Одной из очевидных тенденций, прослеживающихся в сложной визуализации данных, является переход от средних гистограмм и секторных диаграмм, отражающих простые серии числовых информационных точек, к представлению больших и/или сложных наборов данных. Например, средства OLAP (а также инструменты генерации запросов и выпуска отчетов) уже давно поддерживают диаграммы для своих онлайновых отчетов. Но возможности визуализации сложных многомерных данных даже сегодня содержат лишь немногие OLAP-средства. Обычные диаграммы подразумевают однократное считывание данных. Новые же визуализационные программы обновляют контент за счет периодически повторяющегося считывания данных. Фактически пользователи визуализационных программ, отслеживающие линейные процессы (колебания фондового рынка, показатели работы компьютерных систем, сейсмограммы, сетки полезности и др.), нуждаются в загрузке данных в режиме реального времени или близком к нему режиме.

Пользователи средств data mining обычно анализируют очень большие наборы численных данных. Поскольку традиционные типы диаграмм для бизнеса (секторные диаграммы и гистограммы) плохо справляются с представлением тысяч информационные точек, инструменты data mining почти всегда поддерживают некую форму визуализации данных, способную отражать структуры и тенденции крупных наборов данных. Обычно средства data mining состоят из нескольких алгоритмов, каждый из которых использует определенный аналитический подход, собственные возможности взаимодействия с данными и соответствующую визуализацию. Также большая часть CRM-приложений позволяет пользователю изучать большие базы данных по имеющимся и потенциальным клиентам за счет встроенных технологий data mining и визуализации.

Помимо того, что визуализация данных обычно подразумевает обработку структурированных числовых данных, она также является ключевым средством представления схем так называемых неструктурированных данных, например - текстовых документов. В частности, новое поколение средств text mining может осуществлять парсинг больших пакетов документов и формировать предметные указатели понятий (иногда называемые таксономией) и тем, освещенных в этих документах. Когда предметные указатели созданы с помощью нейросетевой технологии, пользователю непросто продемонстрировать их сложность без некоторой формы визуализации данных. Визуализация обычно преследует две цели: (1) визуальное представление контента библиотеки документов и (2) навигационный механизм, который пользователь может применять при исследовании документов и их тем.

Визуализируя будущее

Очевидность преимуществ визуализации данных для систем анализа данных и управления знаниями обратила на нее внимание бизнес-пользоватлей. Тем не менее, сложная визуализация данных не нашла у них достаточно широкого одобрения. Одним из препятствий стала новизна этих технологий. До сих пор маркетинг этих методов оставляет желать лучшего. В то же время сложная визуализация данных обычно встроена в продукты, сами по себе являющиеся новинками рынка - инструменты data mining, новое поколение средств text mining и персонализированные страницы корпоративных порталов.

Но даже в этих условиях потребность в визуализации данных и стремление к ее использованию в бизнесе в ближайшие годы будет расти, в то числе и благодаря следующим факторам:

  • Ориентации на потребителя. Компании осознают, что анализ клиентских данных способствует окупаемости инвестиций в информационные технологии. Поэтому многие компании стремятся собрать очень подробные данные - особенно когда дело касается потребительского поведения на web-узле (clickstream). Эти массивные наборы данных наиболее успешно обрабатываются аналитическими методами с применением сложной визуализации данных.
  • Массивным наборам данных в электронном бизнесе. С распространением электронного бизнеса сбор данных осуществляется все в более широком спектре - от внутренних операций до цепочки снабжения, взаимодействия с потребителями и далее. Эти массивные наборы данных требуют углубленной разработки и анализа для повышения производительности и эффективности, а те, в свою очередь, требуют сложной визуализации данных для отражения различных тенденций и схем.
  • Визуальным интерфейсам пользователя (Visual User Interfaces, VUIs). Приложения на основе броузеров, а также web-сайты содержат предустановленные стандартные описания внешнего вида пользовательского интерфейса, поэтому визуализация данных станет обычным элементом следующего поколения пользовательских интерфейсов. Зачатки VUIs можно встретить и в аналитических приложениях на основе метрики (например, в инструментальных панелях), а развитие корпоративных порталов увеличит потребность в VUIs в виде персонализированных страниц порталов.

Автор: Филип Рассом (Philip Russom)