- 1 марта 2002 г.
Графика в OLAPBrowser
Современное OLAP-средство уже немыслимо без сложного графического анализа.
Поэтому продукт компании Intersoft Lab - OLAPBrowser - предоставляет богатую
палитру инструментов управления графическим отображением данных. Одновременно
разработчики стремились сделать эти инструменты простыми в понимании и
использовании. OLAPBrowser позволяет пользователю управлять диаграммами -
фильтровать, сортировать, менять местами факты и измерения, менять типы
диаграмм и выполнять тонкие настройки - в онлайновом режиме.
Введение
Одно из главных требований к аналитическим системам и системам поддержки принятия решений - наглядность представления данных пользователю.
Суть OLAP - превращение огромных массивов данных, неподдающихся осмыслению, в стройную и ясную информацию, предоставляющую пользователю четкую картину бизнеса.
Поэтому диаграммы и графики являются неотъемлемой частью OLAP-интерфейсов, а в некоторых случаях - главным способом визуализации данных.
В отличие от всех прочих информационных систем, диаграммы в OLAP не статичны, а интерактивны. Пользователь, манипулируя измерениями, меняет представление данных в диаграммах, получая десятки их разновидностей в процессе исследования информации.
Вторая особенность диаграмм в OLAP - многомерность.
Эта статья показывает возможности и проблемы графического отображения данных в OLAP-системах на примере системы Контур OLAPBrowser.
Система Контур OLAPBrowser предназначена для OLAP-анализа в Интернет, локальной сети, на персональном компьютере. Она работает с данными, предварительно сохраненными в многомерный локальный куб, и показывает эти данные в виде динамической таблицы и синхронной с ней диаграммой.
Отображение многомерного гиперкуба в трехмерном пространстве
Ученое слово "гиперкуб" означает, что этот куб больше, чем куб. У него может быть не 3, а 5, или 10 измерений. Представить и изобразить такой куб в рамках 3-х мерного пространства, ограниченного высотой, шириной и глубиной, невозможно.
Разработчики применяют специальные методы для отображения неотображаемого. Основной метод - показ нескольких последовательностей (series) на одном графике. Каждая последовательность закрашивается отдельным цветом. Группа последовательностей представляет собой значение одного 4-го измерения.
Например, для показа объемов продаж в разрезе времени и городов применяется следующий метод: по вертикали отображается сумма, по горизонтали время, а "в глубину" - города. Реально на плоскости диаграммы рисуется разными цветами: столько диаграмм, сколько есть городов. Соответствие цвета и города показывается в специальной таблице - легенде.
Итак, диаграмма может отобразить одновременно не более 2-х измерений и одного факта.
В случае, если нужно показать несколько фактов, их показывают "в глубину", и для измерений остается только одна ось. Таким образом, если отображается более одного факта, то в диаграмме остается не более одного измерения.
Существуют сложные виды диаграмм, которые демонстрируют исключение из правила. Например, при помощи "пузырей" разного диаметра можно изобразить сразу 2 факта. Один показывается как высота пузыря над горизонтальной осью, а второй - как его диаметр. В этом случае диаграмма может отобразить два факта и два измерения.
Виды диаграмм и графиков
Для каждого вида анализа подходит свой тип диаграммы. Изменять тип диаграммы можно в реальном времени.
Линия
Линия удобна для показа изменений во времени - трендов. По горизонтали отображается время, а по вертикали - факт. Если измерений больше одного, то линия хорошо показывает зависимости между процессами.
Например, несколько линий показывающих объемы продаж разных товаров в одном магазине во времени, позволяют выяснить связь между продажами нескольких товаров и сформировать правильный ассортимент - покупательскую корзину.
ТочкиТочки - это родственный с линией вид графика. Точки применяются, когда нет связи между соседними по горизонтали значениями факта. Например, когда по вертикали отложены суммы продаж, а по горизонтали отложены не даты, а города.
Столбцы
Столбцы хорошо помогают сравнивать значения нескольких измерений и являются наиболее универсальным типом диаграмм в OLAP-приложениях.
Пирог
Пирог - это одномерная диаграмма. Один факт отображается в разрезе одного измерения. Такая диаграмма идеально показывает доли. Например, доли продавцов в выручке.
Область
Область - показывает площади. Это полезно для отображения остатков на складе, задолженности по кредиту. Области наглядно отображают дюрацию - произведение времени на объем.
Здесь перечислены самые распространенные виды диаграмм. Каждая из них имеет множество разновидностей, например, столбцы можно показать как цилиндры или пирамиды, но это мало меняет суть и имеет большей частью эстетическое значение. Существуют и более изощренные диаграммы, такие как поверхность, график Гантта. Эти диаграммы не так очевидны и применимы либо в особых случаях, либо для особых групп пользователей.
Разрешение проблем
При показе больших объемов данных в диаграммах неизбежно возникают проблемы. Наиболее частые из них такие:
- Диаграмма имеет так много элементов, что они сливаются.
- Значений измерений больше, чем цветов в палитре компьютера, и различить к чему относится элемент становится затруднительно.
- Метки к элементам диаграммы перекрывают саму диаграмму.
- Подписи к осям диаграммы не входят в пределы окна.
- В окно легенды входят не все измерения.
Для разрешения этих проблем применяются следующие методы:
- Разбиение диаграммы на несколько страниц.
- Всплывающие подписи (hints) к элементам диаграммы.
- Изменения масштаба шрифтов.
- Изменение содержания меток.
- Изменение угла, под которым отображаются подписи к осям.
- Скроллинг значений в легенде.
Ряд этих настроек может сделать автор приложения и сохранить. Многие из них должен выполнять сам пользователь в процессе работы с данными.
Сложные настройки
Часто для того, чтобы диаграмма была показана наиболее ярко и наглядно, требуется выполнить тонкие настройки.
Настройки 3-х мерного отображения. Диаграмма может быть повернута под заданным углом, изменена ее глубина, внесено перспективное искажение, выбран ортогональный режим, включены или выключены тени.
Настройки базовой фигуры. Диаграмма типа Столбец может быть показана как пирамида, или перевернутая пирамида, набор стрелок, цилиндр. Линия может быть помечена точками. Точки могут быть шарами, кубами, прямоугольниками, треугольниками.
Заливка. Элементы могут быть залиты сплошным цветом, штриховкой, быть прозрачными.
Расположение элементов. В трехмерном пространстве элементы могут быть отображены в глубину подобно городским домам с высоты птичьего полета, рядом друг с другом, друг над другом.
Расположение меток. Для большей понятности диаграмму можно снабдить метками - надписями над ее элементами, можно настроить тексты меток - названия элементов, проценты по отношению к другим элементам и пр. Метки можно располагать над, под, рядом с элементами.
Тонкие настройки диаграммы не стоит игнорировать. Часто они могут радикально улучшить понятность интерфейса и его привлекательность.
Аналитические функции
Диаграммы позволяют не только повторить данные, имеющиеся в исходном массиве, но и выполнять вычисления.
Группировка - эта функция доступна в диаграмме типа Пирог. Смысл функции состоит в суммировании всех элементов, чья доля меньше, чем заданное значение в "Прочие". Так можно увидеть группу товаров, которые принесли 80% выручки и скрыть остальные товары в общем сегменте.
Сдвиг наибольшего куска - это тоже функция диаграммы Пирог. Она позволяет моментально выделить лидера. Наибольший сегмент выдвигается из прочих сегментов.
Сортировка - диаграмма может быть отсортирована отдельно от OLAP-таблицы, что полезно для сравнения и выявления "крупнейших" и "наименьших".
Разбиение на сегменты - диаграмма типа Столбец может показать линии раздела на заданной пользователем высоте и наглядно разбить элементы на "большие чем" и "меньшие чем".
Статистические функции - некоторые диаграммы могут вычислить статистические функции по указанным последовательностям и отобразить их рядом с базовыми последовательностями. Например, среднемесячный курс доллара может быть вычислен и наложен в виде линии на линию, показывающую ежедневный курс доллара.
Синхронность с таблицей
Как правило, диаграмма работает синхронно с OLAP-таблицей. Поворот таблицы приводит к повороту диаграммы - изменению расположения измерений по осям, фильтрация таблицы - к фильтрации диаграммы. Это придает OLAP-интерфейсу особую динамичность и "живость".
Иногда наоборот удобно пользоваться собственными инструментами преобразования диаграммы, не меняя таблицы. Например, быстрое выключение элементов измерения позволяет исключить из графика лишнее и провести экспресс-анализ зависимостей, при этом в таблице остаются доступными все данные.
Автор: Владимир Некрасов, технический директор компании Intersoft Lab