- 9 ноября 2001 г.
Грани web-аналитики
Отсутствие устоявшейся терминологии подвело нас к идее написания краткого
обзора, препарирующего понятие web-аналитики с точки зрения его «физического
наполнения» с целью выявления общих черт и выделения обособленных элементов
этой технологии. Поэтому вторая статья рубрики целиком посвящена разбору
внутреннего содержания web-аналитики, позволяющего, в свою очередь, достаточно
четко провести внешние границы этого термина и определиться с назначением
отдельных его элементов, попутно ознакомившись с актуальными на сегодня
подходами к их реализации.
В российской печати термин "web-аналитика" встречается довольно редко. Понятие Internet-Intelligence, означающее фактически то же самое, вообще как-то не привилось на российской почве. При этом среди западных специалистов данная тема пользуется заметной популярностью. Однако там для этого термина существует масса синонимов и родственных понятий, и практически каждый автор понимает под ним нечто свое. В данной статье мы попытаемся кратко рассмотреть различные аспекты web-аналитики, а также использующиеся в ней технологии. А дабы избежать путаницы в терминологии, заметим, что используемый далее термин "web-аналитика" выбран нами из всего многообразия названий постольку, поскольку именно он, как правило, используется на русскоязычных ресурсах, описывающих подобную функциональность конкретных продуктов.
В целом представление о web-аналитике как о бизнес-анализе (business intelligence, BI) через Интернет вполне справедливо. И как бы она не называлась, суть от этого не меняется, и web-аналитика не перестает быть отдельной областью реализации бизнес-аналитических технологий со своими собственными особенностями и требованиями.
Технологии Хранилищ данных, OLAP, DataMining и язык XML
Самым привычным решением для web-аналитики является реализация бизнес-анализа на базе Хранилища данных. Первоначально задачей Хранилища был сбор корпоративной информации и предоставление ее через броузер внутренним и внешним пользователям. Для выполнения собственно бизнес-анализа в такой аналитической системе используется OLAP-сервер, а клиентом, предоставляющим пользователю доступ к информации и бизнес-анализу через Интернет, собственно и привносящим в эту технологию приставку "web-", может служить, например, ASP-страничка сайта (подобный подход был реализован в продукте "Контур Корпорация" компании Intersoft Lab). Таким образом, бизнес-анализ становится доступен не избранным сотрудникам предприятия, а широкому кругу персонала компании и внешним пользователем из числа ее потребителей, поставщиков и партнеров.
Как видно из приведенного выше общего описания, средствами реализации бизнес-анализа анализа через Интернет являются, как и в случае внутрикорпоративных аналитических систем, различные инструменты OLAP и DataMining, специально предназначенные для работы в web-среде. Наши постоянные читатели, опираясь на публикуемые нами регулярные обзоры и новости, посвященные решениям западных поставщиков, наверняка смогут назвать массу подобных продуктов. Сейчас такие решения включены практически во все аналитические пакеты известных производителей.
Следует также отметить, что наиболее популярным средством обмена данными в web-аналитике является язык XML. XML позволяет свободно передавать и объединять структурированные и неструктурированные данные, а также преобразовывать результат в HTML-формат для просмотра через web-броузеры. Все это дает возможность работать не только со структурированной информацией Хранилищ и витрин данных, но и разрозненными и разноформатными данными унаследованных систем и реляционных баз данных. Эти технологии уже известны постоянным читателям Журнала по многим нашим публикациям. Причина популярности XML именно в web-аналитике частично заключается в его удобстве для броузеров, и частично - в его достаточно широком распространении в обычном бизнес-анализе, позволяющем предложить возможности web-анализа всему XML-сообществу.
Технологии EIP
Все прочие разновидности web-аналитики, по сути, являются усовершенствованными версиями данной "простейшей" аналитической системы. Например, почему бы, имея в своем распоряжении весь Интернет, не попробовать собирать не только внутрикорпоративные, но и внешние данные? Используя XML, системы решают эту задачу без особых проблем. А полученную информацию можно затем объединить в рамках корпоративного информационного портала (enterprise information portal, EIP), число которых сегодня растет достаточно активно.
Естественно, все это приводит к тому, что объем хранимой информации стремительно возрастает. Добавьте сюда еще и потенциально бесконечное число пользователей, которое способен обеспечить вашему Хранилищу Интернет, и вы получите массу головной боли с быстродействием ваших бизнес-аналитических средств. Что делать? Самым привычным решением, широко используемым и вне web-аналитик, является так называемая витрина данных - локальная многомерная база данных, отражающая информацию по определенной тематике.
Еще одним шагом на пути повышения эффективности web-аналитики стало создание OLAP-броузеров. Это решение позволяет исключить операции с огромными Хранилищами данных, способные существенно замедлить обработку информации. OLAP-броузер способен считывать не только странички, но и микрокубы, генерируемые специальной программой на основе Хранилища данных поставщика информации, а также отображать эту информацию для пользователя через Интернет.
Технология "виртуальной интеграции"
Следует также отметить, что использование в качестве базы данных всего Интернет-пространства раскрывает перед пользователем необычайные аналитические перспективы. Учитывая нерентабельность гигантских Хранилищ данных в условиях огромного числа пользователей и данных, свойственном Интернет, решением проблемы могла бы стать и реорганизация процесса сбора данных из еще более разнородных источников, которые в этом случае будут уже включать и Хранилища, и унаследованные системы и базы данных, и исследовательские материалы, и новостные ресурсы или страницы, относящиеся к определенному географическому региону или специализированным областям Интернет - таким, как, например, компьютерные журналы или спортивные выпуски новостей. В данном случае основным вопросом становится усовершенствование не способов хранения, а методов сбора информации. Описанный метод, названный авторами "виртуальной интеграцией", разбивает логический бизнес-запрос на отдельные фрагменты и обращается к различным источникам данных, позволяя предоставлять пользователю более концентрированную информацию, необходимую в данный момент. Решение, реализующее эту технологию, предложено компанией NQuire.
Технологии E-Intelligence
Описывая понятие web-аналитики, имеет смысл упомянуть и о других толкованиях этого термина, встречающихся в различных источниках. Наиболее естественным "ответвлением" понятия "web-анализ" можно считать его применение исключительно к анализу электронной коммерции. Такая "web-аналитика" направлена исключительно на анализ работы сайтов электронной коммерции (e-commerce) и в зарубежных источниках часто носит отдельное название "электронной аналитики" (e-intelligence) Разумеется, электронный бизнес чрезвычайно популярен сегодня, однако анализ его эффективности с помощью средств BI вовсе не есть квинтэссенция всей web-аналитики. И как бы он не назывался, выделить этот сектор из общей массы достаточно просто - такой бизнес-анализ обычно встречаться в трех видах, однозначно связанных с оценкой работы сайта электронной коммерции:
- clickstream-анализ представляет собой анализ навигации и взаимодействия посетителей с сайтом электронной коммерции;
- анализ электронных продаж, представляющий собой классический анализ продаж применительно к среде электронного бизнеса;
- непрерывное отслеживание взаимоотношений с посетителями сайта, представляющее собой основанный на clickstream-анализе элемент CRM-стратегии электронного бизнеса, целью которого является усовершенствование и персонализация маркетинга.
Однако, несмотря на разнообразие отраслей ее применения, web-аналитика имеет весьма четкие характеристики, позволяющие говорить о ней как об отдельной области современного бизнес-анализа (BI), и мы надеемся, что теперь скромное обаяние этого красивого термина больше никогда не смутит наших читателей и не скроет от них истинных функциональных возможностей той или иной системы.
Автор: По материалам зарубежных сайтов