Консалтинг и автоматизация в области управления
эффективностью банковского бизнеса

Журнал ВРМ World

Анализ рынка ETL-инструментов от аналитика Bloor Research

Несмотря на то, что различные аспекты ETL-процесса (extraction, transformation, loading - извлечение, преобразование, загрузка) уже подробно освещались на страницах нашего Журнала, мы решили вновь вернутся к этой теме и познакомить вас с точкой зрения ведущего эксперта аналитической компании Bloor Research Фила Ховарда (Phil Howard).

В своем исследовании "Будущее ETL", которое было опубликовано популярным ресурсом IT-Director.com, Фил Ховард опровергает существующее мнение о том, что состав игроков на рынке ETL-средств уже сложился: в частности, что ряд поставщиков традиционных Business Intelligence (таких как SAS, Business Objects и Cognos) предлагают свои собственные инструменты, которые традиционно продаются вместе с BI и аналитическими приложениями, а не как отдельные продукты. По словам аналитика Bloor Research, на ETL-рынке присутствует масса компаний, готовых поставить свои фирменные разработки. Эти инструменты предназначены для работы только со средой поставщика, в отличие от так называемых открытых ETL-инструментов, которые могут извлекать данные из любой среды. Подобные инструменты неизбежно загружают данные в определенный продукт (от определенного поставщика), но могут также работать и с ограниченными источниками.

Возникает вопрос: зачем использовать специфический ETL-инструмент вместо обычного? Согласно Филу Ховарду, на это имеется два веских основания. Во-первых, фирменный ETL-инструмент обладает специализированным пониманием исходных данных. Это характерно для Web-аналитики - многие компании, как, например, NetIQ (WebTrends Intelligence Suite), Site Intelligence и SPSS (NetGenesis), используют фирменную технологию для понимания web-логов, тегированных данных на станицах и так далее.

Во-вторых, в фирменных средах ETL-инструмент понимает как схему Хранилища данных, так и исходные данные. В результате, поставщик может предварительно создавать все правила преобразования. Благодаря этому весь ETL-процесс может быть автоматизирован. А это - значительное преимущество.

Однако фирменными ETL-инструментами могут быть не только те, которые обладают специализированными знаниями об исходных данных, к ним можно отнести и те, что предназначены для загрузки данных в определенные продукты. Например, аналитические и BI-платформы, предлагаемые такими компаниями, как Alterian и Aruna, используют свои собственные ETL-средства, поскольку при загрузке данных они автоматически создают индексы базы данных. Или Cache, продукт компании InterSystems - база данных между клиентской частью баз данных Oracle и прикладной частью Хранилища данных Oracle. Хотя это и кажется странным, но гораздо разумнее использовать Cache, а не встроенные возможности Oracle или любое обычное ETL-приложение, поскольку Cache оказывается более "шустрым" (и обладает отличными возможностями преобразования).

В заключение, Фил Ховард объясняет, почему поставщики построили свои собственные инструменты. Так, в некоторых случаях необходимая для поставщика технология оказалась недоступной. Или существует потребность в специализированной функциональности, как, например, создание индексов. Или же, и это самый главный аргумент, потому что обычные ETL-продукты обладают множеством ненужных для поставщика функций. Это особенно справедливо в отношении поставщиков Web-аналитики и других продуктов - этим компаниям нужно просто полностью автоматизировать ETL-процесс.