- 5 апреля 2005 г.
XML-стандарты: работа не прекращается
Новые XML-спецификации от международных органов стандартизации.
Одним из потрясающих достоинств языка XML, которое как ни странно упоминается достаточно редко, является удивительная "бизнес-гибкость" XML, появляющаяся в том, что XML постоянно находит новое практическое применение. Очевидно, в значительной мере именно поэтому и продолжается деятельность международных организацией, занимающихся разработкой различных XML-спецификаций.
В соответствии со сложившейся традицией, мы продолжаем знакомить читателей с наиболее яркими и знаковыми, на наш взгляд, событиями, произошедшие в области XML-технологий.
Новые спецификации W3C и IETF
В середине февраля международный консорциум W3C выпустил спецификацию "Character Model for the World Wide Web 1.0: Fundamentals" ("Символьная модель для всемирной сети, версия 1.0: основные понятия"), имеющую статус рекомендации.
Данная рекомендация - это первый документ в серии публикаций, посвященных описанию символьной модели. Авторы спецификации полагают, что она будет способствовать использованию всемирной сети всеми людьми независимо от их языка, алфавита, системы записи и культурных традиций - в соответствии с общей целью W3C, заключающейся в обеспечении универсального доступа. Одно из ключевых условий достижения этой цели - возможность передавать и обрабатывать символы в корректно определенном и хорошо понятном виде. Предлагаемая модель должна позволить пользователям всемирной сети осуществлять обмен Web-документами, подготовленными посредством различных способов письма (и на различных платформах), чтение этих документов и поиск.
В спецификации приводится общая справочная информация по обработке текстов, опирающихся на набор универсальных символов (Universal Character Set, сокр. UCS), определенных в стандартах Unicode Standard и ISO/IEC 10646. В документе также рассмотрено использование терминов "символ" ('character'), "кодирование" ('encoding') и "строка" ('string'), выбор и идентификация кодирования символов, переключение символов и индексирование строк, описывается справочная модель обработки.
Другие документы из упомянутой выше серии публикаций включают спецификации "Character Model for the World Wide Web 1.0: Resource Identifiers" ("Символьная модель для всемирной сети, версия 1.0: идентификаторы ресурсов") и "Character Model for the World Wide Web 1.0: Normalization" ("Символьная модель для всемирной сети, версия 1.0: нормализация"). Первый документ - архитектурная спецификация, в которой содержится общая справочная информация по использованию идентификаторов ресурса и, в частности, указываются интернационализированные идентификаторы ресурса. Второй документ включает сведения о начальной унифицированной нормализации и сопоставлении идентичности строк, предназначенных для улучшения манипулирования совместимыми текстами во всемирной сети.
Помимо этого, представители консорциума заявили о поддержке двух других публикаций: "Uniform Resource Identifier (URI): Generic Syntax" ("Универсальный идентификатор ресурсов: общий синтаксис") и "Internationalized Resource Identifiers (IRIs)" ("Интернационализированные идентификаторы ресурсов"), в работе над которыми, помимо W3C, принимала участие целевая группа инженерной поддержки Internet (Internet Engineering Task Force, сокр. IETF).
Как известно, всемирная сеть определяется как универсальное, всеобъемлющее пространство, содержащее все Internet - и другие - ресурсы, указываемые с помощью универсальных идентификаторов ресурса (Uniform Resource Identifier, сокр. URI), которые иногда называют универсальными указателями ресурса (Uniform Resource Locator, сокр. URL). В первоначальном предложении Тима Бернерса-Ли (Tim Berners-Lee) всемирная паутина состояла из относительно небольшого числа технологий, включая протокол HTTP и язык HTML. Однако, вероятно, более фундаментальными понятиями по сравнению с HTTP и HTML оказались универсальные идентификаторы ресурса, представляющие собой простые текстовые строки, указывающие на ресурсы Internet - документы, ресурсы, людей и т.д. Таким образом, универсальные идентификаторы - это "клей", который связывает всемирную паутину воедино. Что же касается интернационализированных идентификаторов ресурса, то они расширяют и усиливают этот клей, позволяя пользователям устанавливать ресурсы Web на своем родном языке.
Стоит добавить, что в ходе разработки стандартов Internet (Internet Standards Process) целевая группа инженерной поддержки Internet выпустила тысячи публикаций, в том числе приблизительно 60 стандартов Internet. Упомянутые ранее спецификации, которые в настоящий момент имеют статус стандартов, предложенных к рассмотрению (Proposed Standard) - это лишь малая часть результатов деятельности этой группы.
В первом документе описываются структура, синтаксис и разрешение универсальных идентификаторов ресурса, анализируются вопросы безопасности, нормализации и сравнения (определения эквивалентности двух идентификаторов).
Данный стандарт предназначен для использования вместо одноименной спецификации, выпущенной в 1998г. Основное отличие новой редакции - поддержка интернационализированных имен доменов ведущим компонентом универсальным идентификатором.
Одна из причин появления второй спецификации заключается в том, что, за некоторыми исключениями, многие алфавиты используют символы, отличные от A-Z. Переход от допустимых символов из подмножества US-ASCII к набору универсальных символов (Unicode/ISO 10646) разрешает разработчикам и пользователям указывать ресурсы на своих собственных языках. Кроме того, многим спецификациям W3C - XML, RDF, XHTML и SVG - необходима точная справочная информация для идентификаторов, которые поддерживают международные символы, и эта спецификация обеспечивает эту критически важную информацию.
В соответствие с новым стандартом, каждый универсальный идентификатор ресурса - это уже интернационализированный идентификатор. В результате, при поиске информации в сети пользователям не нужно предпринимать каких-либо особенных действий. В документе также обсуждается, как преобразовывать интернационализированный идентификатор в универсальный идентификатор ресурса для разрешения на существующих системах, рассматриваются такие вопросы, как особый случай двунаправленных интернационализированных идентификаторов, эквивалентность интернационализированных идентификаторов, их использование в различных ситуациях.
UDDI: долгожданный стандарт OASIS
За несколько дней до появление рассмотренной выше рекомендации консорциума W3C "Character Model for the World Wide Web 1.0: Fundamentals" международная организация OASIS утвердила в качестве стандарта третью версию спецификации UDDI (Universal Description, Discovery and Integration, Универсальное описание, обнаружение и интеграция), которая разрабатывалась с середины 2002г. В данной спецификации определяются Web-сервисы, структуры данных и поведение всех экземпляров регистра UDDI. В ней описывается регистр Web-сервисов и программных интерфейсов, предназначенных для публикации, извлечения информации об описанных в них сервисах и управления этой информацией.
В соответствие с правилами разработки и утверждения стандартов OASIS, семь членов организации предоставили подтверждение успешного использования UDDI 3.
Как отмечается во вступлении к спецификации, Web-сервисы имеют смысл только в том случае, если потенциальные пользователи могут найти информацию, достаточную для их выполнения. Предназначение UDDI - это определение набора сервисов, поддерживающих описание и обнаружение: 1) бизнесов, организаций и прочих поставщиков Web-сервисов; 2) доступных Web-сервисов; 3) технических интерфейсов, которые могут быть использованы для доступа к этим сервисам. Благодаря тому, что стандарт UDDI опирается на ряд отраслевых спецификаций, включая HTTP, XML, XML Schema (Схема XML) и SOAP (Simple Object Access Protocol, Простой протокол доступа к объектам), он обеспечивает совместимую базовую инфраструктуру для основанных на web-сервисах программных средах как для общедоступных сервисов, так и для развернутых для использования исключительно внутри организации.
Протокол UDDI - это центральный элемент группы связанных между собой спецификаций, которые сообща описывают Web-сервисы. В третьей версии стандарта определен стандартный метод публикации и обнаружения сетевых программных компонентов сервис-ориентированной архитектуры. Основная цель этой версии стандарта - поддержка безопасного взаимодействия приватных и открытых реализаций как главного элемента сервис-ориентированной инфраструктуры.
Некоторые функциональные возможности, поддержанные в спецификации UDDI, получили дальнейшее развитие в третьей версии; основное, архитектурное отличие этой редакции стандарта - концепция "присоединение регистра" ('registry affiliation'). Это изменение символизирует растущее понимание того, что UDDI является одним элементом из более крупного набора технологий Web-сервисов, которые поддерживают проектирование и операции бесчисленных программных приложений, применяемых в организациях.
Понятие присоединение означает использование UDDI для поддержки разнообразных сетевых/инфраструктурных топологий. Эта возможность появились в результате расширения автономного, основанного на одном регистре подхода до подхода, включающего иерархический, равноправный, переданный и другие регистры. Одним словом, структура регистра (регистры) UDDI теперь может воспроизводить реалии и отношения базовых бизнес-процессов, которые она поддерживает.
Таким образом, в новой версии стандарта реализуются несколько моделей взаимодействия регистров. С помощью таких механизмов, как "публикация и подписка" (publish - subscribe) и репликация среди равноправных узлов регистра, информация в серверах UDDI может быть полностью доступной, частично приватной или даже полностью приватной и изолированной от общедоступной сети.
Автор: По материалам зарубежных сайтов