Autor: Mariusz �ebrowski.
Lokalizacja:
http://www.antyspam.pl/w3c/REC-xml-infoset-20040204/
Dokument ten jest t�umaczeniem rekomendacji XML Information Set (Second Edition). Przek�ad ten
nie jest przek�adem normatywnym i mo�e zawiera� b��dy wynikaj�ce z
t�umaczenia. Status normatywny posiada jedynie wersja angielskoj�zyczna na
stronie W3C
http://www.w3.org/TR/2004/REC-xml-infoset-20040204/.
Dokument jest chroniony prawem autorskim. Copyright © 2004 W3C®
(MIT, ERCIM, Keio).
Prosz� zobaczy� errat� dla tego dokumentu, kt�ra mo�e zawiera� pewne normatywne poprawki.
Zobacz tak�e t�umaczenia.
Copyright ©1999-2004 W3C® ( MIT, ERCIM, Keio), Wszystkie prawa zastrze�one. W3C stosuje powy�sze zasady dotycz�ce odpowiedzialno�ci cywilnej, trademark, u�ywania dokumentu i licencji oprogramowania.
Ta specyfikacja oferuje zestaw definicji dla u�ycia w innych specyfikacjach, kt�re potrzebuj� odnosi� si� do informacji w dokumencie XML.
Ten paragraf opisuje status tego dokumentu od czasukiedy jest opublikowany. Inne dokumenty mog� zast�pi� ten dokument. Lista bie��cych publikacji W3C i najnowsz� weryfikacj� tego raportu technicznego mo�na zanale�� na W3C technical reports index na http://www.w3.org/TR/.
Ten dokument jest Rekomendowany przez W3C. Zosta� on zbadany przez cz�onk�w W3C i inne strony zainteresowane oraz zatwierdzony przez dyrektora jako Rekomendacja W3C. To jest dokument stabilny i mo�e by� u�ywany jako materia� odniesienia lub cytowany jako odniesienie normatywne z innego dokumentu. Zadaniem W3C w wydaniu tej rekomendacji jest przyci�gni�cie uwagi do tej specyfikacji i promowanie jej szerokiego zastosowania. Wzbogaci to funkcjonalno�� i interoperacyjno�� sieci Web.
Ten dokument uaktualnia Infoset b�d�c nak�adk� na wersj� XML 1.1 i przestrze� nazw 1.1, wyja�nia konsekwencje pewnych rodzaj�w niepoprawno�ci sk�adniowej i poprawiania pewnych b��d�w typograficznych. To jest produkt W3C XML Activity. Tylko angielska wersja specyfikacji jest wersj� normatywn�. Jednak�e, szukaj�c t�umacze� tego dokumentu zobacz http://www.w3.org/2003/03/Translations/byTechnology?technology=xml-infoset.
Documentacja z intelektualn� w�a�ciwo�ci� mo�e odnosi� si� do tych rekomendacji mo�e by� znaleziona na publicznej stronie Working Group IPR disclosure page.
Prosimy zg�asza� b��dy w tym dokumencie na adres [email protected] (publiczne archiwa s�� dost�pne). Lista erraty dla tej rekomendacji jest dost�pna na http://www.w3.org/2001/10/02/xml-infoset-errata.html.
Ta specyfikacja definiuje abstrakcyjny zbi�r danych Zbi�r informacyjny XML (ang. XML Information Set (Infoset)). Jego celem jest dostarczanie sp�jnego zbioru definicji do wykorzystania w innych specyfikacjach, kt�re potrzebuj� odnosi� si� do informacji w poprawnie sk�adniowo uformowanym dokumencie XML [XML].
Celem jej nie jest bycie wyczerpuj�c�; G��wnym kryterium przy doborze przedmiot�w informacyjnych albo w�a�ciwo�ci jest spodziewana u�yteczno�� w przysz�ych specyfikacjach. Tak�e nie stanowi zestawu minimum informacji, kt�re musz� by� zwracane przez procesor XML.
Dokument XML posiada zbi�r informacyjny je�eli jest poprawnie sformu�owany i zachowuje ograniczenia przestrzeni nazw opisane w below. Aby dokument XML posiada� zbi�r informacyjny nie jest wymagane aby by� poprawny sk�adniowo.
Zbiory informacyjne mog� by� tworzone przez inne metody (nie opisane w tej specyfikacji) inne ni� analiza gramatycza dokumentu XML. Patrz Synthetic Infosets poni�ej.
Zbi�r informacyjny dokumentu XML sk�ada si� z pewnej liczby przedmiot�w / element�w informacyjnych; zbi�w informacyjnych dla ka�dego poprawnie sformu�owanego dokumentu XML b�dzie zawiera� conajmniej przedmiot / element informacyjny document oraz kilka innych. Przedmiot informacyjny jest abstrakcyjnym opisem pewnej cz�ci dokumentu XML; ka�dy element informacyjny posiada zwi�zany z nim zbi�r nazwanych w�a�ciwo�ci. W tej specyfikacji nazwy w�a�ciwo�ci s� przedstawione w nawiasach kwadratowych, [thus]. Typy przedmiot�w informacyjny s� wymienione w section 2.
Zbi�r informacyjny XML nie wymaga lub preferuje szczeg�lnego interfejsu lub klasy interfejs�w. Ze wzgl�du na jasno�� i prostot�, ta specyfikacja przedstawia zbi�r informacyjny jako zmodyfikowane drzewo, jednak�e nie jest wymagane aby Zbi�r Informacyjny XML by� dost�pny jako struktura drzewiasta; mo�liwe s� inne typy interfejs�w mi�dzy innymi oparte na zdarzeniach i zapytaniach w celu dostarczania informacji w spos�b zgodny z Zbiorem Informacyjnym XML.
Terminy "zbi�r informacyjny" i "przedmiot / element informacyjny" s� podobnie rozumiane jak powszechnie u�ywane w informatyce terminy "drzewo" i "w�ze�". Jednak�e w tej specyfikacji u�ywane s� pierwsze z tych okre�le� w celu ograniczenia mo�liwo�ci pomy�ki z innymi modelami danych. Elementy informacyjne nie przek�adaj� si� jeden-do-jeden na w�z�y DOM lub "drzewa" i "w�z�y" modelu danych XPath.
W tej specyfikacji zak�ada si� znaczenie s��w "musi", "powinien" i "mo�e" zgodnie z [RFC2119], z takim wyj�tkiem �e s�owa te nie s� przedstawione kapitalikiem.
R�ne wersje specyfikacji XML mog� przedstawia� r�wne regu�y analizy. Zbi�r informacyjny dokumentu XML jest zdefiniowany aby by� jedynym otrzymanym poprzez jego analiz� zgodnie z regu�ami specyfikacji, kt�rej wersja odpowiada wersji z dokumentu. Dokument kt�ry nie specyfikuje numeru wersji jest uwa�any za dokument w wersji 1.0. Je�li procesor XML akceptuje dokument z numerem wersji, kt�rej nie zna, niekoniecznie oznacza to �e bedzie w stanie utworzy� poprawny zbi�r informacyjny.
XML dokumenty, kt�re nie s� zgodne z [Przestrzeniami nazw], chocia� s� technicznie dobrze ukszta�towane, nie s� uwa�ane za posiadaj�ce znacz�ce zbiory informacji. To znaczy, �e ta specyfikacja nie okre�la zbior�w informacji dla dokument�w, kt�re posiadaj� nazwy elementu, lub atrybutu zawieraj�ce dwukropki, kt�re s� u�ywane w inny spos�b, ni� zalecany przez [Przestrzenie nazw].
W dodatku, ta specyfikacja nie okre�la zbioru informacji dla dokument�w, kt�re u�ywaj� wzgl�dnych odno�nik�w URI w deklaracjach przestrzeni nazw. Jest to zgodne z decyzj� Plenarnej Grupy Interesu W3C XML opisanej we [Wzgl�dnych Odno�nikach Przestrzeni Nazw URI].
Warto�ci� w�asno�ci [namespace name] (nazwa przestrzeni nazw) jest znormalizowana warto�� odpowiadaj�cego atrybutu przestrzeni nazw; �aden dodatkowy uwalniany URI nie odnosi si� do tego przez procesor.
Zbi�r informacji opisuje jego dokument XML z ju� rozszerzonymi odno�nikami element�w rekordu, tj. przedstawiany przez elementy informacyjne odpowiadaj�ce tekstowi, kt�ry jest na ich miejscu. Jednak s� r�ne okoliczno�ci, w kt�rych procesor mo�e nie wykona� tego rozszerzenia. Element rekordu mo�e nie by� zdeklarowany, lub mo�e nie by� mo�liwy do odzyskania. Procesor niewaliduj�cy mo�e wybra� nie czyta� wszystkich deklaracji, a nawet je�li nie, mo�e rozszerzy� wszystkie zewn�trzne elementy rekordu. W takich przypadkach element infomacyjny nierozszerzonego odno�nika elementu rekordu jest u�ywany do przedstawiania odno�nika elementu rekordu.
Warto�ci wszystkich w�asno�ci w Zbiorze informacji bior� pod uwag� normalizacj� ko�ca wiersza opisan� w [XML], 2.11 "Obs�ugiwanie ko�ca wiersza".
Niekt�re elementy informacyjne posiadaj� w�asno�ci [base URI] (podstawowy URI) lub [declaration base URI] (deklaracja podstawowego URI). S� one wyliczone zgodnie z [Podstaw� XML]. Zauwa�, �e odzyskanie �r�d�a mo�e zawiera� przekierowanie na poziom analizatora sk��dni (np. w przeliczniku elementu rekordu) lub ni�ej; w tym przypadku podstawowy URI jest ko�cowym URI u�ywanym do odzyskania �r�d�a po wszystkich przekierowaniach.
Warto�� tych w�asno�ci nie odzwierciedla �adnego uwalnianego URI, co mo�e by� wymagane do odzyskania �r�d�a, ale mo�e zawiera� uwalniane znaki, je�eli by�y okre�lone w dokumencie, lub oddane przez serwer w celu przekierowania.
W niekt�rych przypadkach (takich jak czytanie dokument�w z �a�cucha znak�w lub potoku) zasady [Podstawy XML] mog� doprowadza� do podstawowego URI, kt�ry jest zale�ny od aplikacji. W takich przypadkach ta specyfikacja nie okre�la warto�ci w�asno�ci [podstawowego URI] lub [deklaracji podstawowego URI].
Podczas rozwi�zywania wzgl�dnych w�asno�ci URI [podstawowy URI] powinny by� u�ywane w preferencji do warto�ci atrybut�w xml:base; mog� by� sprzeczne w przypadku Syntetycznych Zbior�w Informacji.
Niekt�re w�asno�ci mog� czasem posiada� warto�ci nieznany lub brak warto�ci, i powiedziano, �e warto�� w�asno�ci jest nieznana, lub �e w�asno�� odpowiednio nie posiada warto�ci. Te warto�ci r�ni� si� od siebie i od wszystkich innych warto�ci. W szczeg�lno�ci r�ni� si� od pustego ci�gu znak�w, pustego zbioru i pustej listy, ka�dy z kt�rych poprostu nie ma element�w. Ta specyfikacja nie u�ywa terminu warto�� zerowa poniewa� w niekt�rych spo�eczno�ciach ma to szczeg�lne znaczenie, co mo�e nie pasowa� do tych przeznaczonych tutaj.
Jak zanotowano powy�ej, dokument XML nie musi by� wa�ny, aby posiada� zbi�r informacji. Jednak pewne rodzaje niewa�no�ci wp�ywaj� na warto�ci przypisane pewnym w�asno�ciom. Elementy rekordu, zapisy, elementy i atrybuty mog� by� niezdeklarowane. Zapisy i elementy mog� by� wielokrotnie zdeklarowane (wielokrotne deklaracje s� wa�ne dla element�w rekordu i atrybut�w). ID mo�e by� niezdefiniowany lub wielokrotnie zdefiniowany. Takie przypadki s� zauwa�ane w stosownych miejscach, w poni�szych definicjach Element�w Informacyjnych.
Ta specyfikacja opisuje zbi�r informacji wynikaj�cy z analizowania dokumentu XML. Zbiory informacji mog� by� skonstruowane przy pomocy innych �rodk�w, na przyk�ad przy u�yciu API takich jak DOM lub przez przekszta�canie istniej�cych zbior�w informacji.
Zbi�r informacji odpowiadaj�cy prawdziwemu dokumentowi b�dzie koniecznie zgodny na wiele sposob�w; np. w�asno�� [przestrzeni nazw in-scope] elementu b�dzie zgodna z w�asno�ciami [atrybut�w przestrzeni nazw] elementu i jego przodk�w. To nie mo�e by� prawdziwe przy zbiorze informacji skonstruowanego innymi sposobami; w takim przypadku nie b�dzie �adnego dokumentu XML odpowiadaj�cego zbiorowi informacji i aby dokona� jego serializacji b�dzie wymaga� rozdzielenia niezgodno�ci (np. przez uzyskanie deklaracji przestrzeni nazw, kt�re odpowiadaj� przestrzeniom nazw w zakresie).
Zbi�r informacji mo�e zawiera� do jedenastu r�nych typ�w przedmiot�w informacyjnych, jak wyja�niono w nast�puj�cych sekcjach. Ka�dy przedmiot informacyjny posiada w�a�ciwo�ci. Dla u�atwienia odnoszenia, ka�da w�asno�� posiada nazw�, An information set can contain up to eleven different types of information item, as explained in the following sections. Every information item has properties. For ease of reference, each property is given a name, wskazan� [w ten spos�b]. Odno�niki do definicji i/lub sk��dni w Rekomendacji XML 1.0 [XML] s� podane dla ka�dego przedmiotu informacyjnego.
Definicja XML: dokument (Cz�� 2, Dokumenty)
Sk�adnia XML: [1] Dokument (Cz�� 2.1, Dobrze ukszta�towane Dokumenty XML )
Jest dok�adnie jeden przedmiot informacyjny typu dokument w zbiorze informacji i wszystkie inne przedmioty informacyjne s� dost�pne z w�a�ciwo�ci przedmiotu informacyjnego typu dokument, zar�wno bezpo�rednio, jak i po�rednio poprzez w�a�ciwo�ci innych przedmiot�w informacyjnych.
Przedmiot informacyjny typu dokument posiada nast�puj�ce w�a�ciwo�ci:
Definicja XML: element (Cz�� 3, Struktury Logiczne)
Sk�adnia XML: [39] Element (Cz�� 3, Struktury Logiczne)
Wyst�puje przedmiot informacyjny typu element dla ka�dego elementu pojawiaj�cego si� w dokumencie XML. Jeden z przedmiot�w informacyjnych typu element jest warto�ci� w�asno�ci [elementu dokumentu] przedmiotu informacyjnego typu dokument, odpowiadaj�cego korzeniowi drzewa element�w i wszystkie inne elementy informacyjne typu element s� dost�pne porzez rekurencyjne wyst�powanie po ich w�asno�ciach [potomk�w]:
xmlns
, kt�rych w�asno�� [prefiks] nie ma
warto�ci)
maj� przestrze� nazw URI
http://www.w3.org/2000/xmlns/
.
je�eli element nie posiada deklaracji przestrzeni nazw, ten zbi�r nie ma element�w.
xml
, kt�ry jest domniemany, zwi�zany z nazw� przestrzeni nazw
http://www.w3.org/XML/1998/namespace
.
Nie zawiera przedmiotu z prefiksem
xmlns
(u�ywanego dla
deklarowania przestrzeni nazw), poniewa� aplikacja nigdy nie mo�e napotka� elementu lub atrybutu z tym prefiksem.
Zbi�r b�dzie zaweira� przedmioty przestrzeni nazw odpowiadaj�ce wszystkim elementom [atrybuty przestrzeni nazw],
z wyj�tkiem jakichkolwiek deklaracji przedstawiaj�cymi formularz xmlns="" orlub
xmlns:name="", kt�ry nie deklaruje przestrzeni nazw, ale raczej nie deklaruje domy�lnej warto�ci przestrzeni nazw
i prefiks�w.
Podczas roz��czania prefiks�w nazw z�o�onych ta w�asno�� powinna by� u�ywana w odniesieniu do w�asno�ci
[atrybuty przestrzeni nazw]; mog� by� niezgodne z przypadkiem
Syntetyczne zbiory informacji
.
Definicja XML: atrybut (Sekcja 3.1, Znaczniki pocz�tkowe, znaczniki ko�cowe, i znaczniki pustych element�w)
XML Syntax: [41] atrybut (Sekcja 3.1, Znaczniki pocz�tkowe, znaczniki ko�cowe, i znaczniki pustych element�w)
Jest przedmiot informacyjny typu atrybut dla ka�dego atrybutu (okre�lonego lub domy�lnego) ka�dego elementu w dokumencie, ��cznie z tymi, kt�re s� deklaracjami przestrzeni nazw. Te drugie jednak pojawiaj� si� jako elementy w�asno�ci element�w [atrybuty przestrzeni nazw] raczej ni� jego w�asno�ci [atrybuty].
Atrybuty zdeklarowane w DTD bez warto�ci domy�lnej i nieokre�lone w znaczniku pocz�tkowym elementu nie s� reprezentowane przez przedmioty informacyjne typu atrybut.
Przedmiot informacyjny typu atrybut posiada nast�puj�ce warto�ci:
Definicja XML: instrukcja przetwarzania (Cz�� 2.6, Instrukcje przetwarzania)
Sk��dnia XML: [16] PI (Cz�� 2.6, Instrukcje Przetwarzania)
Jest przedmiot informacyjny typu instrukcja przetwarzania dla ka�dej instrukcji przetwarzania w dokumencie. Deklaracja XML i deklaracje tekstowe dla zewn�trznych zanalizowanych element�w rekordu nie s� uwa�ane za instrukcje przetwarzania.
Przedmiot informacyjny typu instrukcja przetwarzania posiada nast�puj�ce w�asno�ci:
xml:base
na elementach.
Definicja XML: Cz�� 4.4.3, Zawarty w przypadku walidacji
przedmiot informacyjny typu nierozszerzony odno�nik elementu rekordu s�u�y jako miejsce dla kt�rego procesor XML mo�e wskaza�, �e nie zosta� rozszerzony zewn�trzny element rekordu. Taki przedmiot informacyjny istnieje dla ka�dego nierozszerzonego odno�nika do zewn�trznego elementu rekordu w obr�bie zawarto�ci elementu. Waliduj�cy procesor XML, lub niewaliduj�cy procesor czytaj�cy wszystkie zewn�trzne og�lne elementy rekordu, nigdy nie b�d� nigdy generowa� przedmiot�w informacyjnych typu nierozszerzalny odno�nik elementu rekordu dla wa�nego dokumentu.
Przedmiot informacyjny typu nierozszerzalny odno�nik elementu rekordu posiada nast�puj�ce w�asno�ci:
Sk�adnia XML: [2] Char (Cz�� 2.2, Znaki)
Wyst�puje przedmiot informacyjny typu znak dla ka�dego znaku danych pojawiaj�cego si� w dokumencie, zar�wno dos�ownie, jak i odno�nik znaku, lub w obr�bie sekcji CDATA.
Ka�dy znak jest logicznie oddzielnym przedmiotem informacyjnym, ale aplikacje XML mog� dzieli� znaki w wi�ksze grupy je�li jest to konieczne lub wymagane.
Przedmiot informacyjny typu znak posiada nast�puj�ce w�asno�ci:
Definicja XML: komentarz (Cz�� 2.5, komentarze)
Sk�adnia XML: [15] Komentarz (Cz�� 2.5, Komentarze)
Jest przedmiot informacyjny typu komentarz dla ka�dego komentarza XML w oryginalnym dokumencie, z wyj�tkiem tych pojawiaj�cych si� w DTD (kt�re nie s� przedstawione).
Przedmiot informacyjny typu komentarz posiada nast�puj�ce w�asno�ci:
Definicja XML: typ dokumentu i deklaracji (cz�� 2.8, J�zyk Prolog i typ deklaracji )
Sk�adnia XML: [28] doctypedecl (cz�� 2.8, J�zyk Prolog i typ deklaracji)
Je�eli dokument XML posiada deklaracj� typu dokumentu, wtedy zbi�r informacji zawiera pojedynczy przedmiot informacyjny deklaracji typu dokumentu . Zauwa�, �e elementy rekordu i zapisy s� zapewnione jako w�asno�ci przedmiotu informacyjnego dokumentu, nie jako przedmiot informacyjny deklaracji typu dokumentu.
Przedmiot informacyjny deklaracji typu dokumentu posiada nast�puj�ce w�asno�ci:
Definicja XML: element rekordu (cz�� 4, Struktury fizyczne)
Sk�adnia XML: [71] GEDecl (cz�� 4.2, Elementy rekordu)
Wyst�puje przedmiot informacyjny typu niezanalizowany element rekordu dla ka�dego niezanalizowanego og�lnego elementu rekordu zdeklarowanego w DTD.
Przedmiot informacyjnytypu niezanalizowany element rekordu posiada nast�puj�cych w�asno�ci:
Definicja XML: zapis (cz�� 4.7, Zapisy)
Sk�adnia XML: [82] NotationDecl (cz�� 4.7, Zapisy)
Jest przedmiot informacyjny typu zapis dla ka�dego zapisu zdeklarowanego w DTD.
Przedmiot informacyjny typu zapis posiada nst�puj�ce w�asno�ci:
Ka�dy element w dokumencie posiada przedmiot informacyjny przestrzeni nazw dla ka�dej przestrzeni nazw, kt�ra jest w zasi�gu tego elementu.
Informacja o przestrzeni nazw posiada nast�puj�ce w�a�ciwo�ci:
xmlns:
.
Je�eli nazw� atrybutu jest po prostu
xmlns
,
tak, �eby deklaracja by�a jego domy�ln� przestrzeni� nazw, ta w�asno�� nie ma warto�ci.
Poniewa� celem zbioru informacji jest zapewnienie zbioru definicji, zgodno�� jest w�asno�ci� specyfikacji u�ywaj�cych tamtych definicji raczej ni� implementacji.
Specyfikacje odnosz�ce si� do zbioru informacji musz�:
Je�eli specyfikacja zezwala na konstruowanie zbioru informacji, kt�ry zawiera niezgodno�ci jak opisano poni�ej Syntetyczne zbiory informacji, mo�e opisa� jak te niezgodno�ci maj� by� rozwi�zane i tak powinna zrobi�, je�eli zapewnia serializacj� zbioru informacji.
http://www.w3.org/TR/REC-xml-names
.
http://www.w3.org/TR/xml-names11
.
http://www.ietf.org/rfc/rfc2119.txt
.http://www.w3.org/TR/REC-xml
.
http://www.w3.org/TR/xml11
.
http://www.w3.org/TR/xmlbase
.
http://www.w3.org/TR/REC-DOM-Level-1
.
http://www.w3.org/TR/NOTE-xptr-infoset-liaison
.http://www.w3.org/2000/09/xppa
.
http://www.w3.org/TR/xml-infoset-rdfs
.
Pomimo, �e Rekomendacja [XML] jest zasadniczo zwi�zana ze sk�adni� XML, r�wnie� zawiera troch� specjalich wymaga� raportowania dla porocesor�w XML.
Wymagania raportowania zawieraj� b��dy, kt�re s� poza zasi�giem tej specyfikacji i informacjo dokumentu. Wszystkie z wymaga� XML dla raportowania informacji dokumentu zosta�y zintegrowane w zbi�r informacyjny XML; numery w nawiasach odnosz� si� do specyfikacji Rekomendacji XML:
Rozwa� nast�puj�cy przyk��d dokumentu XML:
<?xml version="1.0"?> <msg:message doc:date="19990421" xmlns:doc="http://doc.example.org/namespaces/doc" xmlns:msg="http://message.example.org/" >Phone home!</msg:message>
Zbi�r informacji dla tego dokumentu XML zawiera nast�puj�ce przedmioty informacyjne:
http://message.example.org/
",
cz�� lokalna "message
",
i prefiks "msg
".
http://doc.example.org/namespaces/doc
",
cz�ci� lokaln� "date
",
prefiksem "doc
",
i znormalizowan� warto�ci� "19990421
".
http://www.w3.org/XML/1998/namespace
,
http://doc.example.org/namespaces/doc
, oraz
http://message.example.org/
przestrzeniami nazw.
Nast�puj�ce informacje nie s� przedstawione w obecnej wersji zbioru informacyjnego XML (ta lista nie ma na celu by� kompletn�):
<foo/>
oraz <foo></foo>
.See Schemat RDF dla zbioru informacyjnego XML dla formalnego znakowania zbioru informacji.