Siirry sivun sisältöön Avut CSS HTML JavaScript Kotisivu

XHTML 1.0:n tietotyypit

Tällä sivulla luetellaan ja kuvataan XHTML 1.0:n tietotyypit, eli elementtien ja niiden attribuuttien sallittu sisältö:

CDATA

Tietotyypillä (character data) tarkoitetaan merkkijonoa joka koostuu dokumentin merkistön merkeistä ja merkkiviittauksista, jossa tageilla ei ole erikoismerkitystä. Merkkijono voi siis koostua kirjaimista, numeroista, erikoismerkeistä ja tyhjästä tilasta, eli kaikenlaisesta tekstistä.

Attribuuttien arvojen CDATA:n mahdollisesti sisältämä tyhjä tila, kuten rivinvaihdot ja tabuloinnit, muutetaan välilyönniksi, mutta turhaa tyhjää tilaa, varsinkin arvojen alussa ja lopussa tulee välttää. Merkintäkielen erikoismerkit, kuten &, kulmasulut ja lainausmerkit kannattaa säännönmukaisesti merkitä merkkiviittauksilla ristiriitojen ehkäisemiseksi. Esimerkki erilaisista merkeistä koostuvasta attribuutin arvosta:

... title="O'Haran mukaan kaava "abc<xyz" on tosi." ...

Yo. attribuutin arvon heittomerkki olisi voitu kirjoittaa suoraankin (O'Hara), koska se ei olisi sekoittanut attribuutin arvon rajoja, kuten myöhemmin tulevat lainausmerkit. Samoin < (&lt; pienempi kuin) -merkki, koska CDATA-yhteydessä merkkiä ei tulkita merkkauksen aluksi, toisin kuin PCDATA:ssa.

Character

Tietotyypillä tarkoitetaan lähes mitä tahansa kuviteltavissa olevaa näppäimistöllä tuotettua (yhtä) merkkiä. Käytännössä aakkosnumeerisia merkkejä kannattaa suosia.

Charset, Charsets

Tietotyypeillä tarkoitetaan merkistön nimeä (Charset), kuten tämänkin dokumentin koodissa esiintyvää länsi- ja pohjoiseurooppalaisista ISO-8859-1 -merkistöä tai merkistönimiluetteloa (Charsets). Luettelosssa nimet erotetaan toisistaan välilyönneillä. Käytettävät merkistönimet löytyvät osoitteesta: http://www.iana.org/assignments/character-sets/character-sets.xhtml.

ContentType, ContentTypes

Tietotyypeillä tarkoitetaan tiedoston sisältötyyppiä (ContentType), kuten image/png, video/mpeg, text/html, jne., tai sisältötyyppiluetteloa (ContentTypes). Luettelossa sisältötyypit erotetaan toisistaan pilkulla. Rekisteröidyt sisältötyypit löytyvät osoitteesta: http://www.iana.org/assignments/media-types/. Lisätietoja mediatyypeistä, erityisesti Webissä.

Coords

Tietotyyppi koostuu pilkuilla erotetuista luvuista, joiden arvot ja määrä riippuu määritetystä muodosta (Shape-tietotyypistä). Lisätietoja AREA-elementin attribuuteista.

Datetime

Tietotyypillä ilmoitetaan yhdistettynä päivämäärä ja aika muodossa vvvv-kk-ppTtt:mm:ssZ, jossa:

 1. vvvv - vuosiluku nelinumeroisena
 2. kk - kuukausi kaksinumeroisena
 3. pp - päiväys kaksinumeroisena
 4. T - versaali T-kirjain ilmaisee aikaformaatin alkua
 5. tt - tunnit kaksinumeroisena
 6. mm - minuutit kaksinumeroisena
 7. ss - sekunnit kaksinumeroisena
 8. Z - versaali Z-kirjain ilmaisee UTC-aikaa (entinen GMT)

Tarkalleen kaikki edellä esitetyt osatekijät tulee esiintyä tietotyypissä. Tarvittaessa aikamuodot voi ilmoittaa nollinakin, esim.:

... datetime="2003-11-19T00:00:00Z" ...

Myös paikallinen aika voidaan ilmoittaa lisäämällä aikaformaatin perään erotus UTC-aikaan muodossa: +tt:mm tai -tt:mm. Seuraavat esimerkit ilmaisevat saman ajan:

2003-11-19T15:10:20Z+02:00 (Suomen normaaliaika)
2003-11-19T13:10:20Z    (UTC-aika)

ID

Tietotyypillä tarkoitetaan yksilöivänä tunnisteena käytettävää merkkijonoa joka alkaa kirjaimella ja koostuu vain kirjaimista (A-Z, a-z), numeroista (0-9), väliviivoista (-), alaviivoista (_), kaksoispisteitä (:) ja pisteistä (.).

IDREF, IDREFS

Tietotyypeillä tarkoitetaan viittausta yksilöivään tunnisteeseen (IDREF) tai tunnisteluetteloon (IDREFS). Luettelossa tunnisteet erotetaan toisistaan välilyönnillä.

LanguageCode

Tietotyypillä tarkoitetaan RFC 3066:n mukaista kielitunnusta, kuten fi (suomi) ja sv (ruotsi). Taustaa ja lisätietoja: Kielimerkkaus: tekstin kielen ilmoittaminen merkkausjärjestelmissä.

Length

Tietotyypillä tarkoitetaan pituusmittoja, jotka ilmaistaan numero- (n) tai prosenttilukuina (n%). Pelkät numerot edustavat kuvapisteitä.

LinkTypes

Tietotyyppi (link types) koostuu yhdestä linkkityyppinimestä tai välilyönnillä erotetusta nimiluettelosta. Tunnettuja linkkityyppinimiä ovat:

alternate - Viittaa vaihtoehtoiseen versioon. Yhdessä HREFLANG-attribuutin kanssa viitataan erikieliseen versioon, esim.:

<link
 title="Esitys ruotsin kielellä."
 rel="alternate"
 hreflang="sv" ... />

Yhdessä MEDIA-attribuutin kanssa viitataan eri kohdemedialle (laitetyypille) tarkoitettuun vaihtoehtoiseen versioon, esim.:

<link
 title="Esitys tulostettavaksi."
 rel="alternate"
 media="print" ... />

Yhdessä stylesheet-linkkityyppinimen kanssa viitataan vaihtoehtoiseen tyylitiedostoon, esim.:

<link
 title="Naivistinen esitys"
 rel="alternate stylesheet" ... />

appendix - Viittaa dokumenttikokoelman liitedokumenttiin.

bookmark - Viittaa kirjamerkkiin, eli tiettyyn kohtaan dokumentissa, johon voidaan suoraan linkittää.

chapter - Viittaa dokumenttikokoelman lukuun.

contents - Viittaa sisällysluettelodokumenttiin.

copyright - Viittaa dokumentin tekijänoikeusilmoitukseen.

glossary - Viittaa dokumentin sanastoon.

help - Viittaa avustavaan dokumenttiin.

index - Viittaa hakemistodokumenttiin.

next - Viittaa dokumenttikokoelman seuraavaan dokumenttiin.

prev - Viittaa dokumenttikokoelman edeltävään dokumenttiin.

section - Viittaa dokumenttikokoelman osastoon.

start - Viittaa dokumenttikokoelman ensimmäiseen dokumenttiin.

stylesheet - Viittaa ulkoiseen tyylitiedostoon. Esimerkkikoodi: CSS:n tuonti LINK-elementillä.

subsection - Viittaa dokumenttikokoelman alaosastoon.

MediaDesc

Tietotyyppi (media descriptors) koostuu yhdestä medianimestä tai pilkulla erotetusta nimiluettelosta. Tunnetut medianimet ovat:

Asiakasohjelmasi soveltaa tyyliehdotuksen yo. luettelon medianimeen, mikäli nimi esiintyy lihavoituna.

MultiLength

Tietotyyppi käsittää Lenght-tietotyypin ja suhteellisen pituuden, joka ilmaistaan kokonaisluvun kerrannaisina. Esimerkiksi sarakeryhmän leveys voitaisiin ilmaista kolmella tavalla:

Number

Tietotyyppi käsittää vähintään yhden numeromerkin nollasta yhdeksään (0 - 9).

PCDATA

Tietotyyppi (parsed character data) käsittää tekstin jossa tagit tulkitaan merkkaukseksi. Vertaa CDATA-tietotyyppiin.

Pixels

Tietotyyppi käsittää kokonaisluvun, joka edustaa kuvapisteitä.

Script

Tietotyyppi (script data) käsittää SCRIPT-elementin ja tapahtuma-attribuuttien sisällön.

SCRIPT-elementin sisältönä tietotyyppi on PCDATA-tyyppistä, jolloin mahdolliset tagit tai niihin viittaavat merkkiviittaukset tulkitaan merkkaukseksi ja täten niitä ei voi käyttää elementin sisällä (edes kommentteina). Kts. ratkaisuvaihtoehtoja.

Tapahtuma-attribuuttien arvo on taas CDATA-tyyppistä, jolloin erikoismerkit ovat sallittuja, kunhan lainausmerkkiristiriitaa ei esiinny. Katso esimerkkiä CDATA-tietotyypistä.

Shape

Tietotyyppi koostuu neljästä avainsanasta, jotka vastaavat kuva-alueen muotoja:

Lisätietoja AREA-elementin attribuuteista.

StyleSheet

Tietotyyppi (style sheet data) käsittää STYLE-elementin ja STYLE-attribuutin sisällön.

STYLE-elementin sisältönä tietotyyppi on PCDATA-tyyppistä, jolloin mahdolliset tagit tai niihin viittaavat merkkiviittaukset tulkitaan merkkaukseksi ja täten niitä ei voi käyttää elementin sisällä (edes kommentteina).

STYLE-attribuutin arvo on taas CDATA-tyyppistä, jolloin erikoismerkit ovat sallittuja, kunhan lainausmerkkiristiriitaa ei esiinny. Katso esimerkkiä CDATA-tietotyypistä.

Text

Tietotyyppi käsittää tavallisen luettavaksi tarkoitetun tekstin. Teksti voi koostua dokumentin merkistön kaikista merkeistä (kirjaimista, numeroista, erikoismerkeistä), sekä merkkiviittauksista, jotka muodostavat merkkijonon. Teknisesti kysymys on CDATA:sta.

URI, UriList

Tietotyyppi (Uniform Resource Identifier) käsittää Internet-osoitteen, tai osoiteluettelon (UriList). Osoitteet voidaan antaa, joko absoluuttisesti, tai suhteellisesti. Osoitteet ovat merkkikokoriippuvaisia (A ja a ovat eri merkkejä), eivätkä skandinaaviset merkit ole sallittuja. Luettelossa osoitteet erotetaan toisistaan välilyönneillä.

Viimeinen päivitys: 2008-02-13
Osmo Saarikumpu

yksi taso ylös