2.2 Nimet ja merkistöt
Vielä yksi huomautus tiedostojen nimistä webissä:
- Koska koko web on amerikkalaisten keksintö, ei tiedostojen nimissä voi käyttää skandinaavisia kirjaimia eikä muitakaan kansallisia erikoiskirjaimia (ñ, ò, ü, ú jne) eikä välilyöntejä eikä kertomerkkiä tai kauttamerkkiä. Ylipäätään kannattaa ottaa tavaksi käyttää ainoastaan seuraavia merkkejä: a-z, 0-9 ja viiva (-) sekä alaviiva (_).
(No jos aivan tarkkoja ollaan niin kyllä siellä välilyönti voi olla, se tosin korvautuu URL:issa %20-koodiksi. Tämän selittäminen muille tuottaa suunnattomia vaikeuksia, joten selvyyden vuoksi välilyöntiä ei kannata käyttää lainkaan.) - Isot ja pienet merkit tulkitaan yleensä eri kirjaimiksi. Siksi kannattaa ottaa jo nyt tavaksi kirjoittaa kaikki tiedostojen nimet koko ajan pienillä.
- Tiedostonnimi koostuu kahdesta osasta: nimi + pääte, esim. kuva.jpg. Tuo pääte kertoo minkätyyppisestä tiedostosta on kyse, jotta selain osaa tulkita sen oikein. Web-sivut käyttävät päätettä .html tai .htm. (Web-sivu voi joissain tapauksissa saada muitakin päätteitä, kuten .shtml, .jsp, .php, .asp ja niin edelleen. Näitä käydään läpi kurssin loppupuolella.)
Tuosta amerikkalaisuudesta seuraa toinenkin ongelma. Tiedostonnimen kiellettyjen merkkien lisäksi myös itse koodi sisältää muutamia merkkejä, joita pitää ja kannattaa välttää. Et tietenkään voi kirjoittaa tekstiä, joka sisältää merkin < tai > - nehän on varattu tunnisteita varten. Noita merkkejä varten on täytynyt kehittää jokin kiertotie, ja se on seuraavanlainen:
Kun haluat kirjoittaa tekstin sekaan pienempi-kuin -merkin (eng. less than, lyhennettynä lt) '<' niin se kirjoitetaan <:
- ensin &-merkki
- sitten "merkin nimi" (tässä lt) ja
- lopuksi puolipiste
Arvatenkin suurempi-kuin -merkki (eng. greater-than) '>' on samalla logiikalla >
Kaikki muutkin erikoismerkit muodostetaan samalla rakenteella: &-merkki, sitten merkin nimi tai koodi ja loppuun ;
| merkki | nimi | HTML-entiteetti (eng. entity) |
|---|---|---|
| < | less-than | < |
| > | greater-than | > |
| & | ampersand | & |
| " | double quote | " |
| © | copyright | © |
| € | euro | € |
| space | non-breaking space | |
Selain ei koskaan pistä kahden merkin väliin enempää kuin yhden välilyönnin vaikka koodissa niitä olisi vaikka kuinka. Myöskään tabulaattoria ei tunneta HTML:ssä. Yksi tapa siirtää tekstiä eteenpäin oikealle on pakottaa sen eteen ylimääräisiä välilyöntejä käyttämällä tätä entiteettiä - ei kovin hyvä tai elegantti tapa tehdä tätä mutta toimii joissain tilanteissa.
Ja jotta asia ei kävisi liian yksinkertaiseksi, ovat myös kaikki ei-englantilaiseen aakkostoon kuuluvat merkit kiellettyjä, ja ne pitää ilmaista edellämainitulla menetelmällä. Meitä suomalaisia asia koskee skandinaavisten merkkien osalta. Ulkomailla käyttämiämme kahta pistettä ä:n tai ö:n päällä kutsutaan dieresis tai umlaut -merkiksi. Tuota jälkimmäistä käytetään HTML:ssä:
| merkki | entiteetti | |
|---|---|---|
| ä | a + umlaut | ä |
| Ä | A + umlaut | Ä |
| ö | o + umlaut | ö |
| Ö | O + umlaut | Ö |
| å | a + ring | å |
| Å | A + ring | Å |
Koko ISO Latin 1-merkistö HTML:nä:
http://www.ramsch.org/martin/uni/fmi-hp/iso8859-1.html tai
http://www.htmlhelp.com/reference/html40/entities/latin1.html.

