 |
 |
Com es dissenya el lloc web
per facilitar la producció en diverses llengües? |
|
 |
 |
|
 |
 |
 |
 |
 |
Aspectes tècnics |
Malgrat que el
llenguatge més habitual
de disseny de pagines web és
l’HTML, els diferents elements
d’un lloc web poden contenir
diferents seqüències
en llenguatges com ara XML, XHTML,
Java, JavaScript, ASP, PHP, etc.
En aquestes orientacions
ens centrarem en l’HTML, però cal
tenir en compte que podem usar
llenguatges de programació de
la manera següent:
|
 |
 |
L’ús
d’ASP o
PHP i bases de
dades permet
disposar de diversos
idiomes en una
pàgina única
(és a
dir, no caldria
un document HTML
per a cada versió idiomàtica
de la mateixa
pàgina).
Es tracta de
programar crides
a un petit diccionari
personalitzat
(per exemple,
inici = inicio
= home). Només
caldrà incorporar
un codi com ara <%
inici %> en
el punt de la
pàgina
on volem que
aparegui el terme
en qüestió.
Aleshores, es
mostrarà a
l’usuari
el terme adequat
en funció de
la llengua que
hagi triat per
a navegar.  |
|
|
|
| |
En els seus inicis, les pàgines d’Internet es codificaven amb el conjunt de caràcters de l’estàndard ISO-8859-1 (Latin 1), que només permetia escriure en les llengües
occidentals. Els navegadors no tenien el suport necessari per treballar
amb diferents jocs de caràcters, l’HTML no tenia etiquetes per treballar amb llengües BIDI (bidirectionals) com l’àrab o l’hebreu), etc. Per aquests motius, el World Wide Web Consortium va treballar per eliminar les limitacions de l’alfabet i aconseguir que totes les llengües poguessin ser presents a Internet sense problemes de jocs de caràcters, de bidireccionalitat en l'escriptura, etc.
La feina més important es va fer sobre dos aspectes primordials: d'una banda, desenvolupar estàndards per al llenguatge de codificació de la pàgina (ja sigui HTML, XML, XHTML, etc.) i, de l'altra, també millorar el protocol de transmissió de dades HTTP.
Per acceptar caràcters no llatins es van crear l’estàndard
ISO 10646 i l’ISTD 1 (Internet Official Protocol Standards),
un estàndard específic per a Internet.
| El protocol |
HTTP |
|
és el protocol que s’utilitza per transferir les pàgines web des del servidor |
servidor que les emmagatzema fins a l'ordinador que les llegeix, és a dir, l'ordinador client. Per accedir a pàgines web multilingües, cal que s’hagin respectat les tres recomanacions següents per tal de garantir un correcte funcionament del protocol HTTP:
| 1. |
Cal indicar el joc de caràcters de
la pàgina que s’envia des de l’ordinador
servidor que conté la pàgina a l’ordinador
de l’usuari que la llegeix (ordinador client). La
| codificació dels
caràcters de la
pàgina s’anomena
paràmetre |
charset |
i
s’indica |
|
| |
HTML: Content-Type: text/html; charset=iso-8859-1
PHP: header("Content-type: text/html; charset=iso-8859-1");
Java: resource.setContentType ("text/html;charset=iso-8859-1"); |
| |
Es pot veure la codificació de caràcters de
la pàgina normalment a la primera línia del codi
font. Com es pot visualitzar la codificació d'una pàgina?
|
| |
 |
 |

|
Amb el navegador Firefox:
Cal fer clic a Eines > Informació de
la pàgina. S'obrirà la finestra Informació de la pàgina,
en la qual cal seleccionar la pestanya General.
A l'exemple veiem la Informació de la pàgina de
la URL
http://www.softcatala.org/ |
|
 |
 |
|
| |
 |
| |
 |

|
 |
 |
Amb el navegador Explorer:
Cal fer clic a Visualització > Codi font. S'obrirà un
document de text.
A l'exemple veiem novament la Informació de la pàgina
de la URL
http://www.softcatala.org/ |
|
 |
 |
|
| |
 |
| |
| Les
codificacions més habituals que s’utilitzen
per a les pàgines web són : |
 |
 |
 |
ASCII
|
|

Acrònim d'American
Standard Code for Information Interchange. Forma
de codificació de 7 bits i el 8 per a extended
ASCII. (Font: Glossari Unicode)
 |
 |
ISO-8859-1
(ISO Latin 1)
|
|

La denominació oficial és
ISO-8859-1, però s'anomena normalment ISO Latin
1. És una forma de codificació desenvolupada
per la ISO a partir de l'ASCII.
(Font: Webopaedia.com)
 |
 |
UTF-8
|
|

Acrònim d'Unicode (o
UCS) Transformation Format. Forma de codificació de
8 bits. (Font: Glossari Unicode)
 |
 |
UTF-16
|
|

Acrònim d'Unicode (or
UCS) Transformation Format. Forma de codificació de
16 bits. (Font: Glossari Unicode)
 |
|
 |
 |
| |
Figura: Codificació de
pàgines web |
| |
 |
| 2. |
Cal indicar l’idioma de la pàgina que
s’envia al servidor a l’encapçalament de
la pàgina (o head). Els codis d’idioma
de la pàgina es prenen de la llista de codis d’idiomes
establerta per la ISO 639. Si la pàgina és en
llengua catalana s’indica de la manera següent:
|
| |
HTML: atribut LANG (per exemple, <HTML LANG=ca>)
XML: atribut xml:lang (per exemple, <dc:title xml:lang="ca">)
XHTML1.0: tant lang com xml:lang (per exemple, <p xml:lang=”ca”lang=”ca”>Llengua.</p>
XHTML1.1: atribut xml:lang (per exemple, xml:lang="ca") |
| |
Vegeu també Ubicació del text
traduïble. |
| |
 |
| 3. |
Cal indicar l’idioma que entén l’usuari.
Això s’anomena «negociació d’idioma».
Si el web és multilingüe, a la pàgina inicial
hi haurà algun sistema de tria de llengua:
|
| |
 |
 |
una llista desplegable amb els noms
de les llengües en format text (aquesta opció la
desaconsella el W3C perquè pot donar errors
de visualització de caràcters).
|
 |
banderes o altres gràfics que simbolitzin
les llengües (aquesta opció tampoc no
es recomana perquè sovint no hi ha una correspondència
directa entre llengua i bandera).
|
 |
els noms de les llengües inserides en un gràfic,
com ara, un mapa (opció recomanada pel W3C)
o bé els noms de les llengües amb un
enllaç a la pàgina inicial de cada
idioma. |
|
|
| |
|
| |
|
|
|
|
|
|
|
|
|
 |
|