El multingüisme als webs d’empresa
Web de la Generalitat de Catalunya Contacte
Inici: Ets responsable de web? Com es dissenya el lloc web per facilitar la producció en diverses llengües?
Vinyeta Com es dissenya el lloc web
per facilitar la producció en diverses llengües?
Aspectes tècnics
Aspectes relatius al contingut textual
Aspectes relatius al contingut gràfic
Vinyeta Aspectes tècnics
Malgrat que el llenguatge més habitual de disseny de pagines web és l’HTML, els diferents elements d’un lloc web poden contenir diferents seqüències en llenguatges com ara XML, XHTML, Java, JavaScript, ASP, PHP, etc. En aquestes orientacions ens centrarem en l’HTML, però cal tenir en compte que podem usar llenguatges de programació de la manera següent:

Recomanació
L’ús d’ASP o PHP i bases de dades permet disposar de diversos idiomes en una pàgina única (és a dir, no caldria un document HTML per a cada versió idiomàtica de la mateixa pàgina). Es tracta de programar crides a un petit diccionari personalitzat (per exemple, inici = inicio = home). Només caldrà incorporar un codi com ara <% inici %> en el punt de la pàgina on volem que aparegui el terme en qüestió. Aleshores, es mostrarà a l’usuari el terme adequat en funció de la llengua que hagi triat per a navegar.
 

En els seus inicis, les pàgines d’Internet es codificaven amb el conjunt de caràcters de l’estàndard ISO-8859-1 (Latin 1), que només permetia escriure en les llengües occidentals. Els navegadors no tenien el suport necessari per treballar amb diferents jocs de caràcters, l’HTML no tenia etiquetes per treballar amb llengües BIDI (bidirectionals) com l’àrab o l’hebreu), etc. Per aquests motius, el World Wide Web Consortium va treballar per eliminar les limitacions de l’alfabet i aconseguir que totes les llengües poguessin ser presents a Internet sense problemes de jocs de caràcters, de bidireccionalitat en l'escriptura, etc.

La feina més important es va fer sobre dos aspectes primordials: d'una banda, desenvolupar estàndards per al llenguatge de codificació de la pàgina (ja sigui HTML, XML, XHTML, etc.) i, de l'altra, també millorar el protocol de transmissió de dades HTTP.

Per acceptar caràcters no llatins es van crear l’estàndard ISO 10646 i l’ISTD 1 (Internet Official Protocol Standards), un estàndard específic per a Internet.

El protocol  HTTP  és el protocol que s’utilitza per transferir les pàgines web des del servidor
servidor que les emmagatzema fins a l'ordinador que les llegeix, és a dir, l'ordinador client. Per accedir a pàgines web multilingües, cal que s’hagin respectat les tres recomanacions següents per tal de garantir un correcte funcionament del protocol HTTP:

1. Cal indicar el joc de caràcters de la pàgina que s’envia des de l’ordinador servidor que conté la pàgina a l’ordinador de l’usuari que la llegeix (ordinador client). La
codificació dels caràcters de la pàgina s’anomena paràmetre  charset i s’indica
de la manera següent:  

  HTML: Content-Type: text/html; charset=iso-8859-1
PHP: header("Content-type: text/html; charset=iso-8859-1");
Java: resource.setContentType ("text/html;charset=iso-8859-1");
 
Es pot veure la codificació de caràcters de la pàgina normalment a la primera línia del codi font. Com es pot visualitzar la codificació d'una pàgina?

 
Vinyeta ampliar imatge


Amb el navegador Firefox:
Cal fer clic a Eines > Informació de la pàgina. S'obrirà la finestra Informació de la pàgina, en la qual cal seleccionar la pestanya General.
A l'exemple veiem la Informació de la pàgina de la URL
http://www.softcatala.org/
Softcatalà
 
 
ampliar imatge
Vinyeta
Amb el navegador Explorer:
Cal fer clic a Visualització > Codi font. S'obrirà un document de text.

A l'exemple veiem novament la Informació de la pàgina de la URL
http://www.softcatala.org/
Softcatalà
 
 
   Les codificacions més habituals que s’utilitzen per a les pàgines web són :
   ASCII
 
Acrònim d'American Standard Code for Information Interchange. Forma de codificació de 7 bits i el 8 per a extended ASCII. (Font: Glossari Unicode)
<buit>
   ISO-8859-1
   (ISO Latin 1)
 
La denominació oficial és ISO-8859-1, però s'anomena normalment ISO Latin 1. És una forma de codificació desenvolupada per la ISO a partir de l'ASCII.
(Font: Webopaedia.com)
<buit>
   UTF-8
 
Acrònim d'Unicode (o UCS) Transformation Format. Forma de codificació de 8 bits. (Font: Glossari Unicode)
<buit>
   UTF-16
 
Acrònim d'Unicode (or UCS) Transformation Format. Forma de codificació de 16 bits. (Font: Glossari Unicode)
  Figura: Codificació de pàgines web  
 
2. Cal indicar l’idioma de la pàgina que s’envia al servidor a l’encapçalament de la pàgina (o head). Els codis d’idioma de la pàgina es prenen de la llista de codis d’idiomes establerta per la ISO 639. Si la pàgina és en llengua catalana s’indica de la manera següent:

  HTML: atribut LANG (per exemple, <HTML LANG=ca>)

XML: atribut xml:lang (per exemple, <dc:title xml:lang="ca">)

XHTML1.0: tant lang com xml:lang (per exemple, <p xml:lang=”ca”lang=”ca”>Llengua.</p>

XHTML1.1: atribut xml:lang (per exemple, xml:lang="ca")
 
Vegeu també Ubicació del text traduïble.
 
3. Cal indicar l’idioma que entén l’usuari. Això s’anomena «negociació d’idioma». Si el web és multilingüe, a la pàgina inicial hi haurà algun sistema de tria de llengua:

 
una llista desplegable amb els noms de les llengües en format text (aquesta opció la desaconsella el W3C perquè pot donar errors de visualització de caràcters).
banderes o altres gràfics que simbolitzin les llengües (aquesta opció tampoc no es recomana perquè sovint no hi ha una correspondència directa entre llengua i bandera).
els noms de les llengües inserides en un gràfic, com ara, un mapa (opció recomanada pel W3C) o bé els noms de les llengües amb un enllaç a la pàgina inicial de cada idioma.
   
 
ampliar imatge
Vinyeta
A l'exemple veiem la Informació de la pàgina de la URL
http://www.visitbritain.com
Visitbritain


Altres recomanacions tècniques per a la internacionalització
Versió en PDF
 
Índex
1. Introducció
2. Què es vol traduir?
3. Com es dissenya el lloc web per facilitar la producció en diverses llengües?
3.1. Aspectes tècnics
3.2. Contingut textual
3.3. Contingut gràfic
4. Fase de localització
4.1. Preparació
4.2. Realització
5. Després de la localització: fase de comprovació
5.1. Funcionals
5.2. Visuals
6. La guia d'estil
> Bibliografia
Vinyeta
Vinyeta HTTPpujar
Es pot trobar més informació sobre les qüestions d’HTTP relatives a la internacionalització a http://www.w3.org/International/O-HTTP.html.
 
Vinyeta Charsetpujar
Es pot trobar més informació sobre el paràmetre charset a
http://www.w3.org/International/O-HTTP-charset.html.
 
Vinyeta Glosari d'Unicodepujar
Per a més informació sobre el glossari d'Unicode es pot visitar
http://www.unicode.org/glossary/.
Avançar
         
© Generalitat de Catalunya
Avís legal
Correu