El multilingüismo en las webs de empresa
Web de la Generalitat de Catalunya Contacto
Inicio: Eres responsable de web? ¿Cómo se diseña el sitio web para facilitar la producción en diversas lenguas?
¿Cómo se diseña el sitio web
para facilitar la producción en diversas lenguas?
Aspectos técnicos
Aspectos relativos al contenido textual
Aspectos relativos al contenido gráfico
Aspectos técnicos
Aunque el lenguaje más habitual de diseño de páginas web es el HTML, los diferentes elementos de un sitio web pueden contener diferentes secuencias en lenguajes como XML, XHTML, Java, JavaScript, ASP, PHP, etc. En estas orientaciones nos centraremos en el HTML, pero se debe tener en cuenta que podemos usar lenguajes de programación de la siguiente manera:

Recomendación
El uso de ASPE o PHP y bases de datos permite disponer de varios idiomas en una página única (es decir, no sería necesario un documento HTML para cada versión idiomática de la misma página). Se trata de programar llamadas a un pequeño diccionario personalizado (por ejemplo, inici = inicio = home). Sólo hará falta incorporar un código como por ejemplo <% inici %> en el punto de la página donde queremos que aparezca el término en cuestión. Entonces se mostrará a l’usuario el término adecuado en función de la lengua que haya elegido para navegar.
 

En sus inicios, las páginas de Internet se codificaban con el conjunto de caracteres de la norma ISO-8859-1 (Latin 1), que sólo permitía escribir en las lenguas occidentales. Los navegadores no tenían el soporte necesario para trabajar con diferentes juegos de caracteres, el HTML no tenía etiquetas para trabajar con lenguas BIDI (bidireccionales como el árabe o el hebreo), etc. Por esas razones, el World Wide Web Consortium trabajó para eliminar las limitaciones del alfabeto y conseguir que todas las lenguas pudieran estar presentes en Internet sin problemas de juegos de caracteres, de bidireccionalidad en la escritura, etc.

El trabajo más importante se llevó a cabo sobre dos aspectos primordiales: por un lado, desarrollar estándares para el lenguaje de codificación de la página (ya sea HTML, XML, XHTML, etc.) y, por otro, mejorar el protocolo de transmisión de datos HTTP.

Para aceptar caracteres no latinos se crearon la norma ISO 10646 y el ISTD 1 (Internet Official Protocol Standards), un estándar específico para Internet.

El protocolo  HTTP  es el protocolo que se utiliza para transferir las páginas web desde el
servidor que las almacena hasta el ordenador que las lee, esto es, el ordenador cliente. Para acceder a páginas web multilingües, se tienen que haber respetado las tres recomendaciones siguientes para garantizar un correcto funcionamiento del protocolo HTTP:

1. Se debe indicar el juego de caracteres de la página que se envía desde el ordenador servidor que contiene la página en el ordenador del usuario que la lee (ordenador
cliente). La codificación de los caracteres de la página se llama parámetro  charset  
y se indica de la siguiente manera:  

  HTML: Content-Type: text/html; charset=iso-8859-1
PHP: header("Content-type: text/html; charset=iso-8859-1");
Java: resource.setContentType ("text/html;charset=iso-8859-1");
 
Se puede ver la codificación de caracteres de la página normalmente en la primera línea del código fuente.

 
ampliar imagen


Con el navegador Firefox:
Se debe hacer clic en Herramientas > Información de la página. Se abrirá la ventana Información de la página, en la que se debe seleccionar la pestaña General.
En el ejemplo vemos la Información de la página de la URL http://www.softcatala.org/
Softcatalà
 
 
ampliar imagen
Con el navegador Explorer:
Se debe hacer clic en Visualización--> Código fuente. Se abrirá un documento de texto.

En el ejemplo vemos nuevamente la Información de la página de la URL.
http://www.softcatala.org/
Softcatalà
 
 
   Las codificaciones más habituales que se emplean para las páginas web son:
   ASCII
 
Acrónimo de American Standard Code for Information Interchange. Forma de codificación de 7 bits y el 8 para extended ASCII. (Fuente: Glossari Unicode)
<buit>
   ISO-8859-1
   (ISO Latin 1)
 
La denominación oficial es ISO-8859-1, pero normalmente se llamaISO Latin 1. Es una forma de codificación desarrollada por la ISO a partir de la ASCII. (Fuente: Webopaedia.com)
<buit>
   UTF-8
 
Acrónimo de Unicode (o UCS) Transformation Format. Forma de codificación de 8 bits. (Fuente: Glosario Unicode)
<buit>
   UTF-16
 
Acrónimo de Unicode (or UCS) Transformation Format. Forma de codificación de 16 bits. (Fuente: Glosario Unicode)
  Figura: Codificación de páginas web 
 
2.

Se debe indicar el idioma de la página que se envía al servidor en el encabezamiento de la página (o head). Los códigos de idioma de la página se toman de la lista de códigos de idiomas establecida por la ISO 639.

  HTML: atribut LANG (por ejemplo, <HTML LANG=ca>)

XML: atribut xml:lang (por ejemplo, <dc:title xml:lang="ca">)

XHTML1.0: tant lang com xml:lang (por ejemplo, <p xml:lang=”ca”lang=”ca”>Llengua.</p>

XHTML1.1: atribut xml:lang (por ejemplo, xml:lang="ca")
 
Ver también Ubicación del texto traducible.
 
3. Debe indicarse el idioma que entiende el usuario. Esto se denomina «negociación de idioma». Si la web es multilingüe, en la página inicial habrá algún sistema de elección de lengua:
 
una lista desplegable con los nombres de las lenguas en formato texto (esta opción la desaconseja el W3C porque puede dar errores de visualización de caracteres).
banderas u otros gráficos que simbolicen las lenguas (esta opción tampoco se recomienda porque a menudo no hay una correspondencia directa entre lengua y bandera).
los nombres de las lenguas insertadas en un gráfico, como por ejemplo un mapa (opción recomendada por el W3C) o bien los nombres de las lenguas con un enlace a la página inicial de cada idioma.
   
 
ampliar imagen

Al ejemplo vemos la Información de la página de la URL
http://www.visitbritain.com/

Visitbritain


Otras recomendaciones técnicas para la internacionalización
 
Índice
1. Introducción
2. ¿Qué se quiere traducir?
3. ¿Cómo se diseña el sitio web para facilitar la producción en diversas lenguas?
3.1. Aspectos técnicos
3.2. Contenido textual
3.3. Contenido gráfico
4. Fase de localización
4.1. Preparación
4.2. Realización
5. Después de la localización: la fase de comprobación
5.1. Funcionales
5.2. Visuales
6. Guía de estilo
> Bibliografía
HTTPsubir
Se puede hallar más información sobre las cuestiones de HTTP relativas a la internacionalización en http://www.w3.org/International/O-HTTP.html
 
Charsetsubir
Se puede hallar más información sobre el parámetro charset en
http://www.w3.org/International/O-HTTP-charset.html
 
Glosari d'Unicodesubir
Para más información sobre el glosario de Unicode se puede visitar
http://www.unicode.org/glossary/.
Avanzar
         
© Generalitat de Catalunya
Aviso legal
Correo