Para localizar el sitio web en otra lengua, se deberá traducir todo el contenido textual. El administrador de webs debe ser consciente de que a veces la identificación del texto traducible no es sencilla y se tiene que facilitar este trabajo si se encarga a una empresa externa.
Cualquier aplicación que analice el código HTML tiene que actualizarse frecuentemente para manejar las últimas innovaciones en los ficheros de formato HTML. Tiene que ser fiable a la hora de encontrar cadenas de texto, por muy escondidas que estén. Algunos lugares para buscarlas son:
detrás de las imágenes (texto de la etiqueta Alt). Por ejemplo, <alt=”Generalitat de Catalunya”>
capturadas en imágenes que se deben rediseñar para poderlas traducir (GIF, JPEG)
animadas
simplemente escondidas (contenido meta, palabras clave, descripciones del contenido)
en secuencias o scripts (Java, Javascript, VBscript)
en tablas de la base de datos
en formularios
Detrás de las imágenes (texto de la etiqueta Alt).
Capturadas en imágenes que se deben rediseñar para poderlas traducir
Escondidas (contenido meta, palabras clave, descripciones del contenido)
En secuencias o scripts (Java, Javascript, VBscript)
En tablas de la base de datos
En formularios
animadas.
Secuencias de una animación:
Los textos traducibles que se acaban de listar se pueden clasificar según su visibilidad (de más a menos visible). Esta clasificación puede ayudar al administrador de webs a comprobar posteriormente si todo el texto ha quedado traducido.
Texto visible en formato texto: texto de los títulos, párrafos de texto, etc. Es el texto visible cuando vemos la página en un navegador.
Texto visible formato gráfico integrado en imágenes.
Texto de visualización condicionada, es decir, texto que sólo se ve cuando el usuario ejecuta alguna acción que muestra el texto. Por ejemplo, es el texto que puede aparecer cuando pasamos el ratón por encima de un enlace.
Texto invisible que no se ve con el navegador. Sin embargo, es texto que pueden usar otros programas, como los buscadores, por ejemplo, cuando se usa el texto invisible de las etiquetas meta del código HTML para identificar las palabras clave o KeyWords.
<html>
<head>
<title>TERMCAT, Centre de Terminologia</title>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta name="GENERATOR" content="Mozilla/4.76 [ca] (Windows NT 5.0; U) [Netscape]">
<meta name="Author" content="TERMCAT, Centre de Terminologia">
<meta name="KeyWords" content="TERMCAT,terminologia,diccionaris,català">