Eth multilingüisme enes webs d’empresa
Web dera Generalitat de Catalonha Contacte
Inici: Ès responsable de web? Coma se dessenhe eth site web entà facilitar era produccion en diuèrses lengües?
Coma se dessenhe eth site web entà facilitar era produccion en
diuèrses lengües?
Aspèctes técnics
Aspèctes relatius ath contengut textuau
Aspèctes relatius ath contengut gràfic
Aspèctes técnics
Maugrat qu´eth lenguatge mès abituau de dessenh de pagines web ei l’HTML, es diferenti elements d’un site web pòden contier desparières seqüéncies en lenguatges coma XML, XHTML, Java, JavaScript, ASP, PHP, etc. En aguest estudi/(cambi) aguestes orientacions mos centraram en HTML, mès cau auer present que se pòden utilizar d´auti lenguatges de programacion dera forma que seguís:

Recomanació

Er usatge d’ASP o PHP e basas de donades permet dispausar de diuèrsi idiòmes en ua pagina unica (ei a díder, non calerie un document HTML entara version idiomatica dera madeisha pagina). Se tracte de programar crides a un petit diccionari personalizat (per exemple, inici = inicio = home). Sonque calerà incorporar un còdi coma<% inici %> enpunt dera pagina a on volgam qu´apareishe eth mot en qüestion. Alavetz, apareisherà ar usatgèr eth mot adequat en foncion dera lengua qu´age escuelhut entà navigar.

 

Enes sòns començaments, es pagines d´Internet se codificauen damb eth conjunt de caractèrs der estandard ISO-8859-1 (Latin 1), que sonque permetie escríuer eneslengües occidentaus.
Es navigadors non auien eth supòrt necessari entà trabalhar damb diferents jòcs de caractèrs, eth HTML non auie etiquetes entà trabalhar damb lengües BIDI (bidireccionals coma er arab o er ebrèu), etc. Per aguesti motius, eth World Wide Web Consortiumtrabalhèc entà eliminar es limitacions der alfabet earténher que totes es lengües podessen èster presentes en Internet sense problèmes de jòcs de caractèrs, de bidireccionalitat ena escritura, etc.

Eth trabalh mès important se desvolopèc sus dus espèctes plan importants: d´un costat, desvolopar estandards entath lenguatge de codificacion dera pagina (ja siguesse HTML, XML, XHTML, etc.) e, d´auta, tanben melhorar eth protocòl de transmission de donades HTTP.

Entà acceptar caractèrs non latins se creèc er estandard ISO 10646 e l’ISTD 1 (Internet Official Protocol Standards), un estandard especific entà Internet.

Eth protocòl  HTTP   ei eth protocòl que s’utilitze entà transferir es pagines web des deth
servidor que les amasse enquiar ordinador que les lieg, ei a díder, er ordinador client. Entà accedir as pagines web multilingües, cau auer respectat es tres recomanacions següentes entà garantir un corrècte foncionament deth protocòl HTTP:

1. Cau indicar eth jòc de caractèrs dera pagina que s´envie des der ordinador servidor qu´a era pagina der ordinador der usatgèr que la lieg (ordinador client). Era codificacion de caractèrs dera pagina se ditz paramétre charset e s’indique dera forma
següent:  

  HTML: Content-Type: text/html; charset=iso-8859-1
PHP: header("Content-type: text/html; charset=iso-8859-1");
Java: resource.setContentType ("text/html;charset=iso-8859-1");
 
Se pot veir era codificacion de caractèrs dera pagina normaument ena prumèra linha deth còdi hònt.

 
ampliar imatge
Damb eth navigador Firefox:
Cau hèr clic a Visualiza > Informacion dera pagina o ben prémer era combinacion de tecles Ctrl+I. Se daurirà era hièstra Informacion dera pagina, ena quau cau seleccionar era pestanha Generau.
En exemple vedem era Informacion dera pagina dera URL http://www.softcatala.org/
Softcatalà
 
 
ampliar imatge
Damb eth navigador Explorer:
Cau hèr clic en Visualizacion > Còdi hònt. Se daurirà un document de tèxte.

En exemple vedem era Informacion dera pagina dera URL. http://www.softcatala.org/
Softcatalà
 
 
    Es codificacions mès abituaus que s’utilizen entàs pagines web son:
   ASCII
 
Acronim d'American Standard Code for Information Interchange. Forma de codificacion de 7 bits e eth 8 entà extended ASCII. (Hònt: Glossari Unicode)
<buit>
   ISO-8859-1
   (ISO Latin 1)
 
Era denominacion oficiau ei ISO-8859-1, mès se nomente normaument ISO Latin 1. Ei ua forma de codificacion desvolopada pera ISO a partir der ASCII.
(Hònt: Webopaedia.com)
<buit>
   UTF-8
 
Acronim d´Unicode (o UCS) Transformation Format. Forma de codificacion de 8 bits. (Hònt: Glossari Unicode)
<buit>
   UTF-16
 
Acronim d'Unicode (or UCS) Transformation Format. Forma de codificacion de 16 bits. (Hònt: Glossari Unicode)
  Figura: Codificacion de pagines web  
 
2. Cau indicar er idiòma dera que s’envie ath servidor ena entèsta dera pagina (o head). Es còdis d’idiòma dera pagina se prenen dera lista de còdis d´idiòmes establida pera ISO 639. S´era pagina ei en lengua catalana s´indique dera forma que seguís

  HTML: atribut LANG (per exemple, <HTML LANG=ca>)

XML: atribut xml:lang (per exemple, <dc:title xml:lang="ca">)

XHTML1.0: tant lang com xml:lang (per exemple, <p xml:lang=”ca”lang=”ca”>Llengua.</p>

XHTML1.1: atribut xml:lang (per exemple, xml:lang="ca")
 
Vèir tanben Ubicacion deth tèxte arrevirable.
 
3. Cau indicar er idiòma que compren er usatgèr. Aguest hèt se nomente «negociacion d’idiòma». S´era web ei multilingüe, ena pagina iniciau apareisherà bèth sistèma entà escuélher era lengua:

 
ua lista desplegabla damb es nòms des lengües en format tèxte (aguesta opcion ei desaconselhada peth W3C perqué pòt dar errors ena visualizacion de caractèrs).
drapèus o d´auti grafics que simbolizen es lengües (aguesta opcion tanpòc se recomane perqué soent non i a una correspondéncia dirècta entre lengua e drapèu).
es nòms des lengües inserides en un grafic, com ara un mapa (opcion recomanada peth W3C) o ben es nòms des lengües damb un enlaç ara pagina iniciau de cada idiòma.
   
 
ampliar imatge
En exemple vedem era Informacion dera pagina dera URL
http://www.visitbritain.com/
Visitbritain


D´autes recomanacions tecniques entara internacionalizacion
   
 
Ensenhador
1. Introduccion
2. Qué se vòu arrevirar?
3. Coma se dessenhe eth site web entà facilitar era produccion en diuèrses lengües?
3.1. Aspèctes técnics
3.2. Contengut textuau
3.3. Contengut gràfic
4. Era fasa de localizacion
4.1. Premanida
4.2. Realizacion
5. Dempús dera localizacion: era fasa de verificacion
5.1. Foncionaus
5.2. Visuaus
6. Era guida d´estil
> Bibliografia
HTTPpujar
Se pòt trapar mès informacion sus es qüestions der HTTP relatiues ara internacionalizacion en http://www.w3.org/International/O-HTTP.html.
 
Charsetpujar
Se pòt trapar mès informacion sus paramétre charset en
http://www.w3.org/International/O-HTTP-charset.html.
 
Glosari d'Unicodepujar
Entà auer mès informacion sus eth glossari d'Unicode se pòt visitar http://www.unicode.org/glossary/.
Auançar
         
© Generalitat de Catalunya
Avís legau
Corrèu