Gestión de sitios web multilingües
martes, 23 de marzo de 2010
Por lo general, tiene sentido crear un sitio web multilingüe cuando tu audiencia se compone de hablantes de lenguas diferentes. Si tu blog sobre fútbol latinoamericano tiene como objetivo llegar a usuarios en Brasil, podrías publicarlo tan sólo en portugués. Pero si también quieres alcanzar audiencia en Argentina, publicar información en español podría serte útil.
Google y el reconocimiento del idioma
Google intenta determinar el idioma de cada una de tus páginas. Para facilitar el reconocimiento de éste te aconsejamos que utilices una solo idioma por página. Aunque Google puede reconocer más de un idioma por página, es recomendable usar el mismo para todos los elementos que forman la página: encabezados, menús, etc.
Recuerda que Google ignora la información a nivel de código, como atributos "lang" o definiciones de tipo de documentos (DTD). Algunos programas de edición web crean dichos atributos de manera automática, por lo que no suelen proporcionar información válida a la hora de identificar la lengua de una página web.
Alguien que llega a Google y realiza una búsqueda en su idioma espera encontrar resultados localizados, y es aquí donde el webmaster entra en escena: si vas a realizar una versión localizada de tu sitio web, asegúrate de que esta versión sea visible en los resultados de búsqueda con algunos de nuestros consejos.
La anatomía de un sitio multilingüe: estructura de la URL
No es necesario crear URL con una estructura particular. No obstante, podría ser beneficioso para tus usuarios el saber en qué sección de tu sitio web se encuentran con dar un simple vistazo a la URL. Por ejemplo, las siguientes URL indican al usuario que se encuentra en la versión inglesa de este sitio web:
http://example.ca/en/mountain-bikes.html
http://en.example.ca/mountain-bikes.html
Mientras que estas otras URL indican al usuario que está viendo la misma página en francés:
http://example.ca/fr/mountain-bikes.html
http://fr.example.ca/mountain-bikes.html
Además, esta estructura de URL te puede ayudar a la hora de analizar la indexación de páginas con el mismo contenido pero en distintos idiomas.
Si vas a crear URL con caracteres no ingleses, utiliza codificación UTF-8. Así deberían estar correctamente escapadas para enlazar a otras páginas de tu sitio. Si necesitas crear URL escapadas, puedes encontrar un codificador de URL en línea. Por ejemplo, si quisiera traducir la siguiente URL del inglés al francés:
http://example.ca/fr/mountain-bikes.html
Podría traducirla así:
http://example.ca/fr/vélo-de-montagne.html
Puesto que esta URL contiene un carácter que no es inglés (é), podría escaparla para usarla como enlace en una de las páginas:
http://example.ca/fr/v%C3%A9lo-de-Montagne
Rastreo e indexación de tu sitio web multilingüe
Te recomendamos que no dejes que las traducciones automáticas sean indexadas. Las traducciones automáticas pueden carecer de sentido, por lo que podrían ser percibidas como spam. Además, el objetivo de un sitio multilingüe es llegar a una audiencia más amplia proporcionando contenido relevante en varios idiomas. Si a tus usuarios les cuesta entender una traducción automática, deberías preguntarte si realmente quieres ofrecerles este tipo de contenidos.
Si vas a localizar tu sitio, intenta que todas las versiones sean fáciles de rastrear para el Googlebot. Procura enlazar entre páginas de tu sitio que ofrecen el mismo contenido en distintos idiomas. Esto también puede ser muy útil para tus usuarios. Siguiendo el ejemplo anterior, si un usuario francés llega a la página http://example.ca/en/mountain-bikes.html, ahora con un solo clic puede acceder a http://example.ca/fr/vélo-de-montagne.html, donde puede ver el mismo contenido en francés.
Para que todas las secciones de tu sitio web sean más fáciles de rastrear, evita redireccionamientos automáticos basados en la presunción del idioma del usuario. Dichos redireccionamientos pueden impedir que tanto el usuario como los motores de búsqueda vean todas y cada una de las secciones de tu sitio web.
Y por último, crea URL distintas para cada idioma. No uses cookies para mostrar las versiones traducidas.
Codificación de caracteres
Google extrae la codificación de los caracteres directamente de los encabezados HTTP, de los encabezados de página HTML y del contenido. Por lo tanto, la codificación de caracteres no requiere demasiado esfuerzo por tu parte: simplemente procura que no haya información contradictoria entre el contenido y en los encabezados, por ejemplo.
Aunque Google puede reconocer varias codificaciones de caracteres, te recomendamos que utilices UTF-8 siempre que sea posible.
Si se te traba la lengua...
Ahora que sabes todo esto, ¡crear un sitio multilingüe no tiene por qué ser tan difícil como un trabalenguas!
Para obtener más información, lee nuestro post sobre sitios multirregionales. Más adelante publicaremos un post más detallado sobre situaciones especiales que pueden surgir al trabajar con un sitio web multilingüe y/o multirregional. Hasta entonces, ¡no dudes en pasarte por el Foro de ayuda para webmasters y hacer muchas preguntas!