¿Qué es un sitemap, cómo crearlo y por qué es clave para SEO?

Escrito por
Sergio Koller
May 24, 2025
33 min de lectura

Los robots de búsqueda suelen explorar tu sitio web siguiendo enlaces. El problema es que los rastreadores pueden no llegar nunca a algunas páginas de esta manera: ya sea porque tu sitio web es demasiado grande o porque no hay enlaces que lleven a tus páginas. Por eso existen los sitemaps.

En este artículo, veremos los beneficios de un sitemap XML para tu sitio web, analizaremos sus diferentes tipos y aprenderemos a crear un sitemap adecuado. También incluimos una infografía adicional al final que resume los consejos sobre cómo crear un sitemap que se tratan en este artículo.

Puntos clave
  • Los sitemaps o mapas del sitio guían a los rastreadores hacia las páginas importantes de un sitio web, lo que garantiza que ninguna se pase por alto debido a la falta de enlaces internos o estructuras de sitio complejas.

  • Si bien no son obligatorios para todos los sitios web, los sitemaps son necesarios para sitios web grandes o nuevos, y sitios web que se actualizan con frecuencia con contenido nuevo, imágenes, videos o artículos de noticias.

  • Un sitemap XML puede ayudar a mejorar la velocidad y la cobertura de indexación, lo que facilita que los motores de búsqueda encuentren, comprendan y posicionen correctamente las páginas más importantes de un sitio web.

  • Para crear un sitemap bien estructurado, elige con cuidado páginas indexables de alta calidad y evita confundir a los motores de búsqueda excluyendo las páginas que devuelven códigos de error, están bloqueadas por robots.txt o están marcadas como noindex.

  • Puedes crear un sitemap manualmente si tu sitio web no es demasiado grande. De lo contrario, es mejor usar complementos de CMS o generadores de sitemaps como el integrado en la herramienta de Auditoría Web de SE Ranking.

  • Una vez que tu sitemap esté listo, añádelo a Google Search Console y pon una referencia a él en el archivo robots.txt. Esto ayuda a los motores de búsqueda a procesar e indexar el sitemap de una web.

¿Qué es un sitemap?

Un sitemap o mapa del sitio es un archivo que incluye todas las URL de un sitio web. Esto facilita la navegación por el sitio a los rastreadores de búsqueda y a los usuarios.

Los rastreadores de búsqueda utilizan sitemaps para evitar que el contenido importante pase desapercibido. Los sitemaps guían a los rastreadores de los motores de búsqueda a áreas del sitio web que tal vez nunca hayan visitado antes y, en última instancia, les ayudan a navegar e indexar el contenido del sitio de manera más eficiente.

Estos mapas del sitio también le indican a los motores de búsqueda qué páginas y archivos de tu web se consideran más importantes. Proporcionan metadatos adicionales sobre cada archivo, incluida la fecha de la última modificación y la frecuencia de los cambios.

¿Necesita tu sitio web un sitemap?

Según Google, puede ser necesario incluir un sitemap en las siguientes situaciones:

  • Tienes un sitio web grande: administrar los enlaces internos en un sitio grande puede ser un desafío. Googlebot también tiene menos probabilidades de encontrar algunas de tus páginas nuevas. Un sitemap XML puede solucionar este problema al ayudarle a Google a descubrir contenido muy arraigado.
  • Tu sitio web es nuevo y carece de backlinks: los rastreadores web dependen de los enlaces de otros sitios web para rastrear y descubrir nuevas páginas. Googlebot tiene mayor dificultad para encontrar estas páginas sin enlaces externos que lleven a ellas. Los sitemaps ayudan a Google a encontrar tu contenido mucho más rápido.
  • Tu sitio web tiene toneladas de contenido multimedia: Google puede examinar información adicional de los sitemaps para fines de búsqueda, especialmente si tu sitio web contiene contenido multimedia enriquecido o aparece en Google News.

Por otro lado, un sitemap puede no ser necesario para sitios web más pequeños con aproximadamente 500 páginas o menos, un interlinking correcto y pocos archivos multimedia o páginas de noticias que de otro modo serían cruciales para su posicionamiento. Crear un sitemap no hará daño, pero tampoco ayudará mucho en este caso. La decisión depende de ti.

¿Cuáles son los beneficios de tener un sitemap XML?

Se recomienda crear un sitemap si tienes un sitio web grande con numerosos archivos multimedia o si estás iniciando un nuevo proyecto. Sin embargo, la mayoría de los especialistas en SEO coinciden en que tener un sitemap es importante para la indexación y posicionamiento. A continuación, repasemos esos beneficios:

Indexación más rápida

La creación de sitemaps XML ayuda a los motores de búsqueda a comprender qué páginas indexar. Incluir una URL en el mapa de tu sitio le indica a Google que la página tiene buena calidad. Esto ayuda a los motores de búsqueda a descubrir nuevas páginas en menos tiempo, lo que da como resultado un proceso de indexación más rápido y una mejor visibilidad del sitio web en los resultados de búsqueda.

Ten en cuenta que Google puede ignorar tu solicitud, ya que todas las páginas deben cumplir con los estándares de calidad de Google para ser indexadas.

Mejor indexación de páginas profundas

El sitemap de una web es la clave para indexar páginas profundas. Las páginas profundas están a varios clics de la página de inicio y no se pueden descubrir tan fácilmente utilizando los métodos de navegación habituales del sitio web.

Incluir páginas profundas en el sitemap garantiza que los motores de búsqueda sepan sobre su existencia y puedan encontrarlas fácilmente.

Los sitemaps son especialmente beneficiosos si tu sitio web tiene estructuras complejas, como páginas de formularios o páginas a las que solo se puede acceder a través de funcionalidades de búsqueda.

Control de páginas indexadas

Si bien un sitemap en sí no ayuda directamente con el control de páginas indexadas, proporciona un punto de referencia para que los motores de búsqueda comparen las páginas indexadas con las que aparecen en él.

Combinar el sistema con Google Search Console puede ayudarte a descubrir qué URL del mapa están indexadas.

Compara periódicamente tu sitemap con las páginas indexadas para identificar discrepancias o páginas faltantes. Si ciertas páginas que aparecen en el sitemap no están indexadas, puede significar problemas de indexación o rastreo, como errores técnicos, directivas de bloqueo o problemas de calidad del contenido.

Inclusión de versiones localizadas de tus páginas

Para informarle a Google sobre las versiones localizadas de tus páginas, puedes incluirlas en tu sitemap junto con atributos hreflang especiales.

Este no es el único método para organizar correctamente un sitio web multilingüe, pero algunos webmasters creen que es la forma más sencilla.

Incluyendo versiones regionales de sus páginas para sitemap

Mejor experiencia de usuario

Un sitemap visual bien estructurado también puede ayudar a los usuarios a navegar por tu sitio web. Los usuarios visitarán tu sitemap si no pueden encontrar lo que buscan en el menú de navegación principal. También pueden usarlo para ver cuántos temas o productos tienes. Por eso es importante que tu sitemap HTML sea fácil de usar. Para ello, organiza las páginas por categoría y utiliza textos de anclaje descriptivos.

Según Google, agregar un sitemap a tu sitio web siempre es beneficioso y nunca te penalizará por tener uno.

Tipos de sitemaps

Existen dos tipos principales de sitemaps: HTML y XML. Otros sitemaps menos utilizados son los sitemaps de texto, RSS, mRSS y Atom 1.0. Cada uno tiene un propósito diferente: los sitemaps XML son cruciales para el SEO y la indexación, y los sitemaps HTML para mejorar la navegación y la accesibilidad del usuario.

Veamos estos dos tipos con más detalle.

Sitemap HTML

Un sitemap HTML es una página web con una lista de enlaces que llevan a las secciones y páginas más importantes de un sitio web. A continuación, verás un ejemplo de sitemap HTML bien diseñado: FedEx y Lufthansa.

Un sitemap HTML

El objetivo principal del sitemap HTML es ayudar a las personas (no a los robots) a navegar por el sitio web rápidamente y proporcionar una descripción general de sus secciones principales. Por otro lado, según John Mueller, si tu sitio web ya tiene una estructura de navegación clara, no necesitas crear un sitemap HTML. En cambio, todo lo que tienes que hacer es mejorar la estructura existente del sitio web.

Sitemap XML

Un sitemap XML es un archivo XML, generalmente llamado sitemap.xml, ubicado en la carpeta raíz del sitio web. Tiene enlaces, fechas de modificación de una página y otros parámetros relevantes para los motores de búsqueda. Ya que, todos sus parámetros están marcados con etiquetas especiales, los archivos XML se parecen al código HTML de un sitio web:

Código HTML para sitemap XML

Si bien los sitemaps XML pueden no parecer visualmente atractivos, son muy importantes para el SEO. La creación de un sitemap XML les proporciona a los rastreadores una comprensión integral de la estructura de tu sitio web, les ayuda a encontrar contenido nuevo más fácil y rápido.

Además del sitemap XML estándar que enumera las URL del sitio web, Google te permite crear sitemaps personalizados para contenido de imágenes y videos, y sitemaps de noticias. Un sitemap XML generalmente se encuentra en la carpeta raíz: dominioejemplo.com/sitemap.xml

Sitemaps RSS, mRSS y Atom 1.0

Los CMS crean automáticamente formatos de sitemaps RSS, mRSS y Atom 1.0. Estos formatos tienen una estructura similar a los sitemaps XML.

Sitemaps de texto

El sitemap de texto es una solución sencilla para sitios web pequeños. Puedes crear un archivo .txt y enumerar todas las URL que quieres que Google rastree. Por ejemplo, si tu sitio web tiene solo 10 páginas, puedes enumerarlas una por línea en un archivo .txt. De manera similar al sitemap XML, este mapa del sitio debe estar ubicado en la carpeta raíz: dominioejemplo.com/sitemap.txt.

Otros tipos de sitemaps

Se recomienda crear archivos independientes para sitemaps de imágenes, noticias y videos. Cada sitemap especializado puede incluir detalles específicos del formato, como la duración del video, las calificaciones o la fecha de publicación.

Un sitemap de imágenes está diseñado específicamente para proporcionar a los motores de búsqueda información sobre las imágenes de un sitio web. Se utilizan para informar a Google sobre las imágenes de tu sitio que el motor de búsqueda podría no descubrir de otra manera, incluidas las imágenes a las que se accede mediante código JavaScript.

Código sitemap de imágenes

La creación de un sitemap de videos ayuda a Google a encontrar y comprender el contenido de video de tu sitio web, especialmente el contenido agregado recientemente o los videos que los rastreadores no pueden descubrir fácilmente. En el caso de un sitemap de videos, puedes especificar detalles como la duración del video, la calificación, si es apto para toda la familia y más.

Sitemap de videos

Según Google, no es necesario incluir videos que no estén relacionados con el contenido de la página de alojamiento. Por ejemplo, no se deben incluir videos que sirvan como adiciones menores o que no estén relacionados con el contenido principal del texto. Además, las reglas de robots.txt no deben impedir el rastreo de todos los archivos a los que se hace referencia en el sitemap de videos, ni deben estar bloqueados por firewalls o mecanismos similares. Estos archivos también deben ser accesibles sin metarchivos o requerir credenciales de inicio de sesión.

Sitemaps de noticias

Los sitemaps de noticias están diseñados para sitios web que publican artículos de noticias. Proporcionan a los motores de búsqueda información sobre artículos nuevos, incluidas las URL, las fechas de publicación, los títulos y otros detalles importantes, como cuándo se publicaron los artículos o en qué idioma están.

Sitemap de noticias

Los sitemaps de noticias ayudan a los motores de búsqueda a identificar e indexar contenido de noticias urgentes de manera eficaz, lo que puede mejorar la visibilidad de un sitio en los resultados de búsqueda relacionados con las noticias.

Google necesita poder descubrir artículos de noticias rápidamente. De hecho, Google solo te permite incluir artículos nuevos que se publicaron en los últimos dos días en los sitemaps de noticias. Esto garantiza que los usuarios solo reciban información actualizada. Un sitemap de noticias no puede incluir más de 1000 artículos y se debe eliminar el contenido más antiguo. La última condición (y probablemente la más importante) es que tu sitio web debe estar registrado en Google News.

Cómo crear un sitemap XML

Veamos algunas de las estrategias más comunes para crear el sitemap de una web.

Los webmasters suelen elegir una de las siguientes opciones:

  • Creación manual del sitemap
  • Generadores de sitemaps
  • Complementos de CMS

Revisemos cada enfoque.

Complementos de CMS

La forma más fácil de generar un sitemap XML es a través de tu CMS. Esto porque, las plataformas CMS almacenan información de todas las páginas de tu sitio web y los ajustes que haces, con eso pueden incorporar automáticamente todos esos datos en un sitemap dinámico.

Algunas plataformas CMS tienen capacidades integradas de generación de sitemaps. Este es el caso de Magento, Shopify, Wix y Squarespace. Para otras plataformas CMS populares como WordPress, Joomla, Drupal u OpenCart, necesitarás utilizar complementos especiales.

WordPress Yoast SEO, Google XML Sitemaps, WordPress XML Sitemap Plugin, All in One SEO Pack
Joomla OSMap, JSitemap, Sitemap Cache
Drupal Simple XML sitemap
OpenCart All In One Seo Extension, XML Sitemap, XML Sitemap Generator by Cuispi

La tabla anterior muestra una lista de los mejores plugins para crear un sitemap en plataformas CMS. Para elegir el plugin adecuado para tu sitio web, presta atención a las características del plugin. Las soluciones compatibles con SEO deberían permitirte excluir páginas inapropiadas como 404, redirecciones, noindex y páginas canonizadas de tu sitemap XML. Además, busca opciones de personalización para que puedas modificar qué páginas se incluyen en el archivo.

Generadores de sitemaps

Si tu sitio web no fue creado en un CMS o las opciones de CMS disponibles no son adecuadas, puedes utilizar herramientas de sitemaps especializadas, que te permitan crear un archivo XML con todas las páginas necesarias. Esto suele ser más fácil que instalar otro plugin.

Hay opciones gratuitas y de pago disponibles en el mercado, así que estudia detenidamente lo que puede hacer cada herramienta. Si bien puedes generar un sitemap dinámico y personalizable con un generador de pago, la mayoría de las soluciones gratuitas son demasiado básicas y carecen de funciones clave. Los generadores gratuitos a menudo crean un sitemap estático con todas las páginas del sitio web, incluidas las URL canónicas, noindex y redirecciones.

Si no puedes utilizar una solución pagada o un CMS, puedes crear un sitemap con la herramienta de Auditoría Web de SE Ranking. Con ella, puedes crear un sitemap estático para tu sitio web (basado en el último rastreo) en tan solo unos minutos.

Generar un mapa XML con SE Ranking

De manera predeterminada, la herramienta solo incluye páginas 200 OK en un sitemap XML y omite las páginas 4xx, 3xx, noindex y otras que normalmente se excluyen.

Cómo generar mapa XML en SE Ranking

Asegúrate de que tus límites de rastreo sean lo suficientemente altos para generar tu sitemap XML con la herramienta de Auditoría Web de SE Ranking. Comprueba que el límite de rastreo cubra todas las páginas de tu sitio para evitar la exclusión de páginas importantes de tu sitemap.

Si ninguna de las soluciones listas para usar funciona en tu caso, puedes crear un sitemap XML personalizado. Como esto requiere habilidades de programación, debes contratar a un desarrollador web para que cree un sitemap dinámico adecuado para tu web.

Creación manual de un sitemap

Si no tienes un sitio web grande, puedes crear un archivo sitemap por tu cuenta. Simplemente, abre cualquier editor de texto y crea un archivo sitemap utilizando el código XML. Aquí hay un ejemplo de un sitemap XML bastante simple:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://www.example.com/url1/</loc>
   <lastmod>2024-11-20</lastmod>
 </url>
 <url>
   <loc>https://www.example.com/url2/</loc>
   <lastmod>2024-11-19</lastmod>
 </url>
 <url>
   <loc>https://www.example.com/url3</loc>
   <lastmod>2024-11-18</lastmod>
 </url>
</urlset>

Sitemaps.org, una fuente útil recomendada por Google, enumera las etiquetas que puedes utilizar en tu archivo XML. Ahora, veamos cada tipo de etiqueta. Determinaremos qué propósito cumple cada etiqueta y cómo utilizarla correctamente.

Etiquetas obligatorias:

  • <urlset> es un elemento obligatorio que encapsula al sitemap e indica qué versión del protocolo estándar de sitemaps XML se utiliza (a través del atributo xmlns). El protocolo estándar también se denomina espacio de nombre.
  • <url> es otro elemento obligatorio que marca un bloque con toda la información sobre una única URL.
  • <loc> es el último elemento obligatorio que indica la URL de la página en sí. Todas las URL enumeradas deben estar completamente calificadas y contener el protocolo del sitio (HTTP o HTTPS) y el prefijo www si está incluido en su nombre de dominio.

Etiquetas opcionales:

  • <lastmod> indica la última vez que se actualizó el contenido de la página. Se trata como una señal para que los rastreadores determinen con qué frecuencia rastrear las páginas, esto según Gary Illyes, un analista de Google. Sin embargo, como se reveló en la filtración de la API de Google en 2024, Google puede o no confiar en ella, lo que significa que solo debes actualizar la etiqueta <lastmod> en caso de que se produzcan cambios importantes.

Etiquetas obsoletas:

  • <changefreq> define la frecuencia con la que puede cambiar una página. Puedes configurar este parámetro como siempre, cada hora, diariamente, semanalmente, mensualmente, anualmente o nunca.
  • <priority> establece la prioridad de rastreo de una página (los valores aceptados van de 0.0 a 1.0).

Sin embargo, según la última edición de la guía de Google para crear sitemaps, actualizada el 21 de junio de 2024, Google indicó que se ignorarán las etiquetas mencionadas anteriormente.

Requisitos de Google para los archivos sitemaps

Para asegurarte de que Google indexe tu sitemap, sigue el protocolo de sitemaps.

Comienza utilizando la misma sintaxis al especificar la URL.

Los archivos sitemap XML deben estar codificados en UTF-8 y todos los valores de los datos (incluidas las URL) deben tener caracteres de escape.

Los sitemaps de noticias, imágenes y videos requerirán etiquetas diferentes, como <news:news>. Todas las etiquetas necesarias para usar en tus sitemaps de imágenes/noticias/videos se describen en esta documentación:

Por último, puedes usar cualquier nombre de archivo que desees, siempre y cuando sean caracteres aceptados en las URL. Solo ten en cuenta que se detectó un error en el que las URL tenían guiones en sus nombres de archivo.

Gestión de tus sitemaps con un archivo de índice de sitemaps

Los motores de búsqueda tienen una capacidad limitada para rastrear el sitemap de una web. El tamaño máximo de archivo sin comprimir debe ser de 50 MB y no debe contener más de 50.000 URL. Google impuso estas limitaciones para evitar que los servidores web se sobrecarguen por archivos tan grandes. Si tienes un sitio web grande y un archivo sitemap aún más grande, debes dividirlo en archivos más pequeños. A partir de allí, puedes crear un archivo de índice de sitemaps que incluya estos sitemaps más pequeños y enviar el archivo de índice a Google.

Para hacer esto:

  1. Crea varios archivos sitemaps separados y comprímelos con una herramienta como gzip, que puede ahorrar ancho de banda si es necesario. Los archivos comprimidos tendrán la extensión .gz, por ejemplo, sitemap.xml.gz.
  2. Añade todos los sitemaps independientes al archivo de índice de sitemaps, como se muestra en el siguiente ejemplo:
Archivo de índice de sitemap

Este ejemplo de sitemap muestra un archivo de índice de sitemaps en formato XML, el cual muestra dos mapas.

Para obtener más información, consulta la Documentación de Google.

Cómo decidir qué páginas incluir en un sitemap

Esta sección es muy importante, ¡así que léela con atención!

Un error común es pensar que debes incluir todas las páginas de tu sitio web en un sitemap XML para ayudar a Google a rastrear e indexar tu sitio. Sin embargo, Google no necesita ver todas las páginas de tu web. En cambio, solo necesitas informarle a Google sobre las páginas de mejor calidad que crees que merecen una posición alta. Esto hace que Google priorice solo esas páginas, pero recuerda que Google puede o no seguir tu consejo. Aquí tienes una lista de las páginas que deben (y no deben) incluirse en tu sitemap.

Páginas que muestran código 200 OK

Como regla general, todas las páginas que añades a una lista deben ser páginas 200 OK y deben ofrecer contenido de calidad y estar enfocadas en el usuario. Excluye todas las páginas que no cumplan con estos criterios.

Consulta esta guía sobre códigos de estado HTTP. Es fácil de seguir y te ayuda a entender los diferentes códigos de estado.

También debes destacar los tipos más importantes de páginas 200 OK que se deben incluir en tu sitemap:

  • Página de inicio
  • Páginas del menú principal
  • Páginas de categorías
  • Subcategorías
  • Páginas de blog
  • Páginas internas
  • Páginas de contacto
  • Páginas con información sobre la marca

Dado que estas páginas son cruciales para tu posicionamiento y el éxito general de tu negocio, debes asegurarte de que Google las conozca.

Páginas que no deben incluirse en el sitemap de una web

Páginas 3XX

Un código de respuesta 3XX indica que una página fue redirigida a una nueva dirección. Páginas como estas no deberían estar en tu sitemap XML.

En cambio, concéntrate en incluir las URL definitivas, ya que son las que muestran el contenido después de la redirección. Esto ayuda a los motores de búsqueda a comprender mejor la estructura de tu sitio web e indexar y posicionar correctamente tu contenido.

Páginas 4XX

Los códigos de respuesta 4XX indican que la página solicitada no existe o tiene acceso restringido. Excluye estas páginas de tu sitemap.

Las páginas 404 son páginas eliminadas, por lo que si se eliminaron a propósito, no las incluyas en tu sitemap XML.

Las páginas soft 404 tampoco son adecuadas para el SEO. Muestran un código de estado de nivel 200 a pesar de tener poco o ningún contenido, contener redirecciones a la página de inicio o incluir páginas 404 bloqueadas por robots.txt. No dudes en tomarte el tiempo necesario para solucionar este problema.

Puedes crear una página 404 personalizada para una experiencia de usuario fluida.

Otro código de estado 4XX popular es el 401, que indica que Google “no está autorizado” para acceder a la página. Estas páginas normalmente están destinadas a usuarios registrados y Google no debería indexarlas, lo que significa que no vale la pena incluirlas en tu sitemap.

Páginas 5XX

Los códigos de estado 5XX indican un problema con tu servidor web. El más común es el error 503 Servicio No Disponible, que indica que el servidor está temporalmente inactivo. Esto puede ocurrir si el servidor web está en mantenimiento o sobrecargado.

Si el error ocurre solo una vez, no deberías preocuparte, ya que es probable que se deba a un mantenimiento programado del servidor web. Pero si el problema persiste, tendrás que conocer la causa subyacente y resolverla de inmediato. De lo contrario, Google podría concluir que tu sitio web no tiene el mantenimiento adecuado.

Añadir o eliminar páginas 5XX de tu sitemap no hará ninguna diferencia. En cambio, concéntrate en solucionar el problema para mostrar un código de respuesta 200 OK.

Puedes identificar fácilmente estas páginas consultando el informe de la auditoría web de SE Ranking. Una vez que inicies la comprobación, navega hasta la sección Rastreo e Indexación del Informe de Problemas.

Sección de Rastreo e Indexación del informe de problemas en SE Ranking

Páginas no indexables

Todos los sitios web tienen varias páginas de servicio que son importantes para los usuarios, pero no para los motores de búsqueda, como páginas de inicio de sesión, páginas disponibles solo después de iniciar sesión, páginas de clasificación y filtrado, etc. Una práctica habitual es bloquear esas páginas con el archivo robots.txt para evitar que Google acceda a ellas. También puedes dejar que Google rastree la página, pero restringir su indexación con directivas especiales (noindex o all).

Ninguna de estas páginas debería estar en tu sitemap XML para empezar. Si una página no se puede indexar, pero aparece en tu sitemap, confunde a Google y desperdicia tu presupuesto de rastreo. Lo mismo ocurre con las páginas bloqueadas por robots.txt: Google no las rastreará.

También es una buena idea auditar tu sitio web para asegurarte de que la directiva noindex y el archivo robots.txt se utilizan correctamente y de que tú no bloqueaste accidentalmente las páginas incorrectas.

Para encontrar estas páginas, ve a la sección Rastreo e Indexación del Informe de Problemas de SE Ranking.

Páginas no indexadas detectadas por la auditoría del sitio web de SE Ranking

Al hacer clic en el recuento de páginas correspondiente, accederás a una lista completa de las URL marcadas como noindex o bloqueadas por robots.txt. También muestra otros parámetros importantes, como la cantidad de enlaces internos que llevan a la página, todas las metaetiquetas robots y las etiquetas x-robots, y los títulos de las páginas. Además, verás de inmediato si cada página está incluida actualmente en tu sitemap XML.

Si aún no eres usuario de SE Ranking, puedes probar la plataforma de forma gratuita con nuestra prueba de 14 días.

Páginas no canónicas

Una etiqueta canónica se utiliza para indicar cuál de dos o más páginas similares es la principal. El trabajo de Google es indexar y posicionar la página preferida e ignorar las duplicadas o casi duplicadas. Las páginas similares marcadas con etiquetas canónicas pueden tener URL completamente diferentes o URL similares (por ejemplo, URL generadas en el proceso de clasificación y filtrado, URL con etiquetas UTM y parámetros de seguimiento).

A veces, las etiquetas canónicas también se utilizan para garantizar que una página sea accesible a través de HTTP y HTTPS, así como con y sin el prefijo www. En este caso, la versión principal de la página (por ejemplo, la variante HTTPS sin www) se marca con rel=canonical. Sin embargo, la mayoría de los sitios web prefieren las redirecciones del lado del servidor, ya que son más sencillas y garantizan que solo se indexe la variante preferida del sitio web.

Ejecuta una auditoría web
Analiza tu sitio web con más de 130 parámetros de SEO para ver en qué puedes mejorar.

Las etiquetas canónicas funcionan de manera diferente a las redirecciones y son más como recomendaciones que como directivas. Google también puede seguirlas o ignorarlas. Por eso, tener URL no canónicas en el sitemap de una web puede resultar confuso para los motores de búsqueda. Si la página no está marcada como canónica, Google asumirá que no quieres que se indexe. Al mismo tiempo, añadir la página a tu sitemap XML incentiva a Google a indexar la página. Esto hará que Google indexe todas las versiones de la página, lo que provocará la canibalización de palabras clave.

Consulta nuestra guía sobre canibalización de palabras clave para saber cómo afecta al rendimiento de tu sitio web. También recibirás consejos y trucos para detectarla y prevenirla.

El motor de búsqueda también puede indexar la URL no canónica, lo que resalta aún más la importancia de dejarle claro qué página es la principal.

Sitemaps estáticos vs. dinámicos

A esta altura, es posible que te estés preguntando cuánto tiempo necesitarías dedicar a actualizar tu sitemap cada vez que publiques una página nueva o renueves una existente. Mantener actualizado tu sitemap XML puede ser difícil si creas un sitemap estático. La buena noticia es que puedes simplificar tu vida si creas un sitemap dinámico.

Los sitemaps dinámicos se actualizan automáticamente cada vez que realizas cambios en tu sitio web. Por ejemplo, cada vez que eliminas una página y se convierte en 404, la página se eliminará del sitemap. Si marcas una página como noindex o la añades al archivo robots.txt, también se eliminará del sitemap. Por otro lado, cada vez que creas una página nueva y la marcas como canónica, se agregará inmediatamente a tu sitemap. Todo lo que tienes que hacer es configurar la herramienta correctamente para asegurarte de que genere tus sitemaps de forma dinámica.

El sitemap dinámico es una solución perfecta para mantener actualizado el mapa del sitio, ya que se crea cada vez que un motor de búsqueda lo solicita. Pero como puede suponer una carga adicional para el servidor, solo recomendamos su uso para sitios más grandes con actualizaciones frecuentes.

Combinación de sitemaps de imágenes, videos y noticias

En ocasiones, el contenido de tu sitio web puede pertenecer a varias categorías, como artículos de noticias con imágenes y videos integrados. Puedes solucionar este problema combinando sitemaps de imágenes, videos y noticias en un único archivo grande.

Para hacerlo:

  1. Para cada sitemap que quieres utilizar en un mapa compartido, especifica el espacio de nombre correspondiente declarando las etiquetas admitidas. Esto se hace mediante el atributo xmlns en la etiqueta urlset.
  2. Para combinar sitemaps, agrega las etiquetas de los mapas deseados, una tras otra, a la etiqueta <url> correspondiente, como se describe en la documentación de cada sitemap.
Combinando sitemaps de imagen, vídeo y noticias

Consulta la Documentación de Google para obtener más detalles.

Añadir un sitemap al archivo robots.txt

Añadir una referencia al sitemap en el archivo robots.txt es la forma más segura y sencilla de informarle a los motores de búsqueda sobre tu mapa del sitio. El archivo robots.txt suele estar ubicado en el directorio raíz de tu servidor web, por lo que todo lo que tienes que hacer es incluir el comando sitemap, como se muestra en la siguiente captura de pantalla.

Cómo añadir un sitemap al archivo robots.txt

Esta práctica ayuda a los motores de búsqueda a descubrir tu sitio web y comprenderlo de manera más eficiente, lo que facilita la visualización e indexación de tus páginas web.

Aunque hacer públicos tus sitemaps en el archivo robots.txt es útil para la indexación, cualquiera puede encontrarlos fácilmente. Esto puede ser un problema si quieres mantener esas páginas alejadas de la visión del público.

Para obtener más información, consulta nuestra guía completa sobre cómo crear un archivo robots.txt.

Cómo enviar tu sitemap a Google

Dependiendo de la herramienta utilizada para generar tu sitemap, es posible que debas agregarlo manualmente a tu sitio, o puede que ya esté instalado; este suele ser el caso de las listas dinámicas generadas por un CMS. Normalmente, cuando un sitemap XML se agrega automáticamente a un sitio web, se puede encontrar en tusitioweb.com/sitemap.xml.

Si usaste una herramienta para generar tu archivo sitemap XML, cárgalo manualmente a la carpeta raíz de tu sitio web. Usa tu cPanel o un FTP client, como por ejemplo, Total Commander o FileZilla, para hacerlo. Asegúrate de comprobar la validez del sitemap antes de subirlo, especialmente si el archivo se creó manualmente. Puedes utilizar una herramienta gratuita, como esta, para comprobar si tu sitemap XML funciona como se espera.

Hacer referencia a sitemap en robots.txt

Una vez que tengas un sitemap válido en tu sitio web, puedes enviarlo a Google Search Console (GSC) a través del informe de Sitemaps. Solo tienes que hacer clic en Añadir un sitemap, introducir la URL del sitemap y pulsar el botón Enviar.

Cómo enviar tu sitemap a Google

Comprueba la columna Estado para ver si Google ha procesado correctamente tu sitemap. Si todo va bien, mostrará el estado Correcto. Si se analizó el mapa del sitio web, pero Google detectó errores, el estado mostrará Tiene errores. Por último, si Google no puede rastrear tu sitemap, aparecerá el estado No se ha podido obtener.

Corrige todos los errores del sitemap para garantizar que su estado sea Correcto.

Sitemap status Correcto en GSC

En la misma tabla de tu informe de Sitemap, verás cuántas URL se encontraron. Lo ideal es que coincida con la misma cantidad de URL que agregaste a tu sitemap.

Por último, haz clic en el botón con tres puntos para ir al informe de indexación de Páginas. Esto te dará una mejor comprensión de cómo Google rastrea e indexa tu sitio web. Estudia el informe para eliminar páginas de baja calidad de tu sitemap XML de forma más efectiva y agregar páginas que de otra manera no serían encontradas.

Errores comunes en un sitemap

Ten en cuenta los siguientes errores de sitemap y cómo solucionarlos:

  1. Formato XML no válido: los sitemaps deben cumplir con las reglas de formato XML. Estructura tu sitemap con la sintaxis XML correcta. Usa validadores XML, como se mencionó anteriormente, para validar tu sitemap.
  2. URL bloqueadas por robots.txt, No Follow o no accesibles: dependiendo de si quieres indexar o no estas URL, tendrás que levantar el bloqueo o eliminarlas de tu sitemap.
  3. URL faltantes o incorrectas: verifica que todas las URL incluidas en tu sitemap sean correctas y accesibles. Comprueba si hay enlaces que falten o estén rotos y actualízalos según corresponda. Además, incluye la versión canónica de cada URL para evitar problemas de contenido duplicado.
  4. Sitemap muy grande: si tu sitemap supera el tamaño máximo permitido (normalmente 50 MB o 50.000 URL), divídelo en varios sitemaps más pequeños y crea un archivo de índice de sitemaps para hacer referencia a los diferentes mapas.
  5. Incompatibilidad de rutas: asegúrate de que tu sitemap sea coherente con respecto a la presencia de «www» en las URL. Si tu sitemap se encuentra en https://ejemplo.com/sitemap.xml, ninguna de las URL que tiene debe incluir www. Si tu sitemap se encuentra en https://www.ejemplo.com/sitemap.xml, todas las URL que tiene deben incluir www.

Tenemos una guía dedicada que cubre los errores comunes en un sitemap para ayudarte a resolver estos problemas.

Considera la posibilidad de utilizar la herramienta de Auditoría Web para detectar errores en los sitemaps y consolidarlos en un informe independiente. Te mostrará si tienes problemas con páginas noindex, páginas no canónicas, páginas 3XX/4XX/5XX en el sitemap XML y mucho más.

Errores relacionados con el sitemap en la herramienta de auditoría del sitio web

Monitorear regularmente tu sitemap, evaluar su estructura y solucionar cualquier error o problema de inmediato ayuda a los motores de búsqueda a rastrear e indexar tu sitio web de manera efectiva.

Para concluir

¡Enhorabuena! Has terminado nuestro curso intensivo sobre cómo crear un sitemap. También recopilamos todas las prácticas recomendadas sobre sitemaps en la siguiente infografía. Aplica estas prácticas recomendadas y no tendrás problemas para asegurarte de que Google pueda encontrar y rastrear todas las páginas importantes de tu sitio web.

Bonus: Infografía sobre cómo crear un sitemap adecuado

Infografía sobre cómo crear un sitemap adecuado
¡Suscríbete a nuestro Blog!

Suscríbete a nuestros boletines y resúmenes para recibir noticias, artículos de expertos y consejos de SEO en tu bandeja de entrada.

¡Gracias!
¡Te has suscrito con éxito a nuestro blog!
Revisa tu bandeja para confirmar la suscripción.