SEO fácil: solución a los problemas más habituales de indexación

Da rabia. Has estado dedicando horas a preparar documentación, revisarla, escribir y publicar un nuevo post en tu web y no estás teniendo un retorno en visitas que te haga estar satisfecho. Has empezado a leer documentación SEO y cumples todo lo que recomiendan acerca de las palabras clave, imágenes, enlaces… Pero no te están llegando visitas desde Google… ¿Qué está pasando?

En estas guías SEOfácil encontrarás iconos que indican la dificultad de la tarea. Verás cuando crea que puedes realizarla fácilmente. Las señalaré con si creo que es necesario que consultes más de documentación para resolverla. Y con te indicaré que la tarea es compleja: vas a necesitar ayuda profesional o bastante tiempo para completarla. Si te surge algún problema avísame y lo vemos juntos. Puedes localizarme desde el formulario de contacto.

Lo cierto es que podrían estar ocurriendo 100 cosas. Tendríamos que hacer una auditoría SEO completa… Pero por mi experiencia, en muchas ocasiones el problema -que no siempre es fácil de resolver- tiene que ver con el indexado de los contenidos en tu web.

Te dejo aquí más información sobre como funciona Google y la importancia del rastreo y el indexado de tus contenidos.

¿Sabes cómo está realmente «indexada» tu web?

Este debería ser el primer paso de cualquier auditoría SEO: es imposible recibir tráfico orgánico si tu contenido no está indexado. Y estás perdiendo oportunidades si no tienes bien resuelto esto…

En este post voy a enseñarte cómo hacer tu mismo una «auditoría de indexación» para detectar áreas de mejora en el SEO de tu web.

A la hora de explicarte algunas cosas verás que no soy muy «académico». Prefiero sacrificar la precisión en las definiciones para que te sea más fácil entender lo que te recomiendo que hagas.

Si sigues leyendo los capítulos de la serie «SEOfácil» en unas semanas estarás en condiciones de diseñar tu mismo la «arquitectura de contenido» de tu página sobre salud para dar «más visibilidad» a unas partes y, si lo necesitas, ocultar a los buscadores lo que no te interese que encuentren (documentación privada por ejemplo), te perjudique (contenido duplicado) o no aporte valor a tu audiencia (thin content).

Para realizar esta «auditoría básica de indexación» únicamente vas a necesitar el buscador de Google, G. Analitycs y Search Console.

Si sigues avanzando en tus conocimientos de SEO terminarás por recurrir a Screaming Frog que es una de las herramientas «estándar» para el análisis técnico de webs.

¿Empezamos?

Desde el buscador de Google…

Haz esta búsqueda: «site:elnombredetuweb.xxx» para saber qué, cómo y cuántas urls tiene indexadas Google.

Vale. Me puedes decir que John Muller desaconseja este sistema. Que hay que verlo desde Search Console. Y tienes razón…

Pero haciendo esta sencilla comprobación seguramente ya puedas sacar conclusiones con solo mirar las dos primeras páginas de resultados. Cuando preparé este post Google tenía indexadas 46 urls de mi web. Apunta tu número de resultados porque es importante.

Aprovecha para curiosear los resultados de la búsqueda y revisa si los títulos, urls y las metas de cada post son adecuados, llaman la atención y explican de qué va el contenido del post al que hacen referencia. ¿Invitan al clic?

Ojo: que Google se inventa muchas veces las metadescripciones y está cambiando los títulos a su antojo.

Si haces cambios en el título, url o meta de algún post no dejes de reindexarlo (aquí te explico 3 trucos para que Google se entere rápido de tus cambios).

Últimamente he estado haciendo pruebas para mejorar el CTR de los resultados de búsqueda…

Deberías aprovechar que estás haciendo la auditoría para revisar los códigos de respuesta de las urls. Si no sabes de que te hablo haz un gugleo mientras termino de preparar el post sobre ello. A Google no le gustan las páginas con errores.

Y en paralelo mira tu web desde Search Console…

Como punto de partida comprueba si hay diferencia entre el número de entradas que has publicado en tu web (desde el escritorio de WordPress es muy fácil saberlo. También puedes consultar tu Sitemap) y el número de urls que tiene indexadas Google desde el informe de cobertura de Search Console

URLs que Google tiene indexadas hoy de mi web

Puedes ver la ruta del Sitemap de tu web desde Search Console: en mi caso está en eduardotornos.com/sitemap_index.xml

Si hay una diferencia significativa entre las urls publicadas y las indexadas por Google te conviene profundizar en el análisis de indexación: puedes estar perdiendo muchas oportunidades…

Al comparar estos datos puedes ver que…

  1. Google tiene indexado todo lo que tu quieres que indexe. ¡Enhorabuena! Has terminado por hoy. Te convendría repetir esta sencilla auditoria de indexación dentro de unos meses.
  2. Google no indexa nada de tu web… ¡Enhorabuena! Has descubierto el motivo por el que apenas tienes visitas a tu página. (Créeme. Esto es más frecuente de lo que piensas).
  3. Google está indexando demasiadas urls de tu web. Si reduces el número de urls «innecesariamente indexadas» por Google puedes llegar a optimizar mucho el SEO de tu página…
  4. Google no indexa (o tarda en indexar) tus nuevos post, tus actualizaciones o páginas que te interesa especialmente que aparezcan en los resultados de búsqueda y por mil motivos no lo hacen. (Aquí encontrarás trucos para indexar más rápidamente contenido en Google)

Vamos por partes

Si Google no está indexando nada de tu web…

Que Google te diga que la búsqueda «site:tuweb.xxx no obtiene ningún resultado» te confirma que tu web no está indexa. Y si no está indexada…

Salvo que acabes de lanzarla seguro que no es culpa de Google: lo más probable es que voluntaria o involuntariamente estés bloqueando el acceso a su sistema de rastreo (Googlebot)

Si utilizas WordPress acércate a Ajustes>Lectura y confirma que no está señalada la casilla que impide indexar tu web a los buscadores.

Es un error que podemos cometer todos. A mi me ha pasado también… 🙁

Ten especial cuidado con esto si lanzas una nueva web, si acabas de hacer una migración o un cambio de dominio.

Si la casilla no está marcada el problema puede ser un poco más complicado de resolver… pero con ganas y tiempo quizá puedes arreglarlo tu mismo.

Vamos a ver si el responsable de este error es el archivo robots.txt de tu web.

Escribe en el navegador tuweb.xxx/robots.txt

Si ves este código

User-agent: *
Disallow: /

Ya tendremos claro que está pasando…

Con esas instrucciones el archivo robots.txt le estará diciendo a los bots de los buscadores (también a Googlebot) que no entren a ver tu web… para resolver esto solo tendrías que editar el archivo robots.txt retirando el «Disallow:/». En internet encontrarás información sobre como hacerlo.

Aunque tu archivo robots.txt le diga a Googlebot que no entre a ver tu web, Google podría indexar cualquier url de tu página si tiene acceso siguiendo algún enlace desde otro punto de internet… desde una publicación en redes sociales por ejemplo.

Si no ves nada parecido a «User-agent: * Disallow: /» en tu robots.txt tendrás que seguir investigando…

Abre cualquier página de tu web y pulsa el botón derecho del ratón. Selecciona «Ver código fuente de la página» (en Chrome Ctrl+U). No te asustes con lo que aparece.

Busca esta etiqueta: «<meta name=’robots’ content=’noindex,follow’>» (en Chrome puedes recurrir a Ctrl+F). Este trocito de código le está diciendo a los buscadores «no me indexes»…

Si apareciera ya tendrías localizado el problema y solo nos quedaría encontrar al «responsable» de que eso esté así…

Seguramente se deba a una incorrecta configuración de alguno de los plugins que tienes instalado en tu WordPress para mejorar el SEO (Yoast, All in One SEO Pack, SEOPress… hay muchos).

Si no es el «tic» en el ajuste de lectura de WordPress y no encuentras nada en el robots.txt o en la etiqueta de tus páginas te recomiendo que no lo intentes resolver por tu cuenta: habla con un especialista

Si tienes mucho más contenido indexado que publicado…

Piensa un momento: ¿Cuántos post has escrito en tu web? ¿100, 200, 300, 500?

Si el número de resultados que te devuelve Google al búscar «site:tuweb.xxx» es muy superior al número de post que has escrito…

Estás perjudicando el SEO de tu web al indexar (sin saberlo) contenido duplicado o de poco valor (thin content) que a Google no le gusta nada…

Además, si Google está rastreando e indexando más urls de las necesarias estarás desaprovechando tu crawbudget. Ya te hablaré de esto más adelante.

Las soluciones a los problemas de sobreindexación son un poco más complicadas…

Quizá llegues a necesitar ayuda de un especialista SEO que revise la arquitectura de contenido de tu web y te haga recomendaciones sobre recategorización, redireccionamiento, urls canonicas…

Tu puedes ocuparte de hacer «los básicos» para «desindexar» todo ese contenido basurilla que mancha y no aporta en los resultados de Google. Esto ayudará a mejorar el SEO de tu página.

Revisa la configuración del plugin que tienes instalado en tu WordPress para mejorar el SEO (Yoast, All in One SEO Pack, SEOPress… hay muchos).

Si utilizas Yoast SEO…

  • En la configuración del plugin acércate a Apariencia en el buscador>Medios Selecciona SI en la opción «¿Redirigir las URL de adjuntos a los propios adjuntos?» Si no lo haces WordPress seguirá creando por defecto una url por cada uno de los adjuntos (imágenes normalmente) que subas a tu web. En una web de salud es puro «Thin content».
  • En Apariencia en el buscador>Taxonomías selecciona NO en las opciones de «¿Mostramos Categorías en los resultados de búsqueda? » y en la de etiquetas.
  • Apariencia en el buscador>Taxonomías: Deja los Formatos inactivos
  • Apariencia en el buscador>Archivos: deja inactivos los archivos por fecha y si solo escribes tu en tu página deja en inactivo también los Archivos de autor.

¿Recuerdas el ejemplo de la web que compartí hace un poco más arriba? Tenía indexadas 2.210 urls… Para un blog sanitario es una barbaridad (siempre que no haya una tienda online por medio).

Casi la mitad de las urls indexadas son de los índices por «etiquetas»(tags) que es contenido de poco valor (Thin content) que genera ruido y duplicidades… Te insisto: esto a Google no le gusta nada.

Puedes localizar el contenido desindexable de tu web haciendo estas búsquedas…

inurl:tag site:tuweb.xxx – te devolverá el número de páginas indexadas del archivo de etiquetas de tu web. Si no ves nada, estupendo.

inurl:category site:tuweb.xxx – te devolverá el número de páginas indexadas del archivo de categorías de tu web. Si no hay ninguna url indexada, genial.

inurl:page site:tuweb.xxx – te devolverá el número de urls indexadas del archivo de páginas que incluyen todos tus post.

inurl:author site:tuweb.xxx – te devolverá el número de páginas indexadas del archivo de post por autor. Si eres el único que escribe en tu web no tiene demasiado sentido conservarlas…

También puedes «sugerir» a los buscadores que no accedan al contenido que sabes que aporta poco valor: búsquedas en tu web, comentarios o urls que incluyen «parámetros».

No voy a detenerme a explicarte como editar archivo robots.txt para hacerlo. Tienes muchísima documentación en Internet… Recuerda que es un apaño que no siempre funciona: aunque en tu archivo robots.txt le digas a Googlebot que no rastree algunas urls, Google podría indexar cualquier página de tu web si tiene acceso desde algún enlace (interno o externo).

Es mucho mejor que toques la configuración de los plugins que te ayudan al SEO o que incluyas las etiquetas meta <meta name=’robots’ content=’noindex,follow’> en esas urls prescindibles. En esto seguramente necesites ayuda especializada.

También podrías acercarte a la antigua versión de Search Console para eliminar temporalmente las urls que te interese retirar de los resultados de búsqueda.

IMPORTANTE: aunque es raro que ocurra, antes de hacer nada para desindexar cualquier url de tu web comprueba desde Analitycs que no estás recibiendo visitas a esas páginas especiales bien por tráfico orgánico o porque están enlazadas internamente o desde otras webs.

Es muy fácil verlo: acércate a Analitycs. Selecciona los datos de los últimos 2-3 meses. Sigue Comportamiento > Contenido del sitio > Páginas de destino. Vas a tener que utilizar el buscador. Empieza por buscar «tag» (etiquetas). Te mostrará las urls que han recibido tráfico y que incluyen esa expresión. Si en Dimensión secundaria seleccionas Fuente/Medio podrás saber por donde han llegado esas visitas.

Lo normal es que esas páginas especiales te acerquen muy poco tráfico.

Si ves que el número de visitas es alto busca a un especialista que te ayude a revisar toda a estructura de enlace y contenido de tu web.

¿Te interesa el SEO para «gustar» más a Google?
Por aquí te dejo las últimas cosillas que he publicado en mi blog


3 comentarios en «SEO fácil: solución a los problemas más habituales de indexación»

  1. Muy buen artículo con información muy completa, el problema es que al final siempre estás en manos de los capricho de Google, como sucede actualmente, casi tres meses sin poder indexar manualmente en Search Console.

    Responder

Deja un comentario