SPAM: ¿Cómo acabar con el tráfico spam en Google Analytics?

El spam en Google es sin duda una de las cosas más molestas que existen en el mundo de las páginas web e Internet en general. Muchos desarrolladores o editores web tienen que combatir este problema. Este no es un artículo de los que apetece escribir, pero sí uno de los post que creo que son necesarios, ya que este es un problema común.

Spam

Stop spam es algo que todos los webmasters deseamos.

¿Habéis observado en Google Analytics que os llega tráfico web de sitios desconocidos o de países como Rusia o Kazajastan? En efecto, a esto se le conoce como tráfico fantasma. Vamos a ver cómo podemos acabar con esto.

¿Cómo detener o acabar con el spam en Google Analytics? Hace días que llevo observando que recibo visitas desde Rusia. Día tras día, según Google Analytics, una de las mejores herramientas web que existen, recibo varias visitas desde este país.

Y son visitas que o permanecen mucho tiempo en la web o simplemente nada. Si el contenido de mi página web es en castellano, ¿para qué van a querer entrar los rusos en mi blog? y lo más llamativo, ¿para qué van a querer entrar y salir de inmediato día tras día? Raro, ¿verdad? Así que empecé a husmear por Internet en busca de información al respecto.

Después de leer varios posts y no quedarme demasiado claro, topé con esta guía que me ha venido de perlas para resolver el problema. Las visitas, en mi caso, llegaban desde dominios como monetizationking.net o rank-checker.online (entre otros). Pero puede llegar desde muchos otros sitios. Aquí podéis ver una lista muy bien elaborada con todos, o la mayoría, de dominios fantasma o spam.

Como decíamos, no existe una visita real, ni humana. Ni siquiera de robot, ya que al principio pensaba que podría tratarse de robots de Google, o otros buscadores, que rastreaban mi web. Pero nada de eso. El spammer manda datos directamente a Google Analytics, sin pasar por tu sitio, y así llamar tu atención para que visites el dominio fantasma en busca de un backlink.

Por eso recomiendo encarecidamente que antes de visitar cualquier sitio web sospechoso, le echéis un ojo a la lista de dominios fantasma o spam. En principio no tiene por qué ser sitios web maliciosos, que puedan robar tus datos, pero mejor no arriesgar. Asimismo no tiene por qué afectar negativamente al posicionamiento de tu página web, pero si queremos que los datos de Google Analytics sean claros y no mientan, debemos eliminar este tipo de spam.

¿Qué es el referer spam en Google?

El referer spam consiste en hacer peticiones constantes a nuestro sitio web utilizando una falsa url. Pero no es cierto que nos estén llegando esas visitas. Estos falsos datos se mezclan junto con las estadísticas reales de nuestra web, por tanto debemos eliminarlos. Ver definición en Wikipedia.

Pasos a seguir en Google Analytics para evitar el spam

(Los pasos que resumiré a continuación están sacados de ohow.co, como he dicho anteriormente. Para ver los pasos detalladamente visitar su guía)

  1. Lo primero de todo. Ir a administración, ver configuración y a continuación «copiar vista». Así mantendremos nuestros datos a salvo por si ocurre algún error o tocamos algo que no debemos.
  2.  Ahora habrá que crear un filtro para no dejar pasar estos datos falsos. Lo siguiente es obtener una lista de tus nombres de host válidos. Vamos a «informes» y le damos a un año vista en el calendario. Luego, expandir «audiencia» en la barra lateral. «Tecnología» y selecciona «red». De forma predeterminada viene «proveedor de servicios», por lo que hay que cambiarlo a «nombre del host». Ahí veremos nuestros host y excluiremos los que no son nuestros.
  3. Ahora vamos a crear un filtro. «Administrador», seleccionar vista, seleccionar «filtros» en la pestaña «ver» y «agregar filtro». En «tipo de filtro» seleccionamos «personalizado». Dale a «incluir» y en «campo del filtro» busca «nombre del host». Ahora copia y pega la «expresión de nombres de host» que se creó en el apartado 2.

Evitar el Clawler Spam

Vamos otra vez a «administrador», seleccionar «filtros» y «agregar filtro», «tipo de filtro» será «personalizado», en «campo» selecciona «fuente de campaña». No olvidar pulsar en «incluir» y «personalizado». Finalmente en «patrón de filtro» se pueden copiar estas líneas por separado. Es decir, creando un filtro diferente para cada una:

#1
(best|dollar|success|top1)\-seo|(videos|buttons)\-for|anticrawler|^scripted\.|semalt|forum69|7makemon|sharebutton|ranksonic|sitevaluation|dailyrank|vitaly|profit\.xyz|rankings\-|dbutton|uptime(bot|check|\.com)
#2
datract|hacĸer|ɢoogl|responsive\-test|dogsrun|tkpass|free\-video|keywords\-monitoring|pr\-cy\.ru|fix\-website|checkpagerank|seo\-2\-0\.|platezhka|timer4web|share\-buttons|99seo|3\-letter
# 3
Sigue los mismos pasos solo que en lugar de «fuente de la campaña» selecciona «configuración de idioma»
\s[^s]*\s|.{15,}|\.|,

Excluir todas las visitas de robots y de arañas conocidos

Los robots de Google o Bing también visitan tu página para indexarla regularmente. Estos bots no son malos pero también aparecen en las estadísticas de Analytics. Si bien, se quieren evitar, habrá que hacer lo siguiente:

«Administrador», «ver configuración» y seleccionas la casilla donde se lee «excluir todas las visitas de robots y de arañas conocidos«.

Filtrar el tráfico interno para no contabilizar las propias visitas

Repetir lo mismo que hemos hecho anteriormente para crear un filtro, solo que ahora, en el campo del filtro seleccionaremos «dirección IP«. En el patrón del filtro pondremos nuestra propia IP o todas las IPs que queramos excluir de las estadísticas de Analytics.

Limpiar el spam basura

Lo hecho anteriormente no limpiará los datos históricos, para ello tendremos que crear un segmento. Vamos a «informes», «todos los usuarios» y crear «segmento». Luego accedes a «condiciones». A continuación creamos los filtros que estimemos oportunos. Hasta aquí el resumen de cómo acabar o detener el tráfico spam en Google Analytics. No obstante, visitar la guía donde se explica todo con mejor detalle.

Share

Puede que también te guste...