La Empresa de Posicionamiento Web Canis Majoris garantiza la calidad de los servicios provistos por MSO Airport de Multiar.com


Estrategias para escalar en el Posicionamiento Web en Google


Entendiendo el robot de un motor de búsqueda

Los navegadores encuentran las páginas web mediante sus robots. Google utiliza el suyo, el cual es conocido como “Googlebot”, también llamado “araña”. Este es utilizado para rastrear los sitios, es decir;  encontrar las que existen, las nuevas y detectar los cambios y actualizaciones que les realicen los webmasters, mostrando esto en sus resultados a los usuarios que se interesan por obtener información sobre SEO.

Googlebot empieza su rastreo a través de la lista de las URL de los sitios que ya ha encontrado previamente, gracias a los mapas de sitios y enlaces como HREF y SRC que ha encontrado en estos y le permiten seguirle el paso.

Toda esta información es tomada en cuenta por el buscador para encontrar páginas nuevas, modificaciones que le realicen, si hay enlaces que ya no sirven e ir cambiando sus resultados con los datos actuales.

Este motor de Google accede a los sitios web para identificar información importante sobre estos, esto lo hace cada vez durante algunos segundos, luego solo rastrea una copia de cada URL simultáneamente. Si esto lo hace en varias ocasiones se debe a que el rastreo se reinicio.

La araña es distribuida en tantos equipos como sea posible para incrementar su rendimiento y estar a la vanguardia de los cambios que se apliquen en la web. Con el fin de evitar que se use la banda ancha, algunos rastreadores son ejecutados en ordenadores en lugares que se indexan o rastrean en la red, esto puede influir en que los registros le arrojen visitas de una cantidad de equipos del sitio Google, utilizando su robot como un “user – agent”. Lo que busca con esto es poder rastrear la mayor cantidad de su página en las visitas que realice la araña sin causarle problemas al ancho de banda de su servidor, para que vaya poco a poco obteniendo el Posicionamiento Web en Google.

Hay casos en los que usted quiera impedir que el robot rastree cierta información o contenido de su lugar web; por ejemplo datos de inicio de sesión o direcciones de su oficina entre otras que sean de interés personal, para esto es necesario que le impide a Googlebot que encuentre ese contenido. Para esto puede agregar un archivo de texto “Robots.txt” para impedirle que ingrese en datos de archivos o a determinado directorio de su servidor.

Para que esta orden que usted le de a la araña se vea reflejada debe esperar unos días, mientras tanto se seguirá mostrando ese contenido.

Para mostrar una advertencia de error en el registro de su servidor para dar a saber que no quiere que halle ese archivo, cree un archivo sin contenido y llámelo “robots.txt”.

Si lo que usted quiere es evitar que la araña rastree link o enlaces de una URL de su pagina, puede usar “No Follow”, la cual es una metaetiqueta, también puede agregar rel= “no follow” a un enlace para que no lo encuentre.

Puede hacer uso de las herramientas probar los robots.txt para que verifique como esta indexando el robot de Google ese contenido, si ha entendido lo que usted le pidió o puede mirar la pagina como lo hace el motor, mediante la herramienta explorar como el motor Google, llamada de este modo para que note la manera como el buscador detecta y muestra su sitio a los usuarios, que cosas puede mejorar, que otras puede dejar así para el Posicionamiento Web en Google de su web.

Tenga presente que su sitio web este siendo rastreado por la araña de Google, para esto puede acceder a la herramienta para administradores que le brinda y la pestaña de errores del rastreo, puede ingresar para que compruebe si  se han presentados inconvenientes que permitan el correcto enlace de su página.

Si ha incluido contenido AJAX, puede asesorarse primero en una opción que le brinda el motor para poder rastrear esta aplicación para que funcione del modo correcto, resguardando siempre el Posicionamiento Web en Google.

Cerciórese que el motor no este interpretando contenido de su web como spam, que en realidad sea la araña de Google la que rastrea su sitio y que emplee la opción “user – agent” para que la entienda el motor.

Si usted ha dispuesto un archivo de texto robots.txt, Googlebot respetara esto pero algunos otros no, como los hacker o usuarios malintencionados, por eso debe estar pendiente de algún contenido extraño que añadan en su web.

Existen user – agents entre los que encontramos feedfetcher, las cuales son tenidas en cuenta cuando las personas adicionan feeds al sitio principal del navegador Google o Google Reader; por lo que este agente no respeta las órdenes de robots.txt. Para bloquearle el paso a este user – agent, (feedfetcher – Google), agregue en su servidos el código 404 o el 410 u otros que son usados para frenar el paso a este agente.