Jueves, 09 de Septiembre de 2010
Login: Clave:
Registrarse
Portada -> Google Buscador de Webs -> Novedades -> "google bots
Mostrar todas las sub-secciones
Buscadores
Buscador de Webs
Buscador de Imágenes
Buscador de Videos
Buscador en Directorio
Buscador Froogle
Buscador de Noticias
Servicios Google
Google Temas Generales
Google Blogger
Google GMail
Google Grupos
Google Calendario
Google Page Creator
Google Maps
Google Labs
Google AdSense
Google Adwords
Google Docs
Google Youtube
Programas
Google SketchUp
Google Desktop
Google Mozilla Firefox
Google Talk
Google Picasa
Google Earth
Comunidad Mundo Google
Foro MundoGoogle
Quienes Somos
Colabora
Contactar
Mostrar Todo
"google bots
que es gloogle bots?cual es la utilidad para los miembros del equipo google?conoce su funcionamiento ...

     27/07/2006 Enviado por shabac

glogle bots


Googlebot es el robot que utiliza Google para 'rastrear' los sitios de Internet. No solamente indexa páginas web (HTML), sino que también extrae información de ficheros PDF, PS, XLS, DOC y   algunos otros más.

La frecuencia con la que Googlebot accede a un sitio web depende del PageRank de éste. Contra mayor sea este valor, el robot accederá más asiduamente a sus páginas.

Por ejemplo, podemos comprobar que los sitios con PR10 (el valor más alto), como yahoo.com o usatoday.com, han sido 'rastreados' por Googlebot ayer o incluso o hoy mismo, mientras que otros han sido accedidos hace varias semanas. Esto se puede comprobar accediendo al 'cache' de esta página.

Para comprobar si Googlebot ha accedido a nuestro sitio web, deberemos echar un vistazo a los logs de nuestro servidor. En ellos, deberemos observar si hay registros de accesos en los que aparezca 'googlebot'. Generalmente aparecerá el nombre del servidor, el cual podrá ser alguno de estos:




Googlebot intentará acceder, como hacen la mayoría de los robots de los motores de búsqueda, al fichero 'robots.txt'. En este archivo se deberán indicar las zonas de nuestro sitio web donde no queremos que entre ni Googlebot ni el resto de los buscadores. Para conocer más sobre 'robots.txt', existe un magnígico recurso: www.robotstxt.org.

Una vez que Googlebot haya 'rastreado' nuestra página, seguirá los enlaces que en ella encuentre (los HREF y los SRC).

Por lo tanto, si quieres que Googlebot indexe tu página web, solamente es necesario que algún otro sitio tenga un hiperenlace al tuyo. Si no es así, siempre puedes añadir directamente tu URL.

Además de este robot GoogleBot, existe otro, llamado FreshBot que 'rastrea' con mayor frecuencia los sitios webs con las noticias 'más frescas'





Artículos Relacionados con este
  • Curiosidades (Novedad)



    Otros Artículos de Google Buscador de Webs
  • Algunos trucos para google (Truco)
  • Google Hacking Database (Truco)
  • Trucos Google (Truco)
  • Usos de Comandos (Truco)


  • Todavía no se ha opinado, a que esperas para opinar! Opinar Esta Novedad/Tutorial/Truco.

    Para poder opinar necesitas estar REGISTRADO, si ya lo estas sólo tienes que conectarte ;)
    Ayuda Web | Aviso legal - Política de Privacidad | Colabora | Contactar | Quienes Somos
    Tiempo de Carga: 1.02174
    Copyright PortalMes.com - Todos los derechos reservados
    Añadir a Favoritos - Pon MundoGoogle Página de Inicio