jueves, 8 de octubre de 2015

Las arañas de Internet

¿Quién no ha oído hablar del archiconocido Google en nuestros días? Es una herramienta que todos utilizamos para buscar cualquier tiempo de información en Internet. Aunque pocos saben que es un buscador, además de cómo funciona.


Un buscador está compuesto por cuatro componentes básicos: robot o spider, motor de indexación, índices o ficheros inversos y motor de búsqueda. Estos elementos actúan de la siguiente manera:

El robot, o spider, es un programa que va explorando  la Web consiguiendo información relevante de las páginas que visita. Después es  analizada y condensada.


Después, el motor de indexación  organiza los datos para su presentación a los usuarios. La indexación se realiza por conceptos o palabras clave,  indexando  todo el texto del documento, a excepción de los artículos, preposiciones y otros términos denominados “palabras vacías”. Hay motores de búsqueda que en la indexación utilizan las palabras que más se repiten, o  los vocablos que se encuentran en el título, la URL, las cabeceras, los enlaces, los primeros párrafos y las palabras claves incluidas en las etiquetas o tags.


Para facilitar la búsqueda, en la información recolectada, se utilizan estructuras de datos denominadas "índices o ficheros inversos", mediante los cuales se asocia una palabra a una lista de documentos relacionados con ella.


El motor de búsqueda  procesa las consultas recibidas por los usuarios. Recorre los índices inversos (por lo que los buscadores, solo pueden recuperar una pequeña parte de todo lo que realmente hay en Internet) buscando los términos relacionados con la consulta y obteniendo los identificadores de los documentos. Además, los ordena jerárquicamente y los  presenta al usuario.




Los buscadores más relevantes son:

  • Google (http://www.google.com)
  •  Lycos (http://www.lycos.com/)
  •  Bing (http://www.bing.com/)
  •  DuckduckGo (https://duckduckgo.com/)
  •  Yahoo buscador (https://es.search.yahoo.com/)

De manera muy similar trabajan bibliotecarios y documentalistas a la hora de elaborar información a partir de datos. Aunque, a diferencia de los motores de búsqueda, el documentalista no solo maneja información que está en Internet, sino también información impresa, sonora, etc, que no ha sido subida a la red.

No hay comentarios:

Publicar un comentario