¿Quién no ha oído hablar del archiconocido Google en nuestros
días? Es una herramienta que todos utilizamos para buscar cualquier tiempo de
información en Internet. Aunque pocos saben que es un buscador, además de cómo
funciona.
Un buscador está compuesto por cuatro componentes básicos: robot o spider, motor de indexación, índices o ficheros inversos y motor de búsqueda. Estos elementos actúan de la siguiente manera:
El robot, o spider, es un programa que va explorando la Web consiguiendo información relevante de
las páginas que visita. Después es analizada y condensada.
Después, el motor de indexación organiza los datos para su presentación a los
usuarios. La indexación se realiza por conceptos o palabras clave, indexando todo el texto del documento, a excepción de
los artículos, preposiciones y otros términos denominados “palabras vacías”.
Hay motores de búsqueda que en la indexación utilizan las palabras que más se
repiten, o los vocablos que se
encuentran en el título, la URL, las cabeceras, los enlaces, los primeros párrafos
y las palabras claves incluidas en las etiquetas o tags.
Para facilitar la búsqueda, en la información recolectada, se
utilizan estructuras de datos denominadas "índices o ficheros
inversos", mediante los cuales se asocia una palabra a una lista de documentos
relacionados con ella.
El motor de búsqueda
procesa las consultas recibidas por los usuarios. Recorre los índices
inversos (por lo que los buscadores, solo pueden recuperar una pequeña parte de
todo lo que realmente hay en Internet) buscando los términos relacionados con
la consulta y obteniendo los identificadores de los documentos. Además, los
ordena jerárquicamente y los presenta al
usuario.
Los buscadores más relevantes son:
- Google (http://www.google.com)
- Lycos (http://www.lycos.com/)
- Bing (http://www.bing.com/)
- DuckduckGo (https://duckduckgo.com/)
- Yahoo buscador (https://es.search.yahoo.com/)
De manera muy similar trabajan bibliotecarios y documentalistas a la hora de elaborar información a partir de datos. Aunque, a diferencia de los motores de búsqueda, el documentalista no solo maneja información que está en Internet, sino también información impresa, sonora, etc, que no ha sido subida a la red.
No hay comentarios:
Publicar un comentario