BUSCADORES ( MOTORES DE BUSQUEDA )
Un buscador en Internet es un programa accesible en forma remota, el cual efectua búsquedas de información mediante palabras claves (keywords) o conceptos ingresados por el usuario. En sí mismo, el motor de búsqueda generalmente es un computador muy poderoso, del tipo estación de trabajo, que extrae información de bases de datos de gran tamaño compiladas de Internet. Los computadores son de altísima velocidad, permitiendo que una búsqueda en varios miles de páginas pueda ejecutarse, en los mejores buscadores, en fracciones de segundo. Al respecto, cabe señalar que el buscador Google, actualmente el más popular, utiliza una batería de alrededor de 10000 (!) computadores, con lo que es capaz de atender miles de consultas por segundo.
La compilación de la información se realiza fundamentalmente a través de programas computacionales llamados robots o "arañas" (spiders) que automáticamente revisan enormes cantidades de páginas Web y luego catalogan y depositan la información encontrada en dichas bases de datos. Es necesario hacer notar que cuando se hace una búsqueda, ella corresponde al momento en que se compiló la información, y no al momento presente.
Baste decir que actualmente se estima que existen en Internet alrededor de cuatro mil millones de páginas Web. Los buscadores globales recomendados se detallan en otra página.
Cada buscador realiza su función de manera característica, dependiendo del tamaño de su base de datos, del período de actualización y sus capacidades de búsqueda, lo que hace que a menudo se obtengan diferentes resultados al usar distintos buscadores. Cabe observar que estudios de traslape entre buscadores han demostrado que aproximadamente la mitad de las páginas contenidas en la base de datos de un determinado buscador existen solo en esa base; por lo tanto siempre es conveniente consultar al menos un segundo buscador.
Overlap studies show that about half of the pages in any search engine database exist only in that database. Getting a second opinion is therefore often worth your time. Los buscadores tambien difieren en el diseño de su interfaz de búsqueda, en la forma de presentar los resultados y en la cantidad de ayuda que ofrecen al usuario.
La mayoría de las veces los buscadores son más útiles para ubicar información específica, tal como un documento determinado, una imagen o un programa computacional, antes que para un tema general.
Una variedad la constituyen los buscadores por materias específicas, tales como tipos de recursos, personas o zonas geográficas. Estos no estan concebidos para catalogar todo el Web, sino que la búsqueda se focaliza en sitios o páginas que cubren una determinada materia. Ejemplo de esta modalidad son buscadores regionales, de direcciones de personas, de software, etc.
META-BUSCADORES
En un meta-buscador, la búsqueda se realiza simultaneamente en varios buscadores individuales, es decir, se utiliza las bases de datos de cada uno de ellos.
Se debe hacer notar algunas desventajas que puede presentar el uso de meta-buscadores:
- Pueden excluir a algunos buscadores muy importantes, por ejemplo: Google y Lycos
- No son cuidadosos cuando se realiza búsquedas complejas, con expresiones booleanas (AND / OR / NOT). Tampoco permiten afinar la búsqueda.
- No garantizan que empleen todos los buscadores que aseguran usar.
Entre los meta-buscadores recomendados se destaca Copernic que corresponde a un programa gratuito que se baja de Internet e instalado en el computador del usuario. Una de sus ventajas es que permite almacenar los resultados de una búsqueda para su posterior revisión.
DIRECTORIOS DE MATERIAS
Se trata de índices organizados jerárquicamente, los que permiten a la persona que realiza una búsqueda revisar listas de sitios Web estructuradas por materias.
Estos directorios son construídos "manualmente", en el sentido que hay un trabajo directo de una o más personas que realizan la catalogación. A diferencia de los buscadores, estos directorios apuntan más a la profundidad que a la extensión de los resultados en un área determinada. Por este motivo, ofrecen un punto de partida útil para algunas búsquedas. Están dotados de sus propios buscadores para revisar sus bases de datos.
Estas bases de datos son menores que las de los buscadores tradicionales, de modo que el número de resultados entregados es también menor, pero habitualmente son más relevantes, debido al método de catalogación manual empleado, a diferencia del método automático de los buscadores.
Los directorios por materias están ordenados por categorías y normalmente los resultados son enlaces al nivel superior de un determinado sitio Web, por lo que se prestan para realizar una búsqueda de información general más que una demasiado específica.
GUIAS POR MATERIAS
Corresponden a páginas Web con numerosos enlaces que cubren un determinado tópico o disciplina. Estas guías están a cargo de un experto. Su estructura permite visualizar facilmente el tipo de información existente en Internet, usando las divisiones habituales de la disciplina, por ejemplo:
Química: Inorgánica / Orgánica / Físicoquimica / Industrial / etc.
WEB INVISIBLE
El Web visible es lo que aparece como resultado de los buscadores de información, los cuales enlazan a las páginas donde aparece tal información. También es lo que se presenta en la mayoría de los directorios.
El Web invisible, o más propiamente designado en la actualidad como el Web profundo es lo que no se puede obtener con las herramientas mencionadas, y que sin embargo existe, normalmente en forma de bases de datos especializadas que se incorporan a muchos sitios y que no pueden ser "vistos" por los buscadores.
Existen algunos sitios que permiten facilitar el acceso al Web Invisible.
Se accede a dichas bases de datos al conectarse a algún sitio determinado, el cual ofrece un servicio de búsqueda "local", es decir, realizable por el usuario solo en ese sitio. Los resultados de tales búsquedas se entregan como páginas Web específicas ("dinámicas"), las cuales no están almacenadas en ninguna parte: es más fácil y económico generar dinámicamente estas páginas de acuerdo a la búsqueda solicitada; ellas son invisibles para los buscadores tradicionales.
Lo opuesto son las páginas "estáticas": éstas residen en algun servidor, identificado por su dirección (URL) y son detectadas por la "araña" de un sistema de búsqueda. Este será entonces capaz de recuperar tales páginas desde su propia base de datos. Tales páginas son, pues, "visibles" a los buscadores tradicionales.
Dos excelentes referencias que aportan más detalles son:
- Página preparada por Robert J. Lackie, Profesor de Rider University
- Documento de Complete Planet (formato PDF)
Cómo encontrar el Web Invisible
Además de los sitios mencionados más arriba, es posible emplear los buscadores tradicionales si se agrega las palabras claves "base datos" o "database" a las palabras claves de búsqueda.
También, como resultado de una determinada búsqueda en directorios, es posible hallar páginas con bases de datos incorporadas y accesibles. Los directorios recomendados se presentan en otra página.
En resumen, una correcta estrategia de búsqueda debe incluir el descubrimiento de bases de datos específicas a determinadas páginas Web.
OTROS RECURSOS
Se debe aclarar que no toda la información buscada por un usuario estará disponible en Internet. Sin embargo, casi siempre será posible recurrir a bases de datos especializadas, generalmente pagadas y accesibles a través de Internet o en bibliotecas universitarias. Por ejemplo, la Biblioteca de la P. Universidad Católica de Valparaíso opera, entre otras, con las importantes bases de datos ISI Web of Science , OCLC First Search y Scopus. Una descripción de algunas de las bases de datos se puede encontrar aquí.
Por último, se debe mencionar la existencia de al menos un servicio de consulta en línea gratuita ofrecido por la Biblioteca del Congreso (EE.UU.)