lunes, 22 de junio de 2015

No todo está en Google

En Internet no sólo se puede buscar información en los conocidos buscadores. Estos sólo acceden a una pequeña parte del material que se alberga en la red, lo que se conoce como web superficial o visible. El resto, se encuentra en numerosos catálogos, diccionarios, sitios con login… en lo que se denomina web profunda o invisible.

La Web Superficial (visible)
Los sitios a los que los buscadores tienen acceso. Se caracteriza por
·         Información no contenida en bases de datos
·         Libre acceso
·         Sin registros
·         Páginas web estáticas (URL fija)

La Web Profunda (invisible)
Los buscadores no tienen acceso porque se accede a ellas mediante consulta con respuesta en páginas dinámicas. Se trata de la web “no indizable”.
Podríamos dividirla además en:
Web Opaca: compuesta por archivos no incluidos en buscadores por economía del buscador, frecuencia, economía de resultados visibles o URLs desconectadas (sin link desde otros)
Web Privada: excluidas de buscadores por protección de contraseñas, contener archivo (robot.txt) para evitar su inclusión, o contener el campo “noindex”
Web Propietaria: páginas que requieren registro para acceder al contenido
Web realmente invisible: formada por páginas no indizadas por limitaciones técnicas, programas ejecutables, archivos comprimidos y páginas dinámicas
Algunos ejemplos de recursos para búsqueda en web profunda:
·         The WWW Virtual Library (el catálogo más antiguo de la web)
·         Infoplease (enciclopedia Columbia)
·         DeepWebTech (motores de búsqueda específicos)
·         TechXtra (revistas y documentos específicos de ingeniería, matemáticas e informática)

Pues ya sabéis... No todo es Google!!

No hay comentarios:

Publicar un comentario