La caracterización de la Web Superficial y la Web Profunda
La Web superficial y la Web profunda
.Los motores de búsqueda tradicionales (Google, Yahoo, etc.) sólo ofrecen acceso a una pequeña parte de lo que existe online, lo que se ha comenzado a llamar la
web superficial
ovisible. Lo que resta, la Web profunda, es un amplísimo banco de información ubicado encatálogos, revistas digitales, blogs, entradas a diccionarios y contenido de sitios quedemandan un login (aunque sea gratuito), entre otros tipos de contenido que no aparecenentre los resultados de una búsqueda convencional.¿Qué es la Web visible?Comprende todos aquellos sitios cuya información puede ser indexada por losrobots de los buscadores convencionales y recuperada casi en su totalidadmediante una consulta a sus formularios de búsqueda.Las características principales de los sitios de la Web visible son:
su información no está contenida en bases de datos
es de libre acceso
no requiere la realización de un proceso de registro para acceder Mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos conuna URL fija y accesibles desde otro enlace.¿Qué es la Web invisible?La
Web invisible
es el término utilizado para describir toda la informacióndisponible en Internet que no es recuperada interrogando a los buscadoresconvencionales. Generalmente es información almacenada y accesible mediante bases de datos.Si bien el 90% de las bases de datos están públicamente disponibles en Internet, los robotsde los buscadores solamente pueden indicar su página de entrada (homepage) y sonincapaces de entrar dentro de las tablas e indizar cada registro, les falta la habilidad parainterrogarlas, seleccionar sus opciones y teclear una consulta para extraer sus datos. Lainformación almacenada es por consiguiente "invisible" a estos, ya que los resultados segeneran en la contestación a una pregunta directa mediante páginas dinámicas (ASP, PHP...)es decir páginas que no tienen una URL fija y que se construyen en el mismo instante(temporales) desapareciendo una vez cerrada la consulta.Por cada millón de páginas visibles hay otros 500 o 550 millones ocultas, contiene alrededor de unos 100.000 sitios y el 90% suele ofertar su información pública y gratuitamente.La información pública y gratuita del Web invisible es actualmente de 400 a 550 vecesmayor que el Web visible.
