La World Wide Web (también llamada WWW o simplemente “la Web”) es un sistema de información (actualmente enorme, posiblemente el más grande de la historia) basado en millones de páginas Web distribuidas por Internet. Esta información es servida bajo demanda por los servidores Web y consultada por los usuarios a través de los clientes (también llamados navegadores) Web.
Un servidor Web es un servicio que proporciona acceso a objetos Web alojados en un host con acceso a Internet. Los servidores Web aceptan peticiones (generalmente a través del puerto 80) de los clientes Web.
Existen muchos servidores Web. Aquí mostramos una lista con algunos de ellos: CERN httpd ( http://www.w3.org/Daemon), Apache ( http://httpd.apache.org) y Microsoft Internet Information Server ( http://www.microsoft.com/WindowsServer2003/iis/default.mspx).
Un navegador es la parte cliente de la Web. Cada vez que utilizamos uno y descargamos una página estamos realizando una petición HTTP a un servidor Web, y éste nos contesta con una respuesta HTTP que contiene el objeto Web solicitado.
Inicialmente los navegadores Web sólo podían mostrar texto. Sin embargo, actualmente existen muchos tipos de objetos Web que los navegadores son capaces de procesar (como imágenes, sonidos y vídeos, programas escritos en Java y Flash, etc.). Esta es una lista de algunos de los navegadores Web más famosos: Amaya ( http://www.w3.org/Amaya), Epiphany ( http://www.gnome.org/projects/epiphany), Galeon ( http://galeon.sourceforge.net), Windows Internet Explorer ( http://www.microsoft.com/spain/windows/ie/default.mspx), Konqueror ( http://konqueror.org), Lynx ( http://lynx.browser.org), Mozilla Firefox ( http://www.mozilla-europe.org/es/products/firefox), Netscape Navigator ( http://browser.netscape.com), Opera ( http://www.opera.com), Safari ( http://www.apple.com/es/macosx/features/safari) y Shiira ( http://hmdt-web.net/shiira/en).
El HTTP ( http://www.w3.org/Protocols) es el protocolo de transferencia de información básico* en la Web. Fue ideado a principios de los 90 en el CERN ( http://www.cern.ch) por Tim Berners-Lee ( http://www.w3.org/People/Berners-Lee).
El nombre común para todo lo que es posible transferir a través de la Web se conoce como objeto Web. Por definición cada objeto puede ser referenciado a través de una URL (Uniform Resource Locator). En los navegadores Web, las URLs se muestran en la entrada que se sitúa normalmente en la parte superior de la ventana del navegador.
El HTML ( http://www.w3.org/MarkUp) es el lenguaje en el que están escrito las páginas Web. En su versión más básica, una página Web es un conjunto de instrucciones escritas en HTML que referencian a otros objetos Web.
La World Wide Web Consortium (W3C) es el organismo internacional encargado de regular el desarrollo de la Web. La Web es el sistema de información más importante de Internet y muchas compañías y grupos de investigación (entre otros) añaden constantemente nuevas funcionalidades. La W3C se encarga (básicamente) de que cualquier cliente Web sea capaz de comunicarse con cualquier servidor Web.
La Web consume un gran porcentaje del ancho de banda de Internet. Para reducir dicho consumo puede instalarse un proxy Web que es un sistema que funciona como una caché para los usuarios que los usan.
El funcionamiento de un proxy Web es bastante simple de entender. Un proxy típicamente es utilizado por los usuarios de una red con suficientemente ancho de banda. Si suponemos que generalmente dichos usuarios van a acceder a un conjunto de objetos Web más de una vez en un intervalo de tiempo dado, es más eficiente colocar dichos objetos en el proxy Web y acceder a él.
Un proxy Web funciona como servidor y como cliente. Cuando un usuario configura su navegador Web para utilizar un proxy Web y accede a un objeto Web a través de su URL original (que referencia el objeto en el servidor Web, no en el proxy Web), en realidad accede (siempre) al proxy Web. El proxy Web entonces busca el objeto en su caché y si lo encuentra “fresco”† , se lo sirve al navegador Web cliente. Nótese que en este contexto el proxy Web está funcionando como un servidor Web.
Pero, ¿qué ocurre cuando el proxy Web no contiene el objeto Web solicitado? Entonces el proxy Web actúa como un cliente Web e intenta acceder al objeto Web a través de su URL original. Cuando lo consigue, actualiza su caché y lo envía al navegador Web del usuario.
Finalmente indicar que, aunque no configuremos nuestro navegador Web para utilizar un proxy Web, es probable que lo estemos utilizando. Muchos ISP colocan proxys Web transparentes para reducir el tráfico Web a través de su red.
Existen decenas de proxys Web. Sin embargo el más utilizado es, con diferencia Squid ( http://www.squid-cache.org).
El tema del ahorro de ancho de banda es una cuestión fundamental, y no sólo para los administradores de las redes. Por este motivo, la mayoría de los navegadores Web implementan su propia caché con el objeto de reducir el tráfico. Así, cuando accedemos a un objeto, el navegador primero comprueba si tiene una copia del mismo en su caché y si este está “fresco”, entonces el navegador visualiza el objeto sin necesidad de descargarlo de Internet.