          WWWOFFLE - World Wide Web Offline Explorer - Versin 2.5
          ========================================================

El programa WWWOFFLE simplifica la navegacin por la telaraa mundial en 
ordenadores que usan una conexin intermitente (dial-up) a Internet.

Descripcin
-----------

El programa wwwoffled es un simple servidor proxy con caractersticas para ser 
usado con conexiones intermitentes (dial-up) a Internet.  Esto Significa
que es posible navegar por pginas y leerlas sin tener que estar conectado.


Caractersticas Bsicas
	- Almacenamiento de protocolos HTTP, FTP y finger.
  	- Permite los mtodos HTTP 'GET', 'HEAD', 'POST' y 'PUT'.
  	- Control de estado (En Lnea/Fuera de Lnea/Auto-llamada) interactivo o
		en lnea de comandos.
  	- Altamente Configurable.
  	- Bajo Mantenimiento, los estados Arranque/Parada y En Lnea/Fuera
		de Lnea pueden ser automatizados.

Mientras se est En Linea
	- Almacenado de pginas que se estn viendo para releerlas ms tarde.
  	- Recogida condicional de slo las pginas que han cambiado.
  	- Recogida condicional de slo las pginas que han cambiado.
        	- Basada en la fecha de caducidad, el tiempo desde la
			ltima recogida o una vez por sesin.
	- Soporte sin Almacenamiento de SSL (Secure Socket Layer) (https).
  	- Puede ser usado con uno o ms proxys externos basado en pginas web.
	- Controla que pginas no pueden ser accedidas.
		- Permite el reemplazo de las pginas bloqueadas.
  	- Controla que pginas no se deben almacenar en la cach.

Mientras se est Fuera de Linea

	- Puede ser configurado para ser usado con llamada-bajo-demanda con
		pginas que no estn almacenadas.
  	- Seleccin de pginas para ser bajadas la siguiente vez En Lnea.
        	- Usando un navegador para seguir los enlaces.
        	- Desde la interfaz de lnea de comandos para seleccionar
			las pginas.
	- Controla que pginas puedes ser pedidas Fuera de Lnea.
  	- Provee acceso sin cach a servidores de intranet.

Recogida Automtica

	- Recogida de las pginas especificadas de forma no interactiva.
  	- Opciones para recoger objetos de las pginas seleccionadas.
      		- Entiende varios tipos de pgina.
        		- HTML 4.0, clases Java, VRML (parcialmente), XML
				 (parcialmente).
		- Opciones para recoger diferente tipos de objetos Java
        		- Imgenes, Hojas de Estilo, Marcos, Scripts, Java
				u otros objetos.
  	- Puede seguir enlaces de las pginas que han sido trasladadas.
  	- Puede monitorizar pginas a intervalos regulares para recoger
		las que han cambiado.
  	- Recogida recursiva
      		- Hasta la profundidad especificada.
        	- En cualquier husped o limitada al mismo husped o al
			mismo directorio.
        	- Seleccionada desde la lnea de comandos o desde un
			navegador.
        	- Controla que enlaces puedes ser recogidos
			recursivamente.

Conveniencia
	- Pie de pgina opcional con informacin en las pginas HTML
		mostrando opciones y la fecha de almacenamiento.
  	- Opciones para modificar las pginas HTML
        	- Quitar el Javascript.
        	- Parar los GIFs animados.
        	- Indicar los enlaces almacenados y no almacenados.
        	- Quitar la lnea parpadeante (blink tag).
  	- Configuracin automtica del proxy para Netscape.
  	- Bsqueda en la cach con la adicin del programa ht://Dig.
  	- Pequeo servidor web integrado para las pginas locales.
  	- Tiempo de espera de la conexin con el servidor y transferencia
		de datos para evitar atascos del servidor.
  	- Continuacin o parada de la descarga interrumpible por el
		cliente o el servidor.
  	- Eliminacin de las pginas de la cach
	        - Basada en la correspondencia de URL.
        	- Para tener el tamao de la cach bajo un lmite
			especfico.
        	- Para tener el espacio libre de un disco sobre un lmite 
			especfico.
        	- Control interactivo o en lnea de comandos.

ndices
	- Mltiples ndices de las pginas almacenadas en la cach
	        - Servidores por cada protocolo (http, ftp ...).
        	- Pginas en cada servidor.
        	- Pginas esperando para ser recogidas.
        	- Pginas recogidas la ltima vez En Lnea.
        	- Pginas monitorizadas de una forma regular.
	- ndices Configurables
        	- Ordenados por nombre, fecha, nombre del dominio del
			servidor, tipo de fichero.
        	- Opciones para borrar, recargar o monitorizar pginas.
        	- Seleccin de una completa lista de pginas o ocultar las
			pginas no interesantes.

Seguridad
	- Trabaja con pginas que requieren autentificacin bsica de
		nombre/contrasea.
  	- Automatiza la autentificacin a proxys externos que lo
		requieren.
  	- Controla el acceso al proxy
	        - Por defecto slo permite el acceso local.
        	- Acceso de huspedes configurado por nombre de husped o IP.
	        - Autentificacin opcional del proxy a nivel de usuario.
  	- Control opcional de contrasea para la administracin del proxy.
  	- Puede censurar las cabeceras HTTP entrantes y salientes para
		mantener la privacidad del usuario.

Configuracin
	- Todas las opciones se controlan usando un fichero de configuracin.
  	- Pgina web interactiva para la edicin del fichero de configuracin.
  	- Pginas de error e informacin personalizables por el usuario.

Configurando un Navegador Web
-----------------------------

Para usar el programa WWWOFFLE, se requiere que su navegador est configurado 
para usar un proxy. El nombre del proxy ser 'localhost' (o el nombre del
husped en el que wwwoffle se est ejecutando),y el nmero de puerto que
est usando wwwoffled (por defecto 8080).

Configuracin Manual

    Netscape V1:
        En la ventana de dilogo Opciones->Preferencias, teclee localhost 
	como proxies http y ftp y 8080 como nmero de puerto.

    Netscape V2,3:
        En la ventana de dilogo Opciones->Preferencias, bajo la casilla 
	Proxies seleccione la opcin "Configuracin Manual de Proxy" y
	teclee localhost como proxies http y ftp y 8080 como nmero de
	puerto.

    Netscape V4:
        En la ventana de dilogo Edicin->Preferencias seleccione Avanzado 
	y luego Proxies, seleccione la opcin "Configuracin Manual de
	Proxy" y teclee localhost como proxies http y ftp y 8080 como nmero
	de puerto.

    Mosaic V2.6, Lynx, Arena, Emacs-W3:
        Ponga las variables de entorno http_proxy y ftp_proxy to
        http://localhost:8080/

Configuracin Automatica

    Netscape 2+:
        En vez de seleccionar la opcin "Configuracin Manual de Proxy" como 
	se describe arriba seleccione la opcin "Configuracin
	Automatica deProxy" y escriba http://localhost:8080/wwwoffle.pac en
	la caja.

Tambin necesitar desactivar el cacheo que el navegador realiza entre 
sesiones para obtener el mejor resultado del programa.

Dependiendo de que navegador use y que versin, es posible pedir pginas
mientras se est fuera de lnea.  Esto se hace usando en botn "recargar" en
el navegador.  En muchos navegadores, hay dos formas de hacerlo, una fuerza
al proxy a recargar la pgina, y es esta la que causar que la pgina se
refresque.

La ltima informacin de compatibilidad de navegadores est disponible en:
http://www.gedanken.demon.co.uk/wwwoffle/version-2.4/browser.html


Pgina de Bienvenida
--------------------

Hay una pgina de bienvenida en la URL 'http://localhost:8080/' que da una
somera descripcin del program y tiene enlaces a las pginas ndice,
pgina de control interactivo y las pginas de WWWOFFLE en internet.

Los sitios ms importantes para encontrar informacin acerca de WWWOFFLE son la
pgina web 'http://www.gedanken.demon.co.uk/wwwoffle/' que tiene informacin
de WWWOFFLE en general.  O incluso mejor la pgina deusuario de la versin 2.4
de WWWOFFLE 'http://www.gedanken.demon.co.uk/wwwoffle/Version-2.4/user.html'
que tiene ms informacin acerca de esta versin de WWWOFFLE.


Indice de Ficheros Almacenados
------------------------------

Para ver el ndice de ficheros almacenados, use la URL 'http://localhost:8080/index/'.
Hay suficientes enlaces en cada pgina pgina ndice  para permitir fcilmente
la navegacin por las pginas.

Los ndices proveen diversos niveles de informacin:
   Una lista de peticiones salientes.
   Una lista de los ficheros recogidos la ltima vez que el programa estuvo 
	en lnea. y tambin de la 3 veces anteriores.
   Una lista de los ficheros que estn siendo monitorizados.
   Una lista de los ficheros recogidos recientemente.
   Una lista de todos los huspedes por cada protocolo (http,ftp etc.).
   Una lista de todos los ficheros de un husped en particular.

Estos ndices pueden ser prdenados de diferentes formas:
   Sin ordenar
   Por tiempo de la ltima modificadin (cambio).
   Por tiempo del ltimo acceso.
   Por fecha de la ltima modificacin con marcas para cada da.
   Alfabticamente.
   Por extensin del fichero.

Para cada una de las pginas que son almacenadas hay opciones para borrarla,
recargarla, selecionar la pgina de recarga interactiva con la URL ya rellenada
o aadir la pgina a la lista que se monitorea regularmente.

Tambin es posible especificar en el fichero de configuracin que URLs no 
se deben listar en los ndices.


Pgina Interactiva de Recarga
-----------------------------

Se pueden especificar pginas usando cualquier mtodo que provea el navegador
que se est usando o alternativamente se puede usar la pgina
interactiva de recarga. Esta permite al usuario introducir la URL y luego 
recogerla si no est almacenada o recargarla si est en la cach. Hay
tambin la opcin de recogida recursiva de las pginas que estn enlazadas
a la pgina especificada. Esta recogida recursiva se puede limitar a las
pginas del mismo husped, estrechada a los enlaces en el mismo directorio
(o subdirectorio) o ensanchada para recoger pginas de cualquier servidor
web. Esta funcionalidad se provee tambin desde la lnea de comandos del
programa 'wwwoffle'.


Monitorizando Pginas Web
-------------------------

Se pueden especificar pginas para que sean monitorizadas a intervalos 
regulares. Esto puede ser cada vez que WWWOFFLE est en lnea o en
intervalos especificados por el usuario. La pgina ser monitorizada
cuando se cumplan las cuatro condiciones especificadas:
Un mes del ao en el que se puede recoger la pgina (se puede poner a todos 
los meses). Un da del mes en el que se puede recoger la pgina (se puede
poner a todos los das). Un da de la semana en el que se puede recoger la
pgina (se puede poner a todos los das). Una hora del da en la que la
pgina debe ser recogida (puede ser ms de una). Por ejemplo, para coger
la URL cada sbado por la maana, use lo siguiente:

Mes del ao: todos
Da del mes: todos
Da de la semana: Sbado
Hora del da: 0 (Reloj de 24 horas)


Pgina Interactiva de Control
-----------------------------

El comportamiento del modo de operacin del demonio WWWOFFLE se puede controlar
desde una pgina interactiva de control situada en 'http://localhost:8080/control/'.
Esta tiene un nmero de botones que cambian el modo del servidor proxy.
Estos proveen las mismas funciones que la linea de comandos del programa 
'wwwoffle'. Para proveer seguridad esta pgina se puede proteger con
contrasea. Tambin se pueden borrar pginas de la cach o de las
encoladas en el directorio de peticiones salientes.


Pgina Interactiva de Edicin del Fichero de Configuracin
----------------------------------------------------------

La pgina interactiva de edicin del fichero de configuracin permite editar 
el fichero wwwoffle.conf.  Esto se puede hacer desde la pgina de control 
'http://localhost:8080/control/'. Cada seccin en el fuchero de configuracin
tiene una caja de dilogo separada que permite cambiar los contenidos de la 
seccin de configuracin. Los comentarios del fichero de configuracin se
muestran en la pginas para que la descripcin de los diferentes valores
se pueda consultar fcilmente. Cuando el contenido de las secciones se
actualice, el fichero de configuracin puede ser reledo selecionando el
enlace al final de la pgina.


Busqueda en la Cach
--------------------

Si el programa ht://Dig program (version 3.1.0b2 - http://htdig.sdsu.edu/)
est tambin instalado es posible buscar en la cach WWWOFFLE.  La pgina
web 'http://localhost:8080/htdig/' provee el formulario de bsqueda que
buscar en la base de datos que se crea ejecutando los scripts provistos
por WWWOFFLE. Para consultar informacin acerca de la instalacin de
ht://Dig para que pueda buscar la cach de WWWOFFLE lea el fichero
README.htdig.


Servidor Web Icorporado
-----------------------

Cualquier URLs dirigida a WWWOFFLE en el puerto 8080 que se refiera al 
directorio '/local/' son cogidas de los ficheros en el subdirectorio
'html/local'del directorio de almacenaje. Esto permite el manejo de
pginas web sin el uso de un servidor web separado, no se permiten CGIs.
El tipo MIME usado para estos ficheros son los que se especifican en el
fichero de configuracin.

Importante: El servidor web local seguir enlaces simblicos, pero solo 
		permitir el acceso a ficheros que sean de lectura para todo 
		el mundo. Vea el FAQ para aspectos sobre seguridad.


Borrando peticiones
-------------------

Si no se usa una contrasea para las pginas de control entonces culaquier 
persona puede borrar las peticiones que estn guardadas.  Si se ha
asignado una contrasea entonces los usuarios que conozcan esta contrasea
pueden borrar las peticiones (o fichero almacenado o cualquier otra cosa).
los usuarios que no sepan la contrasea pueden borrar las pginas que han 
pedido siempre que lo hagan antes de que aparezca la pgina "Se coger",
El botn "Cancelar" tiene una contrasea que solo funcionar una vez que 
borrar la peticin.


Copias de Seguridad de las pginas
----------------------------------

Cuando se recoge una pgina mientras se est en lnea cualquier error
sobreescribir la pgina existente.  En este caso se crear una copia de 
seguridad de la pgina para que cuando se lea el error mientras se est
fuera de lnea se reemplace por la pgina que haba anteriormente en la
cach. Esto es automtico para todos los casos de ficheros que han tenido un 
error  del servidor remoto (y que no usan proxies externos), no se
necesita intervencin por parte del usuario.


Ficheros Candado
----------------

Cuando un proceso de WWWOFFLE est bajando un fichero, cualquier otro proceso 
WWWOFFLE que intente leer ese mismo fichero no podr hacerlo mientras el
primero no haya acabado. Esto elimina el problema de visualizacin de
pginas incompletas en el segundo navegador o la recogida de una segunda
copia de la pgina que se est recogiendo. Si el fichero candado no es
borrado por el primer proceso en un perodo de tiempo entonces el segundo
proceso producir un error indicando el problema.


Descripcin del Directorio Almacn
----------------------------------

En el directorio almacn hay un directorio para cada uno de los protocolos de 
red que son usados.  En cada directorio hay un directorio para cada
hesped que ha sido contactado y tiene pginas guardadas. Estos
directorios tiene el nombre del husped. En cada uno de estos directorios
hay una entrada por cada una de las pginas almacenadas, generada usando
una funcin de 'hash' para darle una longitud constante.
La entrada consiste en dos ficheros, uno precedido por 'D' que contiene los 
datos y otro precedido por 'U' que contiene la URL.

El directorio saliente es un solo directorio que contiene todas las peticiones
pendientes, en el mismo formato de dos ficheros pero usando 'O' para el fichero
que contiene la peticin en vez de 'D' y otro precedido por 'U' que contiene 
la URL.

El directorio "lasttime" es un solo directorio que contiene una entrada por cada
uno de los ficheros que fueron recogidos la ltima vez que el programa estuvo
en lnea. Cada entrada consiste de dos ficheros uno precedido por 'D' que es un
enlace al fichero real y otro precedido por 'U' que contiene la URL.

El directorio monitor es un solo directorio que contiene todas la peticiones 
regulares que son monitorizadas. El formato es el mismo que el de
peticiones salientes con dos ficheros con los prefijos 'O' y 'U'.

Si hay un enlace simblico apuntando a uno de los directorios, entonces todas
las referencias al enlace sern reemplazadas por referencias al directorio.
(p.e. Si foo.com es un elnace simblico a foo-mirror.co.uk entonces los enlaces
de la pgina web a http://foo.com/camino sern reemplazados por enlaces a 
http://foo-mirror.co.uk/path).
Esto significa que se pueden usar rplicas locales y es posible que sitios con 
mltiples nombres compartan un solo directorio.


Los programas y el fichero de configuracin
-------------------------------------------

Hay tres programas que componen esta utilidad, con tres funciones distintas.

wwwoffle  - Un programa que interactua y controla el demonio proxy HTTP.

wwwoffled - Un proceso demonio que acta como un proxy HTTP.
wwwoffles - Un servedor que hace la recogida de las pginas web.

la funcin de wwwoffles se combina con la de wwwoffled desde la versin 1.1
del programa en adelante.  Esto es asT para simplificar el procedimiento de 
comienzo de servidores y permitir futuras mejoras.

El fichero de configuracin, llamado wwoffle.conf por defecto contiene todos 
los parmetros que se usan para controlar la forma en la que las funciones
de wwwoffled y wwwoffles actuan.


WWWOFFLE - Programa de Control del Usuario
------------------------------------------

El programa de control del usuario (wwwoffle) se usa para controlar la accin
del programa demonio (wwwoffled), o para pedir pginas que no estn en la 
cach.

El programa demonio necesita saber si el sistema est en lnea o no, cuando
se pide que recoge pginas pedidas anteriormente o cuando se necesita purgar 
la cach de pginas viejas.


El primer modo de operacin es para controlar el demonio.  Estas son todas
las funciones que tambin estn disponibles en la pgina interactiva de 
control (excepto kill).

wwwoffle -online        Indicaal demonio que el sistema est en lnea.

wwwoffle -autodial      Indica al demonio que el sistema est en modo 
			automarcado esto usar las pginas almacenadas si
			existen y usar la red como ltima caso, para
			sistemas en llamada bajo demanda.

wwwoffle -offline       Indica al demonio que el sistema est fuera de lnea.

wwwoffle -fetch         Ordena al demonio a recoger las pginas que fueron
                        pedidas por los navegadores mientras el sistemas 
			estuvo fuera de lnea. wwwoffle sale cuando la
			recogida ha sido completada. (Esto requiere
			informar al demonio de que est en lnea).

wwwoffle -config        Causa la relectura del fichero de configuracin.
                        El fichero de configuracin tambin puede ser reledo 
			mandando una seal HUP al proceso wwwoffled.

wwwoffle -purge         Ordena al demonio a purgar la cach de pginas que son 
			ms viejas que el nmero de das indicado en el
			fichero de configuracin, usando la hora de
			modificacin o acceso. O si se ha especificado un
			mximo de tamao entonces borra las pginas ms viejas
			hasta que no se exceda el tamao mximo.

wwwoffle -kill          Causa la salida limpia del demonio.


El segundo modo de operacin es especificar las URLs a coger.

wwwoffle <URL> .. <URL> especifica al demonio las URLs que se deben coger.
                        Si se est en lnea se cogen inmediatamente, si no la 
			peticin se almacena para recogerlas ms tarde.

wwwoffle <fichero> ...  Especifica el fichero HTML a leer y trata todos los 
			enlaces como si se hubieran especificado en la
			lnea de comando.

wwwoffle -F             Fuerza al servidor wwwoffle a recargar la URL.
                        (O cogerla si no est almacenada.)

wwwoffle -g[Sisfo]      Especifica que las URLs cuando se recojan se tienen 
			que inspeccionar en busca de Hojas de Estilo (s),
			imagenes (i), scripts (s), marcos (f) u objectos
			(o) y que tambin se tienen que coger.

wwwoffle -r[<profundidad>]    Especifica que en la URL cuando se recoja, se 
			seguirn los enlaces y que esas pginas tambin se
			recogern (hasta una profundidad especificada por
			el parmetro opcional "profundidad", por defecto
			es 1). Solo se recogern ficheros en el mismo
			servidor.

wwwoffle -R[<profundidad>]    Esto es lo mismo que la opcin '-r' con la 
			excepcin de que se seguirn los enlaces, aunque
			estn en otro servidor.

wwwoffle -d[<profundidad>]    Esto es lo mismo que la opcin '-r' excepto que 
			los enlaces solo se seguirn si estn en el mismo
			directorio o subdirectorio.

El tercer modo de operacin es coger la URL de la cach.

wwwoffle <URL>          Especifica la URL a coger.

wwwoffle -o             Coge la URL y saca su contenido por la salida estndar
                        (O la pide si no est almacenada.)

wwwoffle -O             Coge la URL y saca su contenido por la salida estndar
			incluyendo las cabecera HTTP.
                        (O la pide si no est almacenada.)


El ltimo modo de operacin es la ayuda acerca de los otros modos.

wwwoffle -h             Da ayuda acerca de las opciones de la lnea de comandos.


Con cualquiera de los tres primeros modos de operacin el servidor WWWOFFLE
puede ser especificado de tres formas diferentes.

wwwoffle -c <fichero-configuracin>
                        Puede se usado para especificar el fichero de 
			configuracin que contiene los nmeros de puertos,
			el nombre del servidor (La primera entrada en la
			seccin LocalHost) y la contrasea (si se requiere
			para el primer modo de operacin). Si hay
			constrasea esta es la nica forma de especificarla.

wwwoffle -p <husped>[:<puerto>]
                        Puede usarse para especificar el husped y el puerto en
			el cual	el programa demonio escuchar para controlar
			los mensajes (primer modo) o las conexiones proxy 
			(segundo y tercer modos).

WWWOFFLE_PROXY          Una variable de entorno que se puede usar para 
			especificar por igual el argumento de la opcin -c
			(debe ser el camino completo) o el argumento de la
			opcin -p.  (En este caso se pueden especificar
			los dos puertos), el primero para la conexin
			proxy y el segundo para el control de la conexin 
			p.e. 'localhost:8080:8081' o 'localhost:8080'.)


WWWOFFLED - Programa Demonio
----------------------------

El programa demonio (wwwoffled) se ejecuta como un proxy HTTP y tambin acepta
conexiones del programa de control (wwwoffle).

El programa demonio necesita conocer el estado actual del sistema, En lnea o
Fuera de Lnea, as como otros parmetros del fichero de configuracin.

Cada vez que se realiza una conexin al proxy HTTP, el programa crea una copia 
de si mismo (la funcin wwwoffles) para atender la peticin. El programa
servidor tambin puede bifurcarse en respuesta a la peticin por parte del 
programa wwwoffle de pginas para ser recogidas.


wwwoffled -c <fichero-configuracin> Comienza el demonio con el nombre del fichero
				de configuracin.

wwwoffled -d [nivel]            Comienza el demonio en modo de depurado.
				p.e. no se desengancha del terminal y usa la
				salida de error estndar para mostrar los 
				mensajes. El nivel numrico opcional 
				(0 para	ninguno y 5 para todo)
				especifica el nivel de mensajes de error que se 
				mostrarn. Si no se especifica ninguno se usar
				la variable log-level del fichero de 
				configuracin.

wwwoffled -p                    Imprime el pid(nmero de idetificacin de 
				proceso) del demonio en la salida estndar 
				antes de descolgarse del terminal.

wwwoffled -h                    Da ayuda acerca de las opciones de la lnea 
				de comandos.


Hay un nmero de errores y mensajes de informacin que genera el programa
mientras se ejecuta. Por defecto (en el fichero de configuracin) estos van
al log del sistema. Usando la opcin -d del demonio no se desengancha del 
terminal y los errores va tambin a la salida de error estndar.

Usando las opciones "run-uid" y "run-gid" en el fichero de configuracin,
es posible cambiar la identificacin de usuario con la que se ejecuta el 
sistema Esto requerir que el programa sea comenzado por root y que el
usuario especificado tenga acceso al directorio almacn.


WWWOFFLES - Programa Servidor
-----------------------------

El servidor (wwwoffles) comienza siendo bifurcado del demonio (wwwoffled) 
en uno de tres modos diferentes.

Real  - Cuando el sistema est en lnea y acta como servidor proxy para el 
	navegador. Todas las peticiones de pginas web son atendidas
	creando un nuevo servidor que conectar con el husped remoto y
	que recoger la pgina. Esta pgina es almacenada en la cach y 
	devuelta al navegador. Si la pginas ya est en la cach entonces
	se pregunta al servidor remoto si existe una nueva versin  de la
	pgina, sino se usa la versin de la cach.

SpoolOrReal - Cuando el sistema est en modo de automarcado y no hemos decidido
	si iremos a modo Real o Spool.  Se selecciona modo Spool si la pgina 
	ya est guardada y modo Real como ltimo recurso.

Fetch - Cuando el sistema est en lnea y recogiendo pgina que ha sido pedidas.
        Todas la peticiones de pginas web que estn en el directorio saliente
	son recogidas por el servidor conectando con el husped remoto para 
	coger la pgina. Esta pgina se guarda en tonces en la cach si no
	hay ningn navegador activo. Si la pgina ha sido movida
	entonces se sigue el enlace y es este el que se recoge.

Spool - Cuando el sistema est fuera de lnea y se est actuando como proxy para
	un navegador. Todas las peticiones de pginas web son atendidas 
	creando un servidor que o devolver una pgina almacenada en la
	cach o almacenar la peticin. Si la pgina est almacenada, ser
	devuelta al navegador, si no se devuelve una pgina simple (y se
	almacena el la cach), y se almacena la peticin saliente. Si la
	pgina almacenada se refiere a una pgina que fall al ser 
	recogida se borra de la cach.

Dependiendo de la existencia de ficheros en la cach y otras condiciones,
el modo puede cambiar a varios ms.

RealNoCache - Para peticiones de pginas en la mquina servidor o para las que
	han sido especificadas en el fichero de configuracin para no ser 
	guardadas. 

RealRefresh - Usado por el botn de recarga en el ndice del programa wwwoffle
        para volver a recoger una pgina mientras el sistema est en lnea.

RealPassword - Usado cuando se provee una contrasea y se necesitan dos copias 
	de la misma pgina, una con contrasea y la otra sin ella.

SpoolGet - Usado cuando la pgina no existe en la cach por lo que se debe 
	guardar una peticin en el directorio saliente.

SpoolWillGet - Usado cuando la pgina no est en la cach pero ya existe
		una peticin en el directorio saliente.

SpoolRefresh - Usado cuando se pulsa el botn de recarga en la pgina
		del ndice. La pgina guardada (si existe) no es borrada pero se
		almacena una peticin.

SpoolPragma - Usado cuando el navegador pide a la cach que recarge la pgina
		usando la cabecera 'Pragma: no-cache', La pgina guardada
		no es modificada (Si existe una), pero se almacena la peticin.

SpoolInternal - Usado cuando el programa est generando una pgina web 
		internamente o est almacenando una pgina web sin 
		modificaciones. Esto crea un fichero tempoal y puede poner
		la cabecera Content-Length correcta, midiendo el tamao.

WWWOFFLE-TOOLS - Programa de Mantenimiento de la Cach
------------------------------------------------------

Esto es un parche rpido que escrib para permitirle lista el contenido
de la cach o mover los ficheros de esta.

Todos los programa deben ser llamados desde el directorio almacn.

wwwoffle-rm     - Borra la URL que se especifica en la lnea de comandos.
                  Para borrar todas las URLs de un husped es ms fcil usar
                  'rm -r http/foo' que usar esto.

wwwoffle-mv     - Para renombrar el directorio de un husped a otro nombre.
                  Dado que la URL est codificada en el fichero solo renombrando
		  el directorio no funcionar. En vez de hacer 
		  'mv http/foo http/bar' use 'wwwoffle-mv http/foo http/bar'.

wwwoffle-ls     - Para lista los ficheros en el directorio al estilo de 'ls -l'.
                  Por ejemplo use 'wwwoffle-ls http/foo' para listar las URLs
		  almacenadas en el directorio http/foo.

wwwoffle-read   - Lee datos directamente de la cach para la URL nombrada
		  en la lnea de comandos. Saca la salida por stdout.

wwwoffle-write  - Escibe datos directamente a la cach para la URL
		  nombrada en la lnea de comandos desde stdin.  Note que
		  requiere la introduccin de una cabecera HTTP o los 
		  navegadores pueden confundirse. (echo "HTTP/1.0 200 OK"; echo "" ;
		  cat bar.html ) | \wwwoffle-write http://www.foo.com/bar.html

Estos son bsicamente parches y no pueden considerarse como caractersticas plenamente
funcionales y testeadas completamente.


audit-usage.pl - script Perl para chequear ficheros de log
----------------------------------------------------------

El script audit-usage.pl puede ser usado para coger informacin de la salida 
del programa wwwoffled.

Si wwwoffled es ejecutado como

wwwoffled -c /var/spool/wwwoffle/wwwoffle.conf -d 4

Entonces en la salida de error estndar se generar informacin mientras se 
ejecuta el programa. El nivel de depuracin necesita ser de 4 para que se
muestre informacin de las URL.

Si esta es capturada en un fichero de log entonces puede ser analizada mediante
el programa audit-usage.pl.  Este programa dir el husped desde el que se ha 
hecho la conexin y la URL que se ha pedido.
Tambin incluye informacin del tiempo de conexin y las conexiones realizadas
a WWWOFFLE.


Programa de Testeo
------------------

En el directorio 'testprogs' hay dos programas de testeo que se pueden compilar
si lo requiere.  WWWOFFLE no los necesita para funcionar, pero si est 
personalizando las pginas de informacin de WWWOFFLE o intentando depurar
el parser HTML entonces le sern tiles.

Estos son an ms apaos que los programas wwwoffle-tools, uselos por su 
cuenta y riesgo.


Autor y Copyright
-----------------

Los dos programas wwwoffle y wwwoffled fueron escritos por Andrew M. Bishop en
1996,97,98 y son copyright Andrew M. Bishop 1996,97,98.

Los programas update-cache, endian-cache y los comandos conocidos como 
wwwoffle-tools fueron escritos por Andrew M. Bishop in 1997,98 y son
copyright Andrew M. Bishop 1997,98.

Los scripts Perl update-config.pl y audit-usage.pl fueron escritos por Andrew
M. Bishop en 1998 y son copyright Andrew M. Bishop 1998.

Pueden ser distribuidos libremente de acuerdo con los trminos de la licencia
GNU General Public License (vea el fichero `COPYING').

Si quiere reportar algn fallo o comentarios acerca de los programas escriba
al autor amb@gedanken.demon.co.uk y ponga WWWOFFLE en la lnea del asunto.


Ht://Dig
- - - -

El paquete htdig es copyright de Andrew Scherpbier <andrew@contigo.com>. Los 
iconos en el directorio html/htdig vienen de htdig como lo hacen los
ficheros html/htdig/search.html  y html/htdig/conf/htsearch.conf con 
modificaciones mias.


Con Contribuciones de Cdigo de
- - - - - - - - - - - - - - - -

Yannick Versley <sa6z225@public.uni-hamburg.de>
        Cdigo de syslog inicial (mucho reescrito antes de incluirlo).

Axel Rasmus Wienberg <2wienbe@informatik.uni-hamburg.de>
        Cdigo para ejecutar wwwoffled en un uid/gid especfico.

Andreas Dietrich <quasi@baccus.franken.de>
        Cdigo para desenganchar el programa del terminal como un demonio *real*.

Ullrich von Bassewitz <uz@wuschel.ibb.schwaben.com>
        Mejor manejo de las seales.
        Optimizaciones de manejo de ficheros en el directorio salidas.
        Las opciones log-level, max-servers y max-fetch-servers del archivo 
	de configuracin.

Tilman Bohn <tb@bohn.isdn.uni-heidelberg.de>
        Modo de Autollamada.

Walter Pfannenmueller <pfn@online.de>
        Tratamiento de Documentos Java/VRML/XML y algn HTML.

Otras Contribuciones tiles de
- - - - - - - - - - - - - - - -

Demasiada gente que mencionar - (todo el que me ha escrito e-mails).
        Sugerencias y reporte de fallos.


