Copiar un sitio web para leerlo fuera de línea

Se te puede ofrecer tener  una copia de un sitio web para poder revisarlo cuando no estás conectado a internet.  Puede ser un manual que quieres conservar en tu celular o tableta o un libro que quieres leer en el camión o durante un viaje.

Anteriormente les había recomendado una instrucción con wget que funciona, pero a veces quieres automatizar un poco más la tarea.

HTTrack al rescate

HTTrack es una herramienta sencilla que tiene mucho tiempo en el mundo linuxero. Disponible para Windows, Linux, Apple y Android ¡No se puede pedir más!.

Existe como una orden de la terminal pero muchos prefieren (incluyendome) usar su interfaz gráfica.

La distribución de Linux que utilizo es  Manjaro y usé Octopi para buscar los paquetes necesarios tanto en los repositorios normales como en AUR.

Buscando los programas de httrack con Octopi.
Buscando los programas de httrack con Octopi.

Claro que si quieren usar la terminal para instala los paquetes entonces sería algo más o menos así:

sudo pacman -S httrack
yaourt -S httraqt
 

El asistente

Usando la interfaz gráfica todo se simplifica, pero tengan cuidado, porque pueden terminar descargando más de lo que estaban buscando.

Si siguen las opciones por default tendrán un buen resultados.

El asistente básicamente sirve para responder algunas interrogantes:

  • El Nombre del proyecto.
  • La carpeta en dónde se van a almacenar los archivos.
  • Los URL que se quieren descargar.

El resto es dejar que el programa haga su chamba.

httrack copiando un sitio
Descargando que es gerundio.

Lo que sigue es explorar la carpeta donde se descargaron los archivos, abrir el archivo index.html y listo !!!

archivos descargados por httrack
Archivos descargados por httrack

El proyecto se queda guardando así que es posible pausar las descargas, programar que el equipo se apague cuando termine o simplemente volverlo a ejecutar para actualizar los archivos.

Supongo que puede ser útil para llevar sitios a comunidades que no tienen una buena conexión a internet, en fin, usen esta consejo sabiamente 🙂 .

9 thoughts on “Copiar un sitio web para leerlo fuera de línea

  1. Bueno mas que copiarlo, lo que estas haciendo es descargarlo a tu equipo para no tener que estar en linea cuando quieras leerlo. También es útil cuando nos enteramos que un blog va a cerrar y no tenemos tiempo de leer lo que ha escrito.

  2. Descargarlo en tu equipo, hacer una copia, es más o menos lo mismo. Y casualmente, la última vez que lo utilicé fue precisamente para eso, para respaldar un blog que iba a cerrar 🙂

    Saludos Jvare !!!

  3. Es increíble como algunas personas que dicen defender el software libre y utilizan licencias CC, como el orango calvo; luego se quejan y difaman a otras comunidades aduciendo que les copian sus contenidos, mismos que ellos autorizan a copiar como se desprende de las mencionadas licencias CC que utilizan en sus blogs.

    A saber: Licencia Creative Commons:

    Usted es libre de:

    Compartir — copiar y redistribuir el material en cualquier medio o formato Adaptar — remezclar, transformar y crear a partir del material.

    El licenciador no puede revocar estas libertades mientras cumpla con los términos de la licencia.

    Bajo las condiciones siguientes:

    Reconocimiento — Debe reconocer adecuadamente la autoría, proporcionar un enlace a la licencia e indicar si se han realizado cambios<. Puede hacerlo de cualquier manera razonable, pero no de una manera que sugiera que tiene el apoyo del licenciador o lo recibe por el uso que hace.

    NoComercial — No puede utilizar el material para una finalidad comercial.

    CompartirIgual — Si remezcla, transforma o crea a partir del material, deberá difundir sus contribuciones bajo la misma licencia que el original.

    No hay restricciones adicionales — No puede aplicar términos legales o medidas tecnológicas que legalmente restrinjan realizar aquello que la licencia permite.

    Muchos blogs que se dicen defensores de estas licencias, del software libre, GNU/Linux, etc… y que las utilizan, son los que se quejan de que les “Roben” o “Plagien” sus contenidos. Algunos de estos artículos son interesantes, otros meras reproducciones de procedimientos de manual.

    Nadie puede adjudicarse la explicación del comando apt o pacman, etc.

    Como estos hay miles de artículos en la web que son iguales.

    Copiar citando la fuente no es robar ni plagiar.

    Saludos cordiales.

  4. No hace falta aclarar quién es, pronto aparecerá y se victimizará en un mar de lágrimas como es su costumbre para levantar las visitas de su blog.. El resto creo que es bien claro, y lo más importante del asunto.

    Si bien mi primer comentario comenzó como una humorada no deja de tener asidero.

    Como todos saben, cada vez que accedemos al contenido de un sitio, éste se descarga en nuestro sistema, total o parcialmente, solo con verlo y muchas veces permanece en el mucho tiempo.

    Alguien mal intencionado podría decir que descargar un artículo es robarlo o plagiarlo, un disparate, claro, para gente normal.

    Obviamente, Linuxman tu intención en este artículo es buena y mis comentarios no van dirigidos hacia ti o tu sitio.

    Saludos cordiales.

¡Me encantaría saber que opinas!

%d bloggers like this: