Descargar libros de texto gratuitos o cualquier libro similar.

libros

Me dio gusto ver que los libros de texto gratuitos están disponibles para su consulta en internet. En un principio creí que se podían descargar en formato PDF pero no existe esta opción.

Y luego me dije a mi mismo … Mi mismo ¿Y si descargas las páginas del libro y generas un PDF a partir de esas imágenes?

Así que puse manos a la obra y elaboré un programita en bash para descargar los libros de texto gratuitos o cualquier libro que se presente en un formato similar.

A descargar las imágenes del libro.

Lo primero es abrir un libro.

En este enlace están disponibles los libros de primaria:

Y en este otro los de secundaria:

De esta forma encontramos la carpeta en la que están almacenadas las imágenes del libro.

Para ejemplo práctico elegí el Libro de matemáticas de primer año. Si inspeccionamos la página del libro verán que las imágenes están almacenadas en la misma carpeta y las imágenes tienen como nombre un número de 3 dígitos de este modo.

https://libros.conaliteg.gob.mx/20/c/P1MAA/000.jpg

Así que es relativamente fácil hacer un script en Bash para que haga un barrido y con wget descargar una por una las páginas del libro.

#!/bin/bash

# Descargar libro de texto
for i in {000..300}
do
  wget https://libros.conaliteg.gob.mx/20/c/P1MAA/$i.jpg
done

En realidad no se la cantidad de hojas disponibles, así que elegí un número alto. Cuando el script empiece a informar errores en las descargas sabré que ya no hay más hojas disponibles.

https://linuxmanr4.com/wp-content/uploads/2020/09/descarga_del_libro_wget.mp4
Descargando ando …

Ahora a encuadernar las hojas sueltas con un PDF

El archivo PDF nos va a servir para guardar todas las imágenes en un solo archivo. Esto no es algo nuevo para mí, ya había hecho algo similar en Convertir todas las imágenes de un directorio a PDF.

gm convert *.jpg -adjoin -compress JPEG libro.pdf

Si agregamos esta instrucción al final del script en bash, todo se hace en una sola ejecución. Para este ejemplo, el archivo resultante quedó en 49.7 MB ¡Excelente!

Este es el resultado, un pdf que contiene todas las imágenes del libro.

Enseñándole a leer al PDF.

Todo estaría bien hasta este punto, si no fuera por un comentario en Twitter de Jorge Vázquez en el que menciona que el hace algo parecido con otras herramientas y además le aplica Reconocimiento óptico de caracteres (OCR).

Y no me quise quedar atrás. El OCR le agrega una capa de texto al PDF que facilita las búsquedas. Ahora necesitaba un programa que literalmente leyera todas las hojas del libro que acabo de crear y agregara esa información al archivo PDF.

Me encontré con un programa con el nombre más simpático que puede uno encontrar: ocrmypdf y hace exactamente lo que estaba buscando. Así que después de hacer esto:

ocrmypdf -l spa libro.pdf libro-con-ocr.pdf
Realizar búsquedas, copiar texto ¡No problema!

Ya tenía un PDF al que le podía hacer búsquedas o seleccionar y copiar textos, claro con algunas imprecisiones ya que el OCR no es perfecto.

Conclusiones.

El mismo procedimiento se puede aplicar a todos los libros de texto (o eso espero) o a cualquier libro con una presentación similar.

Espero que esta información para descargar libros de texto gratuitos les sea de utilidad, se que es algo técnico pero a lo mejor sirve de inspiración para algo más elaborado.

¡Bendita nueva normalidad!

La Liga Extraordinaria de la lectura

Hace unos días terminé de leer Drácula de Bram Stoker y me quedé con una especie de vacío. Similar a cuando terminas de ver una serie y sabes que no verás más episodios y haces una pequeña pausa reflexiva.

Fueron más de 500 páginas que me tomaron algunos meses de lectura. No me juzguen por mi lentitud y es que leo a ratitos. Cuando voy en el camión, antes de ir a dormir, en las salas de espera, son los momentos que tengo disponibles para leer.

Luego tuve una epifanía, me di cuenta de que ya había leído varios libros relacionados con la película protagonizada por Sean Connery  , La liga extraordinaria de caballeros.

Los personajes principales de la Liga Extraordinaria de Caballeros

La película es una de mis favoritas (si no la han visto se las recomiendo ampliamente). Un excelente punto a su favor es que todos los personajes principales aparecen en obras magistrales de la literatura, así que el desarrollo de los personajes ya esta hecho, solo faltaba reunirlos y eso se logra magistralmente en la película.

Si ustedes me lo permiten, voy a hacer un recuento de los personajes y de los libros en que aparecen.

Mina Harker

Como les comentaba, acabo de leer Drácula y en este libro aparece el personaje de Mina Harker, la bella, inteligente, abnegada y dichado de virtudes (tantos que cae gorda) del joven abogado Jonathan Harker.

Nada que ver con el libro, nada que ver en la Liga Extraordinaria, vamos ni siquiera con aquella película de Drácula que hizo en 1992 Francis Ford Coppola. Este libro es tan popular y se han hecho tantas variantes que el original que ya no parece el mismo. En este caso se han tomado tantas libertades literarias con esta pobre mujer atormentada por una maldición ¿o no fue así?. 🙂

El capitán Nemo

Hablar de Julio Verne es sinónimo de literatura de ciencia ficción. El libro 20 mil leguas de viaje submarino se toma todo el tiempo del mundo para narrar las arriesgadas aventuras del capitán Nemo en su fabulosa nave submarina El Nautilus.

Obra maestra que disfruté con cada página.  Una de las cosas que llama la atención en la obra de Julio Verne son sus predicciones tecnológicas, uno entiende que el libro fue escrito hace muchos tiempo, pero al leerlo parece como si explicara tecnología de hace apenas algunos años y eso ya es fascinante.

Rodney Skinner

Rodney pertenece a El hombre invisible de H.G. Wells y fue uno de los primeros libros electrónicos que leí.

Un científico dedicado a un propósito, hacerse invisible y lo logra. Uno puede suponer que la invisibilidad sería una ventaja enorme, pero más tarde te das cuenta de que para serlo tienes que estar desnudo y que a los perros poco les puede importar no verte si te pueden oler.

Allan Quatermain

A pesar de que este es el personaje principal de la película y líder de la Liga Extraordinaria tengo que confesar que (hasta hace poco) no tenía idea de quién era este personaje. Así que empecé a leer Las minas del Rey Salomón de Henry Rider Haggard.

Y me esta gustando el librito, es sencillo, breve,  sin muchos adornos o rebuscamientos. Allan es un cazador y me dio cierto malestar leer un pasaje en el que narran una cacería de elefantes.

Es lógico que cuando apareció el libro la aventura apuntara al enigmático continente africano. En aquellos días no era mal visto el comercio del marfil y matar elefantes era una tarea altamente riesgosa. Aún así no pude evitar sentir lástima por la masacre a estos animales y con ello  quitarle un poco de “brillo” al protagonista.

Los que faltan

Claro que al terminar de leer Las minas del Rey Salomón tengo que continuar con los demás personajes de La Liga. Creo que seguiré con el Dr. Jekyll y es que su personaje del libro El extraño caso del Doctor Jekyll y Mr. Hyde es muy popular en el cine, en la televisión y hasta en las caricaturas.

¿Se acuerdan de esto?

Probablemente siga con Las aventuras de Tom Sawyer del maestrazo bigotón Mark Twain. Es un autor del que he escuchado hablar desde que era niño, pero no he tenido la oportunidad de leer su obra. Mi referencia más cercana es aquella película que hizo Juliancito Bravo y no creo que le haga justicia.

Por último El retrato de Dorian Gray de Óscar Wilde. ¿Porqué al final? bueno creo que el desenlace de esta historia ya ha sido spoileado hasta el cansancio, pero me gustaría saber algo más del personaje y su entorno.

¿Qué les parece esta guía de lectura? me faltan algunos personajes, pero dejaré que ustedes descubran cuales son.

Actualizaciones

¡Ohhhh vamos!, no es tan difícil …

Tomado de la novela El Marciano de Andy Weir.