martes, 10 de marzo de 2015

Diversas formas de capturar una página web

Navegando, es posible que te apetezca capturar la página web que estas leyendo, para luego visionarla con calma, o para guardarla, o para difundirla. Pero lo normal es que la página web que visitas no te quepa entera en la pantalla, y tengas que desplazarte (hacer 'scroll') para poder leerla entera. Y si la quieres capturar como imagen, es un poco complicado.
En Iceweasel hay algún Complemento que te lo facilita, como el 'ScreenGrab (fix version)', y el 'Awesome Screenshot Plus'. En este, incluso, puedes subrayar, resaltar, etc. los puntos que te interese, antes de guardar la imagen.
Pero lo 'guapo', y presumiblemente más cómodo, es capturar la web directamente en formato PDF. Y hay muchas formas de hacerlo.
Vamos a ver unas cuantas:
a) Podría hacerse, sin más historias, partiendo de la imagen capturada, con el comando 'convert imagen.jpg imagen.pdf' pero tiene el inconveniente de que te saca un PDF de una sola página (en continuo), y si es larga (mucho scroll) queda feo.

b) Hay páginas web que, directamente, les metes la web y te la convierten, pudiendo descargarte el PDF. Y, en particular, hay un Complemento en Iceweasel, que se llama, precisamente, 'Web2PDF Converter' que te lo automatiza, con una de esas webs.
Instalado ese Complemento (extensión), solo es cuestión de pinchar en su icono para que te facilite el proceso de la conversión 'online'

c) Otra forma, muy simple, es, sencillamente, mandando a imprimir esa web, desde el propio navegador, con Archivo-Imprimir... 'como archivo PDF'... y ya tienes tu PDF 'página a página').
Yo, para instalar la impresora, siempre lo hago con cups, e instalo
sudo aptitude install cups cups-pdf ghostscript gsfonts
y me resulta muy fácil hacerlo así, y te queda un archivo PDF, dividido en páginas, perfecto.
Hay que tener en cuenta de que, de esta forma, primero, tienes que acordarte de volver a poner, como opción por defecto, que te imprima 'la impresora', y segundo, que se mantiene el nombre del último archivo, y tendrás que cambiarlo, para no 'machacar' la anterior captura. Pero la ventaja de que puedes personalizar la cuestión de cabeceras, pies de página, paginación, etc..

d) Y otro sistema es mediante el comando wkhtml2pdf
WKHTLM2PDF es un paquete que eatá en los repositorios de Debian (y que quizás haya que instalar, con sudo aptitude, etc) que permite convertir a PDF la página web que le indiques. Basta abrir consola y escribir
wkhtmltopdf [dirección web] [nombrearchivo.pdf]
por ejemplo
wkhtmltopdf http://www.espaciolinux.com/foros/ ejemplo.pdf
(Ojo, se guarda en la ruta donde se ha abierto la consola, lo que quiere decir que quizás lo más cómodo es abrirla, primero, en la ruta donde nos interese guardar el PDF)
Pero existe un 'frontend' de este paquete, el HTMLtoPDF Converter, que lo hace aún más cómodo, porque lo de acordarse del nombre del comando...
Se puede descargar de aquí: https://code.google.com/p/foxoman/wiki/HTMLtoPDF
Aunque conviene matizar algo: Y es que, OJO, el archivo 'html2pdf_1.0-1_all.deb' que se descarga no hay manera de instalarlo, al menos en mi Debian Jessie, con el clásico instalador GDebi.
Menos mal que me explicaron una forma muy sencilla de poderlo instalar...  
Y consiste, simplemente, en, abriendo una consola (de usuario) en la ruta donde tengamos descargado ese archivo *.deb, ir introduciendo estas órdenes:
ar x html2pdf_1.0-1_all.deb
tar xvf data.tar.gz
sudo cp -rp usr/* /usr

(la explicación es sencilla, en realidad no necesita instalarse, y lo que hacen estas órdenes es extraer el contenido del *.deb y copiar los paquetes necesarios (que están en una carpeta /usr del *.deb) al directorio /usr de nuestro sistema.
Y ya está).

Hombre, yo he hecho algo más: Editando (con Configurar-Open the Menu Editor) el Menu de mi Cinnamon (vamos, el 'alacarte' del Cinnamon)...
1- Doy a lo de 'New Item' en el grupo que me apetezca (por ejemplo, yo lo he puesto en el grupo 'Internet'),
2- Añado lo típico: Name ('Convertir página web en PDF'), Command ('html2pdf'), Comment... y le pongo un icono guapo.
bueno, esto...
Y el resultado es que puedes disponer de una herramienta (gráfica) muy cómoda para convertir una pagina web en PDF

2 comentarios:

  1. también puedes indicarle el camino:
    wkhtmltopdf http://www.espaciolinux.com/foros/ /camino/al/lugar/donde/guardar/el/archivo/ejemplo.pdf

    ResponderEliminar
  2. en 'efeto', y te agradezco el matiz.
    (Pero a mi siempre me ha resultado más cómodo, en mi Cinnamon/Nemo, la opción de ponerte donde quieras guardarlo y con botón derecho ratón... 'Abrir en un terminal', que te lo abre ya en la ruta. Claro que yo estas cosas las hago de tarde en tarde, por supuesto que en un uso intensivo de la consola 'en producción', lo ortodoxo es eso que dices).

    ResponderEliminar