Cómo digitalizar un libro de forma casera

Desde la llegada del libro digital me resulta mucho mas cómodo leer en tinta electrónica que en papel. El eReader me aporta los beneficios de lo digital, pero salvar sus inconvenientes (el desgaste visual de las pantallas, y las constantes interrupciones y distracciones de los moviles o tablets). Pese a eso, no digitalizo todos mis libros a digital. No creo que valga la pena. Pero hay algunos libros que están descatalogados y que no se encuentran en ninguna librería, esos son los libros que me vale la pena digitalizar.
Hace ya bastantes meses que decidí desprenderme de mi impresora escaner. Un día fui a imprimir algo y me encontré que la tinta estaba seca. Al precio que van los toners podéis imaginar la alegría que me dio. Saqué la conclusión de que no valía la pena mantener la impresora. Ahora cuando quiero imprimir voy a la copisteria y cuando quiero escanear lo hago con mi smartphone.
Hace unos días estuve escaneando un libro. Me llevó unas tres horas llevarlo del papel al formato epub. Creo que he encontrado un método bastante ágil y por eso os lo comparto.
Escaneado
Para escanear ha sido clave disponer de tres cosas: una lámina de cristal, un smartphone y la aplicación CamScanner.
1. El primer paso es tomar fotografías de todas las páginas del libro. Para eso es imprescindible la lámina de cristal, ya que si intentas tomar una fotografía de un libro abierto te darás cuenta que la curvatura que hace el libro te dará muchos problemas para que un software ocr reconozca el texto. Al poner la lámina de cristal conseguimos aplanar las páginas.
La forma más efectiva es tomar las fotografías de manera que cojas dos páginas. Así vas tomando las fotos cada dos hasta tener todo el libro fotografiado.
2. Llega el turno de usar CamScanner. Coges cada fotografía y la vas incluyendo en un documento, haciendo el recorte que tan bien hace la aplicación.
Para orientarte con la página que toca poner yo uso dos trucos. El primero es fijarme es contar la página del capítulo. Por ejemplo, empiezo a digitalizar y llego al tercer capítulo del libro. Visualmente es sencillo ver por medio de las minuaturas donde empieza un capítulo, por lo que voy contando por la página que voy de ese capítulo. Después también una vez editado el escaneo de la página, entro a la visualización de la página y miro la anterior para ver que la numeración sea la que le corresponde.
Una vez tenemos todo el libro pasado a CamScanner, llega el turno de exportarlo. Pero antes debemos hacer unos ajustes que serán determinantes. En el menú de CamScanner debemos ir a “ajustes de pdf”. Allí debemos editar la orientación a horizontal (en el caso de que hayáis seguido mi recomendación de hacer el escaneo a doble página). Después también elegiremos el tamaño, que debe ser DinA4.
Una vez hecho esto ya podemos exportar el documento en pdf. Yo lo que hago es enviarlo a algún servicio en la nube para así llevarlo al mac.
Reconocimiento de texto y edición
3. Ahora nos toca hacer el reconocimiento OCR. Para ello uso FineReader. ¡Qué gran software! Abrimos el documento pdf con FineReader y nos hará el reconocimiento del documento y los carácteres. Estará un rato trabajando. Es momento de retirarse a hacer otras cosas y dejar que el mac trabaje solo.
Una vez finaliza el proceso, nos saldrán algunas advertencias de algunas páginas con insuficiente resolución. Suelen ser páginas en blanco o partes que el software no entiende con claridad. No os preocupéis. Siempre sale algún aviso de estos.
Vereis que en la parte superior tenemos la opción de “exportar”. Está la opción de exportarlo a Word, pero en ese caso cada línea del texto nos saldrá con un salto de línea y no todo el texto unido. Por lo que es mejor opción exportar a epub.
4. El epub que se ha generado veréis que está bastante bien. Y quizás para muchos ya sea suficiente. Pero si queréis que un libro perfectamente maquetado es mejor convertir el epub a rtf con Calibre. De esta manera podremos editar el texto con Word o Pages eliminando los pie de página y la numeración que se habrá colado entre los párrafos, así como algunos errores que habrá tenido FineReader al reconocer algunos carácteres. Por lo que debemos meter el epub en Calibre y convertirlo a rft.
5. Ahora nos queda la parte más entretenida, y la que más tiempo nos va a llevar. Abrimos el documento rtf con word o pages y manos a la obra. ¡A perfeccionar el texto para dejarlo impecable! Una vez hecho esto lo guardamos como docx.
6. El último paso será abrir el documento con Pages. Algo importante a hacer es la creación del menú para el libro. Para hacerlo simplemente tenemos que marcar el titulo de cada capítulo y ponerlo como formato de texto “título”. De esta forma al exportarlo identificará todo aquello que esté en formato título como un nuevo capítulo, y por tanto dispondremos de un menú en el ebook.
Exportamos a epub con Pages y listo, ¡¡Ya tenemos el libro en formato digital!!
Una vez hecho todo el proceso podremos añadirlo a Calibre para editar los metadatos. Ponerle la imagen de la portada, ponerle el título y autor, así como todos aquellos datos que queramos que el ebook disponga.
Imagen de Luis Perez bajo licencia Creative Commons