Ver la Versión Completa : Digitalización libro con imágenes en lrf
davidlan
05/10/2008, 11:31
Hola buenas, me estoy dedicando a digitalizar mi primer libro y estoy sorprendido de lo relativamente fácil que es. A pesar de que evidentemente se trata de un trabajo algo tedioso cunde más de lo que imaginaba. El OCR reconoce muy bien el texto, y aunque hay que depurar algunas cosillas, no me quejo del resultado. Pienso que el libro se puede leer perfectamente y que las pocas cosas que no están correctas se pueden intuir por el contexto. Como soy un poco vaguete y chapucero, reconozco que me voy a conformar con el texto tal y como sale del escaneado, a mi me vale por lo menos, para el que tenga el morro más fino le dejo el trabajo de arreglarlo un poco.
Lo que si me ha dado guerra, y me ha fastidiado que en un primer momento no lo pudiera conseguir, es que en concreto en el libro que estoy escaneando al principio de cada capitulo viene un mapa que te esta muy bien para seguir el libro. Lo malo es que cuando el texto lo pasaba a World y de aquí a lrf esos mapas desaparecían porque se ve que el programa los interpreta como imágenes.
Bueno al final he conseguido dar con una solución aunque reconozco que es un poco complicada y os querría preguntar si conocéis alguna mejor.
Consiste en lo siguiente; después de digitalizar y reconocer el texto lo paso a PDF, esto hace que se conserven las imágenes y el formato más similar posible al texto original. El problema como sabéis es que los lectores no se llevan muy bien con este formato, así que antes de pasarlo a lrf hay que hacer un paso intermedio que consiste en pasarlo a World con el Solid Converter PDF y a continuación con el book designer a lrf.
De esta forma se conservan las imágenes y el formato es lo más similar posible al libro original.
El inconveniente es la cantidad de transformaciones de formato que hay que realizar.
A ver si alguien sabe un método mejor.
Un saludo.
Hola Davidlan, yo te recomendaria que lo dejases en formato PDF... En esta misma web, en la sección de Tutoriales, hay un Video-Tutorial que hizo el compañero, Kiernel, para Mac. El hecho de ser para Mac, da igual, adaptas los programas, tendras que utilizar el Word o Open Office y el Acrobat o el Nitro Pdf.
Se me ha olvidado ponerte el enlace, aqui esta:
http://www.lectoreselectronicos.com/index.php?module=htmlpages&func=display&pid=43
Saludos.
davidlan
05/10/2008, 12:41
Gracias hernad por tu contestación tan rápida, pero el caso es que quizás sea un poco maniático y cabezota pero en la medida de lo posible pretendo tenerlo todo en lrf. El tutorial está muy bien pero lo que yo quiero saber es porque cuando paso el texto del ABBYY FineReader a Word y de Word a lrf por el camino se quedan las imágenes.
Yo creo que es que el LRF, no admite imagenes, pero ahora mismo no estoy muy seguro.
El LRF sí que admite imágenes. De hecho incluso hay cómics en LRF :P
Si no son muchas, las puedes poner "a mano".
Guardas las imágenes en archivos independientes .jpg y en el book designer pulsas F5 y te sale una ventana para que elijas la imagen que quieras poner.
No sé si lo que tú quieres es aprender el método más cómodo para el futuro o lo único que te interesa es ese documento en concreto. Si es el último caso y no te apañas, pásame lo que tengas digitalizado y te echo una mano.
davidlan
05/10/2008, 14:34
Es muy buena idea eso de insertar las imágenes, suponía que con lrf se podían visualizar imágenes porque la primera imagen siempre es la portada del libro. Lo que pasa es que habría que insertar las imágenes en páginas concretas no al principio o final del libro como supongo que suele ser lo más habitual.
De todas formas no tiene mucha importancia, lo que ocurre es que este fin de semana me he comprado un escaner y mira por donde en el primer libro que he ido a escanear me he encontrado con este problema, y me lo he tomado como un reto. Quizás no me vuelva a surgir este problema nunca más porque no suele ser muy habitual el que haya imágenes en mitad de una novela, pero me va a venir muy bien para aprender.
Mi intención es ir escaneando libros de manera regular, a mi ritmo sin prisas dependiendo del tiempo que tenga. Una cosa que me fastidia es que a pesar de que existen en la red miles de ebooks, es difícil encontrar la última novedad editorial, a la mayoría no nos importaría pagar un precio razonable por esos ebooks. Así que he decidido escanearme esas novedades, ya he reservado en la biblioteca el de “Los hombres que no amaban a las mujeres” que a pesar de que es uno de los más vendidos no existe en ebook, voy a probar a ver como me queda y si no queda del todo mal lo cuelgo en la red para que otros lo puedan leer y de paso revisar errores. Eso es lo que más temo, que no me quede con la suficiente calidad como para compartirlo.
cual es el método mas fiable para escanear y formatear un libro?
estoy escaneando unas paginas en OCR pero al guardar me deja escoger en formato "tif" o "pdf" cual es mejor para editar después?
utilizáis algún escaner especifico para libros? no veas lo que hay que doblar el libro para que planche correctamente encima del cristal ¬¬ pobrecillo, como va quedar cuando termine, espero no me lo tenga en cuenta :-s
saludos
davidlan
05/10/2008, 16:31
Yo solo te tengo experiencia en digitalización de las 250 páginas que escanee ayer, lo hice todo siguiendo las instrucciones de esta magnifica guía:
http://www.katarsis-net.com.ar/archivos/guia-para-la-digitalizacion-de-textos.php
Lo que no creo es que sea buena la opción de elegir PDF como formato para editar posteriormente, es mucho mejor .doc.
En cuanto a “aplastar” el libro para que se pegue al cristal, es verdad que el lomo del libro ves que sufre, yo mantenía la mano apoyada encima, pero si la edición es buena no debería pasar nada. Si es una edición de bolsillo seguro que te lo cargas. Supongo que a tí te pasara lo que a mí, que el libro es de la biblio o prestado de alguien y te gustara mantener un cuidado exquisito con los libros. Yo sufría más por uno de los bordes de las páginas, que algunas se me doblaban ligeramente las esquinas al introducirlas en la cama del escaner.
Como cosa curiosa, te puedo decir que para combatir el tedio de estar, que paso página, que quito, que pongo….. en la esquina superior derecha mantenía una ventana con una peli. Y así con un ojo en la peli y otro en el escaneo no se me hizo tan pesao. Claro que me sorprende lo bien que me ha salido al final la cosa y que ninguna página se me saliese del escaner.
pues no me deja guardar en doc, solo tif y pdf, luego al guardar un pdf y convertir en txt genera muchos errores, supongo que es más apropiado utilizar un programa especifico para el tratamiento de texto. Voy a leer tu apunte, gracias.
saludos
el libro es mio, me gustaría hacerme la copia digital porque no lo e encontrado en la web, de echo, se edito el marzo de este año. Casi es de bolsillo, mide unos 20cm de largo aunque las tapas son blandas. Las hojas puede que corran peligro en el escaneado a medio libro, a lo mejor se esparraman por el suelo ¬¬
El ABBYY FineReader es cojonudo, ya lo tengo funcionando, a convertido las imagenes "tif" escaneadas anteriormente y las a convertido fácilmente en doc. Lo más difícil serán las fotos que salen en el libro.
Ya me contarás si as solucionado lo de las imágenes, o si sigues utilizando el método de conversiones, porque a mi me va pasar lo mismo jeje
gracias
saludos
A ver, con el método manual que he indicado antes, lo que quería decir es que las podeis insertar en cualquier parte del documento, solo teneis que picar con el ratón dentro del documento allí donde querais meter la imagen y darle a F5. Tan sencillo como eso.
Eso sí, debeis tener las imágenes escaneadas aparte con un software de tratamiento de imágenes y guardadas como imágenes en lugar de usar un OCR.
Lo de los lomos, pues es inevitable. Las páginas impares suelen ser más fáciles porque se puede dejar la tapa del libro colgando al costado del scanner siempre que los márgenes de las páginas sean lo bastante anchos. Para las pares, lo mejor es escanear las hojas cabezaabajo, así también se puede dejar colgar el lomo al costado y no se fuerza tanto. Luego, con cualquier software se les da la vuelta y listo.
davidlan
05/10/2008, 20:50
Buenas, he utilizado el método que nos da katxan para insertar imágenes y efectivamente es la mejor solución. Además al escanear la imagen en vez de con el OCR con el programa que viene con el escaner, la calidad es mucho mejor. Muchas gracias por el consejo.
En cuanto a lo de cómo colocar los libros en el escaner, por comodidad y rapidez lo mejor es colocar el libro abierto entero sobre la cama del escaner porque esto nos permite escanear de dos en dos las páginas y no hay que hacer grandes transformaciones al resultado. Lo que pasa que esto depende del tamaño del libro, su encuadernación, el tamaño del escaner, etc. Será cuestión de ir probando cosas a medida que sajan los problemas, pero sabiendo que se puede dejar colgando una de las partes del libro cabe la posibilidad de digitalizar casi cualquier formato. Solo hace falta un poco de destreza y un mucho de paciencia.
Un saludo.
Powered by vBulletin® Version 4.1.10 Copyright © 2012 vBulletin Solutions, Inc. All rights reserved.