En calidad de Afiliado de Amazon, obtengo ingresos por las compras adscritas que cumplen los requisitos aplicables
Página 1 de 7 12345 ... ÚltimoÚltimo
Resultados 1 al 10 de 67

Tema: digitalizar un libro

  1. #1
    Veteran@ en el foro Avatar de mileguito
    Fecha de ingreso
    19 ene, 11
    Ubicación
    Gran Canaria
    Mensajes
    104

    Predeterminado digitalizar un libro

    hola, tengo un libro antiguo, de una editorial desaparecida tiempo ha. Quiero escanearlo para poder leerlo en mi lector y tenerlo como manual de consulta.

    ¿Alguna persona con experiencia me podría indicar sugerencias?

  2. #2
    Veteran@ en el foro Avatar de blanca_luz
    Fecha de ingreso
    29 mar, 09
    Ubicación
    Cáceres
    Mensajes
    1,584

    Predeterminado Re: digitalizar un libro

    El proceso no es sencillo, y si es el primero, no será rápido.

    Lo primero: escaner y programa de OCR(Abby FineReader, es de lo mejor) el resto es lo peor. El trabajo fuerte viene en corregir el OCR y si tiene imágenes la cosa se complica. Para dejarlo bien, me refiero.

    Es cuestión de paciencia, prácticar. Si tienes ambas cosas, ya tienes todo el camino hecho

  3. #3
    Veteran@ en el foro Avatar de rosmar71
    Fecha de ingreso
    03 feb, 09
    Mensajes
    2,152

    Predeterminado Re: digitalizar un libro

    Cita Iniciado por blanca_luz Ver mensaje
    El proceso no es sencillo, y si es el primero, no será rápido.

    Lo primero: escaner y programa de OCR(Abby FineReader, es de lo mejor) el resto es lo peor. El trabajo fuerte viene en corregir el OCR y si tiene imágenes la cosa se complica. Para dejarlo bien, me refiero.

    Es cuestión de paciencia, prácticar. Si tienes ambas cosas, ya tienes todo el camino hecho
    No, no... si viene suqruizu por aqui te dira qu lo primero es quitar tapas y aplicar cutter

  4. #4
    Veteran@ en el foro Avatar de blanca_luz
    Fecha de ingreso
    29 mar, 09
    Ubicación
    Cáceres
    Mensajes
    1,584

    Predeterminado Re: digitalizar un libro

    Cita Iniciado por rosmar71 Ver mensaje
    No, no... si viene suqruizu por aqui te dira qu lo primero es quitar tapas y aplicar cutter
    o Johansolo, que también es del club del cutter

    Pero eso solo se hace en caso de necesidad

    Yo he hecho hace unos dias uno de 250 pag. que ni siquiera se ha inmutado... Pero con tochos gordotes, es casi necesario.
    Si no, el OCR puede llevar lo suyo

  5. #5
    Veteran@ en el foro Avatar de rfog
    Fecha de ingreso
    15 ago, 08
    Ubicación
    Schiedam (Holanda)
    Mensajes
    5,717

    Predeterminado Re: digitalizar un libro

    Si realmente no te interesa tener el texto como "texto", te puedes ahorrar la parte de la corrección (que es la más laboriosa de todas).

    Yo tengo bastantes libros escaneados, sobre todo si son tochos, y con las imágenes me "imprimo" un PDF a 150 DPI y luego lo leo en el iPad (ahora Iconia)... En el iPad se leen mejor a partir de imagen que como texto, en el Iconia no.

    Eso sí, cuenta con PDFs de medio giga o por ahí.

    En mi caso tengo un Plustek 360, y los libros no quedan muy destrozados después de escanearlos...

    [Además, ahora tengo una princesa que se encarga de corregir mis últimos escaneos. Yo no tengo paciencia, pero parece ser que ella sí].

  6. #6
    Veteran@ en el foro Avatar de johansolo
    Fecha de ingreso
    17 abr, 08
    Ubicación
    Irún, Guipúzcoa
    Mensajes
    1,507

    Predeterminado Re: digitalizar un libro

    Cita Iniciado por rosmar71 Ver mensaje
    No, no... si viene suqruizu por aqui te dira qu lo primero es quitar tapas y aplicar cutter
    Cita Iniciado por blanca_luz Ver mensaje
    o Johansolo, que también es del club del cutter

    Pero eso solo se hace en caso de necesidad

    Yo he hecho hace unos dias uno de 250 pag. que ni siquiera se ha inmutado... Pero con tochos gordotes, es casi necesario.
    Si no, el OCR puede llevar lo suyo
    Lo decís como si fuera una Anatema

    Como dicen arriba la parte del escaneo es la fácil.

    Esta es mi última víctima... voluntario:
    Nombre:  V.jpg
Visitas: 142
Tamaño: 52.3 KB

    Lo realmente complicado es dejarlo bien.

    En mi caso eso implica:
    • Usar el ocr para que me genere un doc
    • Juntar las páginas (cada página del libro me lo pone en una sola página y no se pueden juntar automáticamente, hay que vigilar como van los párrafos a mano)
    • Marcar los estilos de texto: Títulos, citas, poesías (incluyendo canciones), "cartas", etc (al principio es un poco lioso, pero cuando te acostumbras es genial, porque puedes automatizar mucho trabajo).
    • Quitar caracteres raros. El ocr suele insertar "guiones de silabeo" (lo llama "guión opcional") que es mejor quitar en este momento.
    • Revisar la separación de párrafos. Muchas novelas separan las escenas dentro de un mismo capítulo con una línea vacía, el OCR lo que suele hacer es en vez de poner una línea en blanco es poner en el formato de párrafo un espaciado superior, yo prefiero una línea en blanco.
    • Paso extra propio *


    Cuando haces todo eso ya estás preparado para pasar el corrector ortográfico, que encontrará muchos falsos positivos (nombres, e incluso palabras correctas que el diccionario no tiene incorporadas) y un montón de palabras con fallos de OCR. Es algo pesadísimo, pero que hay que hacer.

    Una vez hecho todo eso, el libro está listo, pero en realidad sería necesario que te lo leyeras para poder corregir el montón de errores que se habrán colado (yo tuve que corregir 400 errores de un libro que pensaba que estaba perfecto...), incluyendo párrafos cortados o juntados erroneamente. Para eso el kindle es genial, porque puedo marcar según voy leyendo en el mismo libro, pero cualquier otro lector con capacidad de subrayado te servirá.

    * Yo uso un paso extra, que una vez que he hecho todo lo anterior con el word, habro el fichero con el OpenOffice para convertirlo a fb2, cambio los estilos para que coincidan (Título1 --> Level1, Título2 --> Level2, cita --> Cite, cita autor --> Cite Author, verso --> Poem, verso autor --> Poem Autor, etc...) para poder convertirlo a fb2. Cuando he generado el fb2, cambio <emphasis> por <i>, <strong> por <b>, <empty-line/> por <br/>, <title> por <h1>, etc... y copio una cabecera que genero convirtiendo un doc a htm con el propio word, luego quito unas pocas etiquetas más y lo abro con el word y ya tengo un doc con todo el texto en un mismo estilo, al que procedo a poner el tipo y tamaño de letra que quiero y la alineación que me gusta.

    ¿Por qué hago esto? El OCR siempre deja párrafos con espaciados e interlineados como le da la gana. De esta forma los borro todos formatos de párrafo (menos los que he conservado y he convertido a fb2) y tengo todo uniforme en un mismo formato, luego puedo cambiar los atributos de los títulos, citas, etc para que se quede como quiero sin tener que cambiar los atributos de los párrafos y que se me descalabren las negritas y cursivas, por ejemplo.

    No recomiendo este sistema para todo el mundo, pero a mi me parece el más cómodo con los medios que tengo para no perder nada y no tener que trabajar de más.

  7. #7
    Veteran@ en el foro Avatar de blanca_luz
    Fecha de ingreso
    29 mar, 09
    Ubicación
    Cáceres
    Mensajes
    1,584

    Predeterminado Re: digitalizar un libro

    Cita Iniciado por rfog Ver mensaje

    [Además, ahora tengo una princesa que se encarga de corregir mis últimos escaneos. Yo no tengo paciencia, pero parece ser que ella sí].
    Porque de momento serán pocos y cobardes, pero con el tiempo ya veremos

    Si estás todos los días al final no queda otra que animorar el ritmo.

  8. #8
    Veteran@ en el foro Avatar de blanca_luz
    Fecha de ingreso
    29 mar, 09
    Ubicación
    Cáceres
    Mensajes
    1,584

    Predeterminado Re: digitalizar un libro

    Cita Iniciado por johansolo Ver mensaje
    Lo realmente complicado es dejarlo bien.

    En mi caso eso implica:
    • Usar el ocr para que me genere un doc
    • Juntar las páginas (cada página del libro me lo pone en una sola página y no se pueden juntar automáticamente, hay que vigilar como van los párrafos a mano)
    • Marcar los estilos de texto: Títulos, citas, poesías (incluyendo canciones), "cartas", etc (al principio es un poco lioso, pero cuando te acostumbras es genial, porque puedes automatizar mucho trabajo).
    • Quitar caracteres raros. El ocr suele insertar "guiones de silabeo" (lo llama "guión opcional") que es mejor quitar en este momento.
    • Revisar la separación de párrafos. Muchas novelas separan las escenas dentro de un mismo capítulo con una línea vacía, el OCR lo que suele hacer es en vez de poner una línea en blanco es poner en el formato de párrafo un espaciado superior, yo prefiero una línea en blanco.
    • Paso extra propio *
    Yo hago el OCR quitando la máximo posible (sobre todo los guiones opcionales) y una vez que tengo el DOC, maqueto los estilos y compruebo todas las lineas de párrafo para que no queden apelmazadas, y luego correcciónpor lectura.
    Imprescindible tener visibles todos los caracteres no imprimibles. Se evita uno muchas sorpresas

    Con el kindle, subrayo y hago una captura de esa pantalla, de modo que a la hora de corregir solo uso las imágenes que he guardado en el kindle, me resulta más cómodo que ir buscándolas en el aparato.


    Cuando haces todo eso ya estás preparado para pasar el corrector ortográfico, que encontrará muchos falsos positivos (nombres, e incluso palabras correctas que el diccionario no tiene incorporadas) y un montón de palabras con fallos de OCR. Es algo pesadísimo, pero que hay que hacer.
    Antes lo hacía, ahora directamente corrijo por lectura, y luego ya lo dejo volar.

    * Yo uso un paso extra, que una vez que he hecho todo lo anterior con el word, habro el fichero con el OpenOffice para convertirlo a fb2, cambio los estilos para que coincidan (Título1 --> Level1, Título2 --> Level2, cita --> Cite, cita autor --> Cite Author, verso --> Poem, verso autor --> Poem Autor, etc...) para poder convertirlo a fb2. Cuando he generado el fb2, cambio <emphasis> por <i>, <strong> por <b>, <empty-line/> por <br/>, <title> por <h1>, etc... y copio una cabecera que genero convirtiendo un doc a htm con el propio word, luego quito unas pocas etiquetas más y lo abro con el word y ya tengo un doc con todo el texto en un mismo estilo, al que procedo a poner el tipo y tamaño de letra que quiero y la alineación que me gusta.

    ¿Por qué hago esto? El OCR siempre deja párrafos con espaciados e interlineados como le da la gana. De esta forma los borro todos formatos de párrafo (menos los que he conservado y he convertido a fb2) y tengo todo uniforme en un mismo formato, luego puedo cambiar los atributos de los títulos, citas, etc para que se quede como quiero sin tener que cambiar los atributos de los párrafos y que se me descalabren las negritas y cursivas, por ejemplo.
    Yo maqueto directamente el doc que sale del OCR.

    No recomiendo este sistema para todo el mundo, pero a mi me parece el más cómodo con los medios que tengo para no perder nada y no tener que trabajar de más.
    Cada uno vamos cogiendo nuestros truquillos a medida que nos adentramos más en el tema.
    Pero tu método no es tan distinto del mio.

    Con los tochos, sólo le corto las tapas, nunca la costura de las hojas.

  9. El Siguiente Usuario Agradeció a blanca_luz Por Este Mensaje:


  10. #9
    Veteran@ en el foro Avatar de johansolo
    Fecha de ingreso
    17 abr, 08
    Ubicación
    Irún, Guipúzcoa
    Mensajes
    1,507

    Predeterminado Re: digitalizar un libro

    Cita Iniciado por blanca_luz Ver mensaje
    Imprescindible tener visibles todos los caracteres no imprimibles. Se evita uno muchas sorpresas
    Yo también lo hago, se me había olvidado mencionarlo

    Cita Iniciado por blanca_luz Ver mensaje
    Con el kindle, subrayo y hago una captura de esa pantalla, de modo que a la hora de corregir solo uso las imágenes que he guardado en el kindle, me resulta más cómodo que ir buscándolas en el aparato.
    Tendré que pensar en adoptar también ese sistema.

    Cita Iniciado por blanca_luz Ver mensaje
    Yo maqueto directamente el doc que sale del OCR.
    Lo haría pero la cantidad de estilos basura que inserta a veces el OCR me mata, así que prefiero tener un documento limpito con los estilos mínimos

    Cita Iniciado por blanca_luz Ver mensaje
    Cada uno vamos cogiendo nuestros truquillos a medida que nos adentramos más en el tema.
    Pero tu método no es tan distinto del mio.
    Cierto, lo mejor que puedes hacer es ponerte a ello e ir descubriendo que te va mejor, eso sí, los primeros libros van a ser un infierno de decisiones incorrectas que te obligarán a volver de vez en cuando sobre tus pasos.

    Cita Iniciado por blanca_luz Ver mensaje
    Con los tochos, sólo le corto las tapas, nunca la costura de las hojas.
    Bueno mi escáner solo funciona con hojas sueltas (aunque puede escanear 50 hojas de una tacada por las dos caras), así que por mucho que le duela a la gente seguiré rajando libros

  11. #10
    Veteran@ en el foro Avatar de blanca_luz
    Fecha de ingreso
    29 mar, 09
    Ubicación
    Cáceres
    Mensajes
    1,584

    Predeterminado Re: digitalizar un libro

    Cita Iniciado por johansolo Ver mensaje
    Bueno mi escáner solo funciona con hojas sueltas (aunque puede escanear 50 hojas de una tacada por las dos caras), así que por mucho que le duela a la gente seguiré rajando libros
    Si te digo la verdad, soy de tu misma opinión. Los libros que ya he pasado por el escaner estén en una estantería, olvidados, criando polvo. Lo que me importa es el contenido.

    Mi escaner es uno estandar Epson 1670, le quito la tapa y escaneo dos hojas de un pase. Le pongo un intervalo de 7 segundos, lo suficiente para pasar la hoja y alinear el libro, sin dejarte el pellejo corriendo

Temas similares

  1. Libro de Estilo: Cómo debe ser un buen libro electrónico
    Por LARdT en el foro Formatos de e-books
    Respuestas: 14
    Último mensaje: 23/09/2010, 13:54
  2. El libro electronico en la FERIA DEL LIBRO
    Por tempvs en el foro Foro general
    Respuestas: 4
    Último mensaje: 24/04/2010, 08:13
  3. La CE apoya digitalizar libros
    Por Lopez en el foro Foro general
    Respuestas: 1
    Último mensaje: 07/09/2009, 15:24
  4. Respuestas: 54
    Último mensaje: 29/07/2009, 11:59
  5. Digitalizar libros????
    Por ahorso en el foro Formatos de e-books
    Respuestas: 24
    Último mensaje: 27/09/2008, 06:42

Permisos de publicación

  • No puedes crear nuevos temas
  • No puedes responder temas
  • No puedes subir archivos adjuntos
  • No puedes editar tus mensajes
  •