Iniciado por
superviviente20
No se si se me ha escapado pero me parece que el tema se desvió un poco y nadie ha contestado a ahorso.
El que ciertos libros estén digitalizados y otros no, depende de si alguien lo a comprado, digitalizado y colgado en algún sitio.
Para digitalizar documentos hay escaner especificos, pero lo normal no es que gente tenga uno, los escaner que la gente suele tener son los normalitos y los de las impresoras multifunción. Para digitalizar documentos con este tipo de escaner existen programas de ocr entre los que destacan fine reader y omnipage. Yo he tenido la oportunidad de trabajar con ambos y son bastante parecidos, para mi gusto es mas cómodo fine reader, pero tiene problemas con los los dispositivos multifunción (impresora, escaner, fotocopia), mientras que omnipage es mas polivalente en este sentido, pero no es tan potente como ocr.
El proceso es similar en los dos programas, colocas el documento como si se tratara de una fotocopiadora, configuras el escaneado pausa, orientacion, etc (que tiene mas posibilidades y es bastante mas rápido en fine reader) y escaneas todo el documento. El programa hará escaneados sucesivos haciendo un tiempo de pausa de segundos entre uno y otro (el que le has programado) que te permite cambiar la pagina y volver a colocar el documento en el escaner. El tiempo varia según el escaner y la habilidad del usuario, pero un libro de unas 400 paginas se puede escanear en una hora, tras unas pruebas de ensayo y sin demasiada habilidad. Después el programa empieza el reconocimiento de texto de las imágenes escaneadas y lo pasa a un documento txt, doc, pdf o lo que le digamos, luego lo repasas para quitar errores y ya esta, lo tienes en versión digital.
En cuanto al proceso de ocr (reconocimiento del texto de las imagenes) fine reader tarda bastante más pero con menos errores, depende del equipo y de las opciones seleccionadas, a mi me ha llegado ha tardar 36 horas y omnipage pasando a txt con salto de pagina un par de horas, eso si con bastantes errores que luego exigen un trabajo mayor de edición.
Espero haberte orientado.
Un saludo