Ya que sale el tema después de mucho tiempo, no se cómo lo hacéis pero para la mi la mejor forma es (y he probado unas cuantas).
1. Escanear las imagenes. Yo lo hago con cámara de fotos y el super escaner de libros (http://www.instructables.com/id/Barg...Cardboard-Box/) Si sois manitas hay cosas mucho mejores (http://www.diybookscanner.org/), pero el de la caja de cartón funciona y es barato de construir.
Pero podéis usar lo que queráis aunque usar un escaner plano sin romper el libro genera muchos problemas en el ocr por la doblez de las páginas.
2. Procesado de imagenes con scantailor (http://scantailor.sourceforge.net/), las deja perfectas para luego hacer el OCR. Por ejemplo si escaneas dos páginas permite luego dejarlo en una, limpia, pone recto, etc para que luego el trabajo del OCR sea mejor.
3. OCR con el software que más os guste. Todo el mundo recomienda ABBY yo no, me ha dado siempre mejor resultado Acrobat. Por ejemplo el Abby en las pruebas realizadas le da hambre y se come muchos guiones de inicio de conversación, cosa que no sucede con Acrobat. Pero esto a gusto del consumidor.
Con lo anterior, y aunque seguirá habiendo fallos, se minimizan y hay que trabjar revisar menos el resultado. pero revisón hay que hacer.