Me quedó pendiente la tarea de probar con el transformer, pero aún no lo hice.
Es algo que hay que hacer, probar el transformer 3, pues con el fineReader 10, encontré pequeños problemas.
Parece que el fineReader toma todo como si fuese imagen, no importa si en el pdf es texto, igual toma todo como si fuesen hojas de imagen. El resultado es muy bueno, pero no perfecto como dije antes, pues encontré algunos lugares (pocos) con defectos de OCR, que en el pdf original no aparecen, y es texto, no imagen.
Y el inconveniente que ya mencioné antes es que agarra las imágenes del pdf, y pasa ocr sobre ellas, convirtiendo todo posible texto que haya, cuando generalmente lo deseable es que toda imagen se quede como está.
Supongo que para el objetivo de convertir pdf, quizá actúe mejor el transformer, pues seguramente no utiliza técnicas de ocr, más bien quizá sólo tome el texto y las imágenes, que es lo que se necesita... Pero todavía no probé.