si [1º] tienes ciertas habilidades de programador y [2º] si es una tarea que vas a hacer muchas veces, entonces puedes exportar el PDF en un RTF y mirar en las librerias del compilador que suelas usar que rutinas dispone para manejar contenido RTF, y hacerte un par de programillas que te resuelvan tus problemas mas habituales al respecto: palabras partidas, lineas vacias, codigo idiomatico redundante, residuos de paginaciones, errores ortograficos habituales pero no detectables por correctores (como el pronombe "él"), etc..