PDA

Ver la Versión Completa : Eliminar cabecera y pies de página en pdfs (mi solución)



rubikaz
27/03/2010, 03:51
Bueno, pues he estado mirando hoy varias cosas de los pdfs, ya que tengo uno que no está preparado para el ereader que si adaptase directamente se vería horrible al tomar por ahí en medio todo el rato el pie de página y la cabecera original del pdf.

Mi solución para eliminarlos ha sido hacer en un principio lo que pone el hilo que enlazo a continuación, que es una forma sencilla de aparentemente recortar los márgenes (y recortando lo suficiente pues desaparecen cabecera y pie de página):

http://www.lectoreselectronicos.com/showthread.php?898-Recortar-mrgenes-en-PDF-fcilmente

Pero como digo es aparente, en realidad el pdf no se recorta sino que se muestra un trozo de este. A mi por ejemplo se me ven todavía en el sony 505 (en un ejemplo que he probado) e incluso peor porque te superpone el texto. ¿Solución? Muy sencilla, después de haber hecho lo que pone en el hilo que indico anteriormente, basta con imprimir el pdf que tienes (con dopdf por ejemplo). Con esto obtendrás un pdf que se ve entero y que lo recortado originalmente saldrá en blanco.


¿Otras formas que he visto en el foro de hacer esto?

Pues he leído por ahí que usando el Just Another Printer. Pero que yo sepa, con este programa se obtiene el pdf en formato imagen, así que no es muy útil.

¿Y el PDFcropper? Este sí que te da el resultado en modo texto, pero salvo que pagues por él, te mete unas marcas de agua que no se pueden tolerar.

También se podría intentar pasar primero a .doc y luego eliminar cabecera y tal, pero no he visto una forma cómoda de hacerlo.

Si alguien tiene una forma mejor que lo diga! (con software gratuito digo)

Joserri
29/03/2010, 10:04
Pues yo compré el PDF Cropper y la verdad es que los resultados son estupendos.

Merece la pena, porque sólo cuesta 20 € de nada, que se gastan, a veces, en un aperitivo.

Un aporte más.

Saludos,

Joserri

anabelee
06/04/2010, 10:39
Uso el Solid PDF Converter para pasar los pdfs a doc, rtf o html, y tiene una opción de eliminar pies de página y encabezados de forma automática. También te permite escoger si quieres conservar las imágenes, el formato de tablas y alguna otra cosilla.
Para mí es muy útil a la hora de convertirlos.

Joserri
06/04/2010, 13:01
Veo que el Solid PDF converter es de pago con suscripción.

Mi pregunta: ¿Merece la pena pagarlo?

Un saludo y gracias de antemano,

Joserri

lilith0_5
06/04/2010, 14:05
Yo tambien utilizo el Solid PDF converter, y la verdad es que aunque es bastante trabajoso porque después tienes que pulir el doc resultante, es creo que una de las mejores opciones.
Puedes conseguir que acabe como si desde el principio hubiera sido un doc, eso incluye eliminar los pie/cabecera de pagina que es una de las opciones que tiene la conversión.

anabelee
06/04/2010, 15:23
Veo que el Solid PDF converter es de pago con suscripción.

Mi pregunta: ¿Merece la pena pagarlo?

Un saludo y gracias de antemano,

Joserri

La verdad es que no soy muy objetiva, yo dispongo de él por mi trabajo, así que a mí me compensa 100%. De todas maneras, creo que hace tiempo en softonic se podía acceder a alguna versión de prueba.

Zorg
18/05/2012, 01:15
Uso el Solid PDF Converter para pasar los pdfs a doc, rtf o html, y tiene una opción de eliminar pies de página y encabezados de forma automática. También te permite escoger si quieres conservar las imágenes, el formato de tablas y alguna otra cosilla.
Para mí es muy útil a la hora de convertirlos.

Usando el Solid PDF Converter, yo tengo el problema de que al escoger la opción de quitar pies de páginas y encabezados, me quita el número de la página, pero también la primera línea de cada página.
Es decir, no hay una opción para quitar sólo el número, y como se ve que el pdf que estaba convirtiendo no tiene encabezados, pues se carga la primera línea.

Gracias si alguien sabe como solucionar esto.

xela
18/05/2012, 01:26
Con software gratuito tenemos el PDF Scissors, que es una utilidad sencillisima en JAVA que muestra todas las páginas del ebook PDF superpuestas (para que veas cual es la longitud máxima de la página más grande). Simplemente, a modo de paint, hacemos un marco desde donde queremos recortar, y listo. Más fácil y más útil, imposible. Así es como yo leo PDF en mi Papyre (rotado, obviamente).

Zorg
18/05/2012, 09:55
Con software gratuito tenemos el PDF Scissors, que es una utilidad sencillisima en JAVA que muestra todas las páginas del ebook PDF superpuestas (para que veas cual es la longitud máxima de la página más grande). Simplemente, a modo de paint, hacemos un marco desde donde queremos recortar, y listo. Más fácil y más útil, imposible. Así es como yo leo PDF en mi Papyre (rotado, obviamente).

Gracias, el PDF Scissors lo conozco y va muy bien si el documento final es un Pdf, pero como yo los convierto siempre a Epub, porque los manejo mejor en el Sony, tiene el problema de que entonces vuelven a verse los números, porque el Scissors sólo los oculta en el Pdf.

Replanteando la pregunta sería, ¿cómo hallar un modo de quitar los números de pie de página para un libro que al final va a tener el formato Epub?

jotam
18/05/2012, 10:02
Tb. esta de gratuito el briss: http://briss.sourceforge.net/
Se comentó en algún sitio del foro, hace algún tiempo.

Zorg
18/05/2012, 10:20
Tb. esta de gratuito el briss: http://briss.sourceforge.net/
Se comentó en algún sitio del foro, hace algún tiempo.

Gracias, pero pasa lo mismo, sólo oculta los números en el Pdf. Si lo pasas a otro formato, vuelven a aparecer los números.

jotacecepe
18/05/2012, 10:48
Gracias, pero pasa lo mismo, sólo oculta los números en el Pdf. Si lo pasas a otro formato, vuelven a aparecer los números.

Zorg ... si ves el titulo del hilo, estas soluciones son para pdf's que es un formato de distribucion para impresion puro y duro y es el que mas problemas de visualizacion da al leerse en 6" porque la gran mayoría esta hecho para ser impreso en A4. Por eso las virguerias de recortar y encuadrar, apaisar,etc fin de poder verlos de forma aceptable en el lector ... es como tratar de ver un fotografia A4 en un portafotos de 6".

Cuando pasas a otro formato ... por ejemplo epub ... es el software de lectura que utilizas quien pone los números de pagina ... dependiendo de que software uses, te dara paginas, capitulos, porcentaje, posicion etc. Caso aparte es cuando al escanear un libro fisico, el OCR, mete dentro del texto, los numeros de las paginas del libro en papel, pero por lo que dices no es tu caso.

Si lo que quieres es optimizar espacio de lectura, lo que debes hacer es modificar los margenes ... el ver o no la numeracion dependera de las opciones del menu de configuración del software que uses.


Enviado desde mi Transformer TF101 usando Tapatalk

Zorg
18/05/2012, 11:05
Zorg ... si ves el titulo del hilo, estas soluciones son para pdf's que es un formato de distribucion para impresion puro y duro y es el que mas problemas de visualizacion da al leerse en 6" porque la gran mayoría esta hecho para ser impreso en A4. Por eso las virguerias de recortar y encuadrar, apaisar,etc fin de poder verlos de forma aceptable en el lector ... es como tratar de ver un fotografia A4 en un portafotos de 6".

Cuando pasas a otro formato ... por ejemplo epub ... es el software de lectura que utilizas quien pone los números de pagina ... dependiendo de que software uses, te dara paginas, capitulos, porcentaje, posicion etc. Caso aparte es cuando al escanear un libro fisico, el OCR, mete dentro del texto, los numeros de las paginas del libro en papel, pero por lo que dices no es tu caso.

Si lo que quieres es optimizar espacio de lectura, lo que debes hacer es modificar los margenes ... el ver o no la numeracion dependera de las opciones del menu de configuración del software que uses.


Enviado desde mi Transformer TF101 usando Tapatalk

No, si para mí ver el número de página no es problema, si está puesto en su sitio, o sea al pie.
Lo que ocurre es que al convertir con Calibre el Pdf que tiene números de página, esos números quedan metidos en mitad del texto, y es molesto estar leyendo y encontrarte a cada poco un número metido entre palabras.
Me ha pasado ya varias veces y estoy viendo si encuentro una solución.
La mejor hasta ahora es la de Solid PDF converter, porque éste sí que elimina de verdad el número del Pdf y Calibre ya no me lo vuelve a sacar. Lo que pasa es que, como ya dije, si no hay cabecera te corta la primera línea.

jotam
18/05/2012, 11:53
No, si para mí ver el número de página no es problema, si está puesto en su sitio, o sea al pie.
Lo que ocurre es que al convertir con Calibre el Pdf que tiene números de página, esos números quedan metidos en mitad del texto, y es molesto estar leyendo y encontrarte a cada poco un número metido entre palabras.
Me ha pasado ya varias veces y estoy viendo si encuentro una solución.
La mejor hasta ahora es la de Solid PDF converter, porque éste sí que elimina de verdad el número del Pdf y Calibre ya no me lo vuelve a sacar. Lo que pasa es que, como ya dije, si no hay cabecera te corta la primera línea.
Quizá no sea solución definitiva, pero cuando se convierte de pdf a doc por ejemplo, si te guarda ese tipo de cosas
como número de página, encabezamientos, pies de página, etc, con el procesador de texto que uses (yo uso libre office, así que Writer), se pueden quitar esas partes accediendo al menú Herramientas, buscando por ejemplo "Pie de página" y deseleccionando los que estén activos. Y si te los quita el conversor pues fetén.
Y después con la herramienta de buscar/reemplazar supongo que habrá laguna forma de quitar alguna de esa partes menos deseables y repetitivas. En el foro he visto comentado formas para quitar guiones y hacer un texto continuo, así que es posible que eso de la numeración de página tb se pueda quitar.
Me refiero a cosas como éstas (lo saqué del foro pero ahora no recuerdo de dónde):

- Sustituir "espacio+espacio" por "espacio" hasta que diga que no ha encontrado ocurrencias. Eso elimina los dobles espacios.
- Sustituir "espacio+^p" por "^p". Eso elimina los espacios al final de una linea
- Sustituir "^p+espacio" por "^p". Eso elimina los espacios al principio de una linea.
- Sustituir "^menos+^p" por "nada". Eso elimina las palabras silabeadas en el original.
- Sustituir ",^p" por ",+espacio". Eso elimina los párrafos rotos en una coma.
- Sustituir ";^p" por ";+espacio". Eso elimina los párrafos rotos en una coma.
- Buscar todas las ocurrencias de "^$^p". Esto nos encontrara todas la lineas que no tiene un punto al final.
Normalmente serán:
a - Un titulo de un capitulo. En ese caso marcarlo con el estilo correspondiente (titulo 2)
b - Un párrafo que ha perdido su punto al final. Ponérselo.
c - Un párrafo partido en dos de forma indebida. Recomponerlo.
- buscar ^l y sustituir por un espacio (si rompe el párrafo) o por un ^p si el final de un párrafo

Espacio = un espacio en blanco
Menos = el símbolo menos, que encontraremos encima del + en el teclado numérico.
nada = dejar la casilla vacía.

De todas maneras, el lector del sony no maneja nada mal los pdfs y con la opción de recorte permite leer los pdfs bastante bien. Supongo que ya probaste eso. Pero por si acaso.

jotacecepe
18/05/2012, 13:34
No, si para mí ver el número de página no es problema, si está puesto en su sitio, o sea al pie.
Lo que ocurre es que al convertir con Calibre el Pdf que tiene números de página, esos números quedan metidos en mitad del texto, y es molesto estar leyendo y encontrarte a cada poco un número metido entre palabras.
Me ha pasado ya varias veces y estoy viendo si encuentro una solución.
La mejor hasta ahora es la de Solid PDF converter, porque éste sí que elimina de verdad el número del Pdf y Calibre ya no me lo vuelve a sacar. Lo que pasa es que, como ya dije, si no hay cabecera te corta la primera línea.

OPCION 1
EDITAR el pdf antes de convertirlo, para eso necesitas la version comercial del Acrobat (no el reader gratis que solo sirve para visualizar) quitar los encabezados, pies de pagina y la numeración desde las opciones de pagina y luego convertirlo al formato que quieres. El problema que el programa es que es de pago.

OPCION 2 (pdf 6")
Utilizando el software gratuito de creación de PDF's CutePDF. Una vez instalado, se imprime el documento en la impresora CutePDF que se habrá añadido a nuestro ordenador, pero antes de imprimirlo, en propiedades le indicamos que queremos utilizar un tamaño de papel personalizado (ahí indicaremos la medida final, que deberá ser más pequeña que el original y debe coincidir con la pantalla del lector). En la ventana de impresión le indicamos que queremos rotar y centrar automáticamente y en escala de página ponemos "Ninguno". Al imprimir de nuevo el documento pero en un papel más pequeño, nos quitará los encabezados y pies de página.

OPCION 3
Con el mobipocket creator que elimina los pies y encabezados, genera un archivo PRC que puedes convertirlo con el calibre y terminar de montarlo a tu gusto con el Sigil.

OPCION 4
En calibre al darle a "convertir" en la columna de la izquierda hay la opcion de "buscar y sustituir" en buscar expresiones regulares le das para que te identifique los pies y encabezados ... si le das a la varita magica puedes ver el libro en html para una mejor busqueda de las cadenas a reemplazar.