pdf a word

**ener** · 02/02/2011, 14:36

Me quedó pendiente la tarea de probar con el transformer, pero aún no lo hice.
Es algo que hay que hacer, probar el transformer 3, pues con el fineReader 10, encontré pequeños problemas.

Parece que el fineReader toma todo como si fuese imagen, no importa si en el pdf es texto, igual toma todo como si fuesen hojas de imagen. El resultado es muy bueno, pero no perfecto como dije antes, pues encontré algunos lugares (pocos) con defectos de OCR, que en el pdf original no aparecen, y es texto, no imagen.

Y el inconveniente que ya mencioné antes es que agarra las imágenes del pdf, y pasa ocr sobre ellas, convirtiendo todo posible texto que haya, cuando generalmente lo deseable es que toda imagen se quede como está.

Supongo que para el objetivo de convertir pdf, quizá actúe mejor el transformer, pues seguramente no utiliza técnicas de ocr, más bien quizá sólo tome el texto y las imágenes, que es lo que se necesita... Pero todavía no probé.

**cachi** · 03/02/2011, 12:02

Cuando encontré este tema abierto, ví resueltos uno de mis mayores conflictos con los pdf,
rebusco y por dos SMS descargo finereader 10, por ahora todo bien tras una larga descarga, lo ejecuto y me pide código de activación de no hacerlo solo es prueba de 15 días, mi gozo en un pozo. A ver como resuelvo.
Gracias.

**Cidraque** · 03/02/2011, 12:19

Iniciado por ener

El siguiente libro que voy a leer sólo está en pdf. Entonces lo pasé a word por medio de SoldConverterPDF

Convirtió muy bien, pero es escandalosa la cantidad de saltos de línea falsos que hay. Me refiero a que al final de muchas de las líneas hay un salto de línea (enter) donde no debía haberlo.

Perdí la cuenta de cuánto tiempo estoy remplazando esos falsos enter por un espacio, a lo largo de todo el día, y todavía voy por las 3/4 partes... (mañana me espera otra lomeada del 1/4 faltante).

Me pregunto si hay algún conversor de pdf a word que no deje tal cantidad de enter falsos. O si hay algún programa que los quite de acuerdo a ciertos criterios. (Pues otro libro que también lo tengo sólo en PDF me espera para su conversión, y no sé si me anime, quizá me resigne a leerlo de mala forma nomás...).

Estás loco! Lo haces a mano?
Te dejo un par de trucos para hacerlo en un par de minutos (lo de los saltos de linea donde no tocan)
Primero tienes que pulsar el botón ese en word donde te salen todos los espacios y saltos de linea, etc que tienes.
Si observas, verás que en los falsos saltos de linea ocurre lo siguiente: "espacio"enter, mientra que en los verdaderos se cumple: "Punto"enter.
Pues bien, lo que tienes que hacer es sustitur los "punto"enter con la herramienta de sustituir por algun simbolo, por ejemplo $. Es se hace poniendo en buscar: .^p y sustituir por: $
Una vez hecho esto sutituyes todos los saltos de linea, eso es arriba pones ^p y en reemplazar lo dejas en blanco.
Entonces sólo te queda sustiturir los $ por ^p para que se queden sólo los verdaderos saltos de linea.

SOLUCIÓN 2: Hace tiempo que voy trasteando y la verdad es que casi ningún programa transforma los PDF a formato word sin poner esos falsos saltos de linea.
Pero con el Adobe Reader Profesional, si los conviertes a formato word no inserta saltos de linea falsos. Deberías probarlo, lo hace todo más fácil.

Saludos.

**ener** · 04/02/2011, 03:48

Iniciado por Cidraque

Estás loco! Lo haces a mano?
Te dejo un par de trucos para hacerlo en un par de minutos (lo de los saltos de linea donde no tocan)
Primero tienes que pulsar el botón ese en word donde te salen todos los espacios y saltos de linea, etc que tienes.
Si observas, verás que en los falsos saltos de linea ocurre lo siguiente: "espacio"enter, mientra que en los verdaderos se cumple: "Punto"enter.
Pues bien, lo que tienes que hacer es sustitur los "punto"enter con la herramienta de sustituir por algun simbolo, por ejemplo $. Es se hace poniendo en buscar: .^p y sustituir por: $
Una vez hecho esto sutituyes todos los saltos de linea, eso es arriba pones ^p y en reemplazar lo dejas en blanco.
Entonces sólo te queda sustiturir los $ por ^p para que se queden sólo los verdaderos saltos de linea.

Si hubiese hecho eso, la verdad es que el libro se hubiese destrozado de una manera espectacular. Sería mejor leer con los enter falsos. Es que hay demasiadas excepciones a las de que todo enter sea precedido por punto.

Iniciado por Cidraque

SOLUCIÓN 2: Hace tiempo que voy trasteando y la verdad es que casi ningún programa transforma los PDF a formato word sin poner esos falsos saltos de linea.
Pero con el Adobe Reader Profesional, si los conviertes a formato word no inserta saltos de linea falsos. Deberías probarlo, lo hace todo más fácil.

Saludos.

Realmente no creo que sea mejor que con el fine reader. La próxima, detro de poco, probaré con el fine transformer.

**Peto** · 04/02/2011, 08:19

Iniciado por cachi

Cuando encontré este tema abierto, ví resueltos uno de mis mayores conflictos con los pdf,
rebusco y por dos SMS descargo finereader 10, por ahora todo bien tras una larga descarga, lo ejecuto y me pide código de activación de no hacerlo solo es prueba de 15 días, mi gozo en un pozo. A ver como resuelvo.
Gracias.

bájate el 9 y no sueltes un solo sms, que no hace falta.

**perkas** · 04/02/2011, 12:20

Hola,
Si abro con el Word de MS Office, el RTF generado con el Transformer, hago cualquier modificación y lo grabd, se genera un RTF con un tamaño 10 veces mayor al original...

Conoceis alguna forma de editar los RTFs (con el word u otro programa) que genere un archivo de un tamaño "normal"??

Sabeis si un RTF con imagenes y un formato "sofisticado" transformado con el Calibre a EPUB o F2B es mejor para leerlo en el ebook??

Muchas gracias

**ener** · 04/02/2011, 12:35

tanto el fine 10 como el transformer 3 yo los bajé sin ningún SMS hace más de un mes, y funcionan hasta ahora...

**ener** · 04/02/2011, 12:54

Iniciado por perkas

Hola,
Si abro con el Word de MS Office, el RTF generado con el Transformer, hago cualquier modificación y lo grabd, se genera un RTF con un tamaño 10 veces mayor al original...

Conoceis alguna forma de editar los RTFs (con el word u otro programa) que genere un archivo de un tamaño "normal"??

Sabeis si un RTF con imagenes y un formato "sofisticado" transformado con el Calibre a EPUB o F2B es mejor para leerlo en el ebook??

Muchas gracias

Siempre vi que el rtf tiene tamaño grande. Pero cuál es el problema? poco espacio en disco duro? (no creo....)
Para calibre es obligatorio el rtf, pues el doc o el dox no los agarra. Y por supuesto, si el rtf está bien, el resultado es bueno.

**Cidraque** · 04/02/2011, 16:00

Iniciado por ener

Si hubiese hecho eso, la verdad es que el libro se hubiese destrozado de una manera espectacular. Sería mejor leer con los enter falsos. Es que hay demasiadas excepciones a las de que todo enter sea precedido por punto.

Realmente no creo que sea mejor que con el fine reader. La próxima, detro de poco, probaré con el fine transformer.

Bueno... Yo lo ponía a modo de ejemplo, hay que buscar algún patron, yo siempre lo hago más o menos así y funciona.

Respecto a lo del Adobe Reader Profesional queda perfecto, así que debe ser como mínimo igual de bien que con el fine reader...

Te importaría pasarme el documento? Osea, con los falsos enters, por curiosidad, para trastear un poco. Gracias.

**ener** · 06/02/2011, 08:55

Iniciado por Cidraque

Te importaría pasarme el documento? Osea, con los falsos enters, por curiosidad, para trastear un poco. Gracias.

Debo disculparme por la tardanza. Lo que pasa es que el original (pdf) lo tengo, y el corregido también, pero el que aparece con falsos enter ya no lo conservé, y tendría que usar el SoldConvertePdf para generarlo nuevamente. Lo puedo hacer, pero te ruego un par de días....

Tema: pdf a word

Herramientas

Visualizar

Re: pdf a word

Re: pdf a word

Re: pdf a word

Re: pdf a word

Re: pdf a word

Re: pdf a word

Re: pdf a word

Re: pdf a word

Re: pdf a word

Re: pdf a word

Temas similares

¿Nadie lee en word?

El reader no me lee los doc de word.

Una duda de word.

Ecuaciones de Word

plantilla de word pdf

Permisos de publicación