En calidad de Afiliado de Amazon, obtengo ingresos por las compras adscritas que cumplen los requisitos aplicables
Página 1 de 10 12345 ... ÚltimoÚltimo
Resultados 1 al 10 de 93

Tema: Biblioteca Spanish coolreader

  1. #1
    Habitual en el foro Avatar de facthor
    Fecha de ingreso
    26 may, 08
    Mensajes
    69

    Predeterminado Biblioteca Spanish coolreader

    Efectivamente leobueno, esa fue la línea que seguí. Al final la biblioteca *.pdb, tiene las reglas del silabeo en los distintos idiomas.
    El problema estriba en que es una biblioteca que le faltan muchas reglas del español. Verdaderamente sólo Word y Openoffice tienen una buena implementación del idioma español.

    Estuve viendo la posibilidad de meterle mano, y ahí fue donde no pude seguir.


    Una solución "no muy buena" es crear en el directorio raiz de la memoria interna del Papyre el directorio crengine y poner el archivo fb2.css y el archivo Russian_EnUS_hyphen_(Alan).pdb cambiando previamente el nombre del archivo Spanish_hyphen_(Alan).pdb

    Mejora el silabeo pero no lo soluciona.

    Saludos.
    Juan

  2. #2
    Habitual en el foro Avatar de markmtc
    Fecha de ingreso
    30 jul, 08
    Mensajes
    87

    Predeterminado

    He estado analizando el problema a fondo analizando el código fuente del crengine y haciendo cambios en el contenido del archivo Spanish_hyphen_(Alan).pdb y he obtenido algunos resultados. Otra opción sería crear un algoritmo eficiente de silabeo en español y cuando se seleccione español, en lugar de usar el método de Alan, que parece efectivo en otros idiomas pero en español no sirve, ejecutara dicho algoritmo.

    La estructura del archivo ya la tengo más o menos clara. He instalado la última versión del coolreader para windows que me permite hacer cambios rapidos en el fichero de Alan y ver los resultados. El archivo es una base de datos con indices según la primera letra de la sílaba y la segunda. El problema aparece con las silabas de 3 letras. Empece el estudio con la palabra "matrimonio", que la cortaba en "matrimon-io". La sílaba "nio":
    el bloque de la "n" comienza en la posición 28f8h (hexadecimal). Luego, según la segunda letra de la sílaba a analizar tenemos un indice a donde tenemos que saltar en 29d2h. Nos dice que sería un salto de 3ch (60 posiciones en decimal) desde donde comienzan las sílabas. El bloque de "ni" contiene "ni100 nia1000 nie1000 nio1000 niu100". Una vez buscamos en ese bloque y la encontramos, los números representan si se puede cortar o no delante o detras de esa letra. Observando el resto del fichero vi que en algunos grupos de 3 letras aparece un 2. Cambié el nio1000 por 1200 y dejó de cortar por donde no debía.

    Os propongo que publiquéis palabras mal cortadas indicando donde está el fallo (ejemplo: "matrimon-io") y así ir corrigiendo el fichero.

  3. #3
    Veteran@ en el foro Avatar de jotas
    Fecha de ingreso
    16 may, 09
    Ubicación
    virtual
    Mensajes
    2,399

    Predeterminado

    Pregúntome yo: ¿esta no es la misma libreria que conocemos, que vienen ya usando de siempre los rusos, y que también está integrada y funcionando en el firmware de Lbook? ¿al seleccionar el silabeo en español (no el algoritmico), no estamos ya seleccionando usar las reglas españolas (o, Lbook, sólo incluye las rusas e inglesas, lo dudo, porque en la lista de idiomas aparecen específicamente los soportados)? es decir, no la tenemos ya vista y en funcionamiento de siempre al instalar el Lbook, ya hemos comentado en repetidas ocasiones que, funcionar, funcionaba, pero todavía fallaba mucho.

    Por otra parte, echando un vistazo al Google, veo que esta biblioteca y su autor, el tal "Alan" como se menciona siempre, viene ya de lejos y puede estarse usando en muchos programas y lectores, como el allReader, PocketPC, PDAs, y otros. Y esto me lleva a pensar también si no se pudiera buscar también alguna alternativa, biblioteca, algoritmo, o algo similar en el mundo de las PDAs, Windows CE, y similares, que para estas cosas y en muchas otras cuentan también con lectores y programas muy probados, evolucionados y user-friendly.
    El hombre de negro huía a través del desierto, y el pistolero iba en pos de él...

  4. #4
    Habitual en el foro Avatar de markmtc
    Fecha de ingreso
    30 jul, 08
    Mensajes
    87

    Predeterminado

    El firmware de Lbook incluye todos los ficheros de Alan para los idiomas que llegó a crearlos. Otros firmwares solo abren el Russian_EnUS_hyphen_(Alan).pdb aunque permiten poner otro siempre que se llame igual y lo coloques en la famosa carpeta crengine. El de español es muy pobre además de tener fallos. Y esos fallos son los que pretendo corregir. Además creo que estudiando un poco más el fichero incluso podriamos hacerlo crecer, corrigiendo otros tipos de fallos que comete.

    NOTA: El algoritmo de Alan es único. Los ficheros contienen patrones de silabas que indican por donde se debe o no cortar. Como hay muy pocas silabas en el fichero de español, acaba cortando por donde le parece.

  5. #5
    Veteran@ en el foro Avatar de jotas
    Fecha de ingreso
    16 may, 09
    Ubicación
    virtual
    Mensajes
    2,399

    Predeterminado

    Ergo... a lo que iba, es lo que usabamos y la libreria que aparecía por todos los sitios en the-ebook.org, el mismo sitio de siempre fuente primordial de nuestras esperanzas e información.

    Con destriparla, cambiarla, mejorarla, etc. igualmente, y además, y aún mejor, y más funcional, al Lbook, y más contentos
    El hombre de negro huía a través del desierto, y el pistolero iba en pos de él...

  6. #6
    Jovencit@ en el foro Avatar de leobueno
    Fecha de ingreso
    12 oct, 09
    Mensajes
    12

    Predeterminado

    Una idea.... por si sirve de algo.

    ¿Por que no coger un archivo de guionado "pata negra" como son los de LaTex (hyph-es.tex) y convertirlo al formato PDB de Alan?

    http://tug.ctan.org/cgi-bin/ctanPack...y?id=hyph-utf8

    El código de carga de los PDB está disponible y si el comentario inicial del hypman.cpp es cierto, es lo que hizo Alan para generar sus archivos (Pero se ve que no escogió el archivo adecuado).

    /** file hyphman.cpp
    rief AlReader hyphenation manager

    (c) Alan, adapted TeX hyphenation dictionaries code: http://alreader.kms.ru/
    (c) Mark Lipsman -- hyphenation algorithm, modified my Mike & SeNS

    Adapted for CREngine by Vadim Lopatin

    This source code is distributed under the terms of
    GNU General Public License.

    See LICENSE file for details.

    */

  7. #7
    Habitual en el foro Avatar de markmtc
    Fecha de ingreso
    30 jul, 08
    Mensajes
    87

    Predeterminado

    Es otra posibilidad. A ver si damos con qué es lo que aprovecha de los ficheros tex y como se interpreta el contenido de dichos ficheros. El fichero a generar lo tengo más o menos claro de la de vueltas que le he dado ya. Aquí, en este fichero pdf, explican en inglés como se generan los patrones de los ficheros Tex. A ver que saco en claro.

  8. #8
    Veteran@ en el foro Avatar de jotas
    Fecha de ingreso
    16 may, 09
    Ubicación
    virtual
    Mensajes
    2,399

    Predeterminado

    Cita Iniciado por leobueno
    Una idea.... por si sirve de algo.

    ¿Por que no coger un archivo de guionado "pata negra" como son los de LaTex (hyph-es.tex) y convertirlo al formato PDB de Alan?

    http://tug.ctan.org/cgi-bin/ctanPack...y?id=hyph-utf8
    Joperretas! Has dado en el clavo, y también forma, a la idea abstracta que estaba dando vueltas dentro de mi hiperespacio neuronal, sobre la posibilidad de enredar con las librerias encargadas del dichoso tema para el OpenOffice o el Linux.

    ¡Sería qualità totale!
    El hombre de negro huía a través del desierto, y el pistolero iba en pos de él...

  9. #9
    Habitual en el foro Avatar de markmtc
    Fecha de ingreso
    30 jul, 08
    Mensajes
    87

    Predeterminado

    Pues la cosa sigue tomando forma. Hay una relación directa entre los 2 ficheros. En el de Tex, si un patrón empieza por ".", en el de alan es un espacio en blanco. Si termina en un punto, idem de lo mismo.El significado es que la palabra empieza o termina por ese patrón, respectivamente. Luego, los números tambien tienen su relación directa. Un patrón en text tal que ".hu4meo", sería en Alan " humeo004000".
    Sigo investigando ...

  10. #10
    Habitual en el foro Avatar de markmtc
    Fecha de ingreso
    30 jul, 08
    Mensajes
    87

    Predeterminado

    Bueno, gracias a python y a su facilidad de manejo de listas y cadenas ya tengo la lista preparada para pasar al formato binario especifico de Alan. La he generado a partir del fichero de patrones de Latex como aconsejaban por aquí. Se trata de un total de 2963 patrones.

Temas similares

  1. Compilando CoolReader
    Por solsticio en el foro Papyre
    Respuestas: 147
    Último mensaje: 22/02/2018, 11:36
  2. Respuestas: 3
    Último mensaje: 16/08/2012, 16:42
  3. Coolreader para windows
    Por lobogris en el foro Papyre
    Respuestas: 15
    Último mensaje: 03/11/2010, 18:56
  4. Sangrado en fb2 (con coolreader más concretamente)
    Por johansolo en el foro Formatos de e-books
    Respuestas: 16
    Último mensaje: 14/09/2010, 18:35
  5. CoolReader Universal...
    Por rfog en el foro Foro general
    Respuestas: 0
    Último mensaje: 05/02/2010, 12:23

Permisos de publicación

  • No puedes crear nuevos temas
  • No puedes responder temas
  • No puedes subir archivos adjuntos
  • No puedes editar tus mensajes
  •