Hola.
Estoy intentando modificar un poco el diccionario para que se vea bien en goldendict (la versión de stardict) y para que se vea un poco mejor en kobo (las negritas no salen).
Intento transformar la versión original bookeen con penelope 2.0.2 (es la que tengo en windows, la 3.1.3 no se como instalarla) pero se me queda "colgado" después de generar los ficheros htlm del kobo pero no llega a comprimir ni a sacar el índice.
Otras conversiones de stardict a kobo si funcionan sin problema.
¿Alguien lo ha hecho en windows para ver si me puede dar un poco de luz sobre que puede estar pasando?.
Con la versión 3,.1.3 no se dónde encontrar ejecutables windows para el programa marisa-trie 0.7.5 (si es que existen), que es necesario para generar los diccionarios kobo. Lo que encuentro debe funcionar en linux o similar y eso para mi es meterme en un pantano .
Perdón por tanta pregunta, pro es que estoy un poco perdido con el python y todo eso ...
Como habrás leído en la página de Penelope:
Yo uso Linux (y si quieres que te lo compile o haga alguna prueba...) pero el posible problema que puedas tener con la versión de MARISA lo puedes solucionar con Python:Código:If you want to read from/write to Kobo format, you need a compiled version of MARISA. In case, you must modify the value of variables MARISA_BUILD_PATH and MARISA_REVERSE_LOOKUP_PATH in penelope.py (Python 2.x) or penelope3.py (Python 3.x), making it pointing to the marisa-build and marisa-reverse-lookup executables (see the corresponding comments in the source code).
Suerte.Código:pip install marisa-trie
Con penelope 2.0.2 el programa marisa me funciona cuando paso de stardict a kobo, así que ese programa no es el problema.
Cuando intento pasar el diccionario de negatus en formato bookeen es cuando se queda a medias.
Me gustaría probar la versión 3.1.3 de penelope, pero no se como instalarlo en windows.
¿Lo de pip install marisa-trie funciona también en windows o solo en Linux?
pip es la herramienta recomendada para instalar paquetes en Python.
Suerte.
Si quieres probarlo, creo que la versión 3.1.2 sí que funcionaba. Como lo estuve probando y luego surquizu lo subió a su web, pues parece que lo tienes todavía disponible por allí.
Yo no recuerdo como iba el tema, pero lo que me parece es que requería instalar el compilador de windows y unas librerías y no requería el marisa (o si lo requería se instalaba con pip igualmente). Pero no me hagas caso, porque yo no me acuerdo. Suquizu, creo yo que lo siguiera usando, así que sabrá decirte más y mejor.
Última edición por jotam; 18/11/2018 a las 00:09
Muchas gracias jotam.
Si hubiese leido antes tu post me hubiese evitado el lio que monté al instalar un programa llamado PIP-Win. Creo que puede haber "corrompido" de alguna forma algo del python, por que me daba muchos errores, pero bueno de momento parece que todavía funciona .
Voy a intentar lo que me propones .
Actualización: No me funciona nada al instalar penelope o marisa-trie por que mi usuario de windows tiene un acento y no lo codifica bien en ASCII. Parece que es un problema de python, y aunque está documentado, no he encontrado una solución.
Última edición por JIPG; 18/11/2018 a las 18:23
Creo que ya he encontrado el problema con los diccionarios generados en formato stardict:
En el fichero .ifo, hay una línea sametypesequence=m que indica que todo lo que hay en el diccionario es texto "puro" sin formato. Si se cambia por sametypesequence=x parece que ya se puede ver el formato. Parece que era un problema reportado, pero el desarrollador de Penelope lo dejó por aquella época. Yo le he cambiado adicionalmente <strong> por <b> y <em> por <i>.
Lo que sí he encontrado comparando tu diccionario con el de jpalacios y el minirae es que algunas acepciones compuestas no aparecen en una línea separada y se pierde la trazabilidad palabra-significado. En el minirae aparecía incluso en negrita, pero eso ya es un "plus".
Dejo unos ejemplos de como se ven en los diferentes diccionarios la palabra mirar, en sus frases compuestas:
Diccionario Negatus en Goldendict
Diccionario JPalacios en Goldendict
Diccionario MiniRAE en Godendict