¿Cómo incluir nuevos diccionarios en Kobo Aura HD?

**JIPG** · 22/11/2017, 19:34

Iniciado por jotam

Finalmente he conseguido hacer el diccionario sin errores, o al menos que el script no muestre una salida con errores.
Tan sólo hay que seguir las instrucciones del autor, pero, aunque parezca tan obvio, no lo había hecho.
Todo está en la web del script:
http://www.albertopettarin.it/penelope.html

Para llevarlo a cabo he necesitado hacer:

Conseguir MARISA: Matching Algorithm with Recursively Implemented StorAge (MARISA) que es el algoritmo que permite leer y crear los diccionarios kobo. Pero en una versión compilada para windows. Se puede conseguir de aquí. O desde su hilo en mobileread.
Se descarga y descomprime por ejemplo dentro de la carpeta de penelope.
Editar el archivo penelope.py (si usamos Phyton 2) o penelope3.py (si usamos Python 3) cambiando los valores de las variables MARISA_BUILD_PATH y MARISA_REVERSE_LOOKUP_PATH.
Os muestro como lo tengo yo para que sirva de ejemplo:
Código:
```
MARISA_BUILD_PATH="C:\penelope120dictzip-marisa\marisa\marisa-build.exe"
MARISA_REVERSE_LOOKUP_PATH="C:\penelope120dictzip-marisa\marisa\marisa-reverse-lookup.exe
```
Y dictzip que he recogido de la aplicación DictUI. El archivo a descargar es dictui-0.1.0-bin.7z. De ese archivo he extraído a la carpeta de penelope, el ejecutable "dictzip.exe" (y le he añadido las librerías "cygwin1.dll" y "cygz.dll" por si fueran necesarias). Si no tiene dictzip, lo deja decomprimido.
Si alguien lo quiere todo junto, lo he puesto en éste archivo. Tan sólo habría que modificar los valores de las variables de marisa. Yo lo he dejado para descomprimirlo sobre C:\ y funcionar, pero si lo descargáis, revisarlo sería lo mejor.

Pues bien una vez con todo eso, en la carpeta que tengamos el penelope, copiamos también el archivo del diccionario a convertir. En mi caso el miniDRAE de Norishen, un diccionario stardict con tres archivos: drae.dict. drae.ifo y drae.idx

Abro un terminal (cmd) y ejecuto la siguiente instrucción:

penelope.py -p drae -f es -t es --output-kobo

siguiendo la ayuda de la web tenemos lo que es cada argumento:

Ahora bien, no encontrado referencia alguna a los código de lengua. Ese ISO 631-2, según he leído por aquí, debe ser un error, ya que el standard correcto sería el ISO 639-2. Por tanto el código para español podría ser "spa", "esl" o simplemente "es". Aunque tampoco lo sé seguro. Ahora he visto abajo en la web, que tienen un enlace también al standard correcto.

La cuestión de todo este rollo, es que el diccionario lo crea correctamente, pero cuando lo abres, encuentras archivos html con nombres y caracteres extraños, que no sé si funcionarán bien y no sé a qué se deben.
Por tanto pensaba yo que si sería a causa de que ese código no estuviera bien puesto; o quizá dependa del diccionario en sí, y no tanto del código, porque si le pongo "en" de inglés, me lo deja igual.
La única manera que se me ocurre de corregirlo es hacerlo manualmente. Cambiar cada nombre de archivo mal por otro con tilde, que sería lo correcto. Porque eso aparentemente es lo que falla. Pero no dónde, si en el script, si en python, o quizá en marisa. Podría ser ese compilado de marisa el que no tire bien.

Bueno, que dejo los archivos convertidos para que quien lo desee, pueda verlo, probarlo o lo que sea: miniDRAEbyNorishen4Kobo.7z

Y por hoy no pierdo más tiempo.

PD: Es muy curioso el encabezamiento del que creo es el índice del diccionario (archivo words): pone exactamente "We love Marisa". Curioso.

Jotam, después de leer detenidamente tus instrucciones (perdón por revivir este post antiguo) y la página de surquizu (impresionante el curro que tiene

), he intentado convertir el diccionario de la RAE que trae el tagus lux a formato KOBO, pero se me queda en el paso de generar el fichero con formato KOBO (descomprime el fichero DRAE.dict.dz que pasa de 98 MB a 1.2 GB !!!, crea un fichero 11.html de casi 100MB y se queda con la CPU a tope durante 7 horas, hasta que lo he cortado, y ya no hace nada). He utilizado python 3.6, de 64 bits y de 32 bits con el mismo resultado. No da errores, pero se queda funcionando indefinidamente sin acabar.
He probado con otros diccionarios stardict y siempre me da algún problema con caracteres que no reconoce ... La verdad, cualquier sugerencia será bienvenida.

¿Habéis intentado este proceso recientemente con una versión más moderna de penelope?

**surquizu** · 22/11/2017, 20:38

Yo hace tiempo que no lo intento, pero con la última version de Penelope generaba diccionarios pero no me funcionaban. Lo que me funciona es la v.2.0.1 de Penelope en combinación con Pyton 2.7

**JIPG** · 22/11/2017, 21:13

Iniciado por surquizu

Yo hace tiempo que no lo intento, pero con la última version de Penelope generaba diccionarios pero no me funcionaban. Lo que me funciona es la v.2.0.1 de Penelope en combinación con Pyton 2.7

Gracias por la información. Me da un poco de pereza desinstalar las versiones que tengo (penelope 3.1.3 y python 3.6.3), pero si sigo sin conseguir nada, intentaré con las versiones que me dices.

De todas formas, el fichero del DRAE del tagus es grandísimo (98 MB comprimido y 1.2 GB descomprimido) y a lo mejor está codificado de alguna forma que solo lo entienda el tagus (es stardict, pero es verdad que no he conseguido que me funcione con el otro diccionario que manejo en el tagus: goldendict) y por eso no consigue sacarlo.

Me da pena no tenerlo en el KOBO H2O por que es muy bueno ...

**surquizu** · 22/11/2017, 21:27

Iniciado por JIPG

Gracias por la información. Me da un poco de pereza desinstalar las versiones que tengo (penelope 3.1.3 y python 3.6.3), pero si sigo sin conseguir nada, intentaré con las versiones que me dices.

De todas formas, el fichero del DRAE del tagus es grandísimo (98 MB comprimido y 1.2 GB descomprimido) y a lo mejor está codificado de alguna forma que solo lo entienda el tagus (es stardict, pero es verdad que no he conseguido que me funcione con el otro diccionario que manejo en el tagus: goldendict) y por eso no consigue sacarlo.

Me da pena no tenerlo en el KOBO H2O por que es muy bueno ...

si me lo dejas en un enlace para descarga puedo probar de generar el fichero kobo

**jotam** · 22/11/2017, 21:44

Iniciado por JIPG

De todas formas, el fichero del DRAE del tagus es grandísimo (98 MB comprimido y 1.2 GB descomprimido) y a lo mejor está codificado de alguna forma que solo lo entienda el tagus (es stardict, pero es verdad que no he conseguido que me funcione con el otro diccionario que manejo en el tagus: goldendict) y por eso no consigue sacarlo.

Yo no lo conseguí. Me pasaba igual que a ti: se ponía el pc como loco pero no conseguía hacer nada. Creo que también probé con el móvil, sin resultados.
Después lo dejé.
Supongo que tiene que tener algo en el código del diccionario para hacerlo fallar, y para que sea más grande, ofuscación, redundancia... Seguro que hay algún método con el que los interpretes de diccionario no se atoren, pero que haga que fallen las conversiones.
Habría que abrir el diccionario con un editor hexadecimal o algo así y ver cómo esta.
Yo lo dejé para otro momento a ver si tenía más paciencia.

**elchamaco** · 23/11/2017, 09:17

Creo recordar que lo estuve mirando y estab encriptado. ¿De todas formas es mejor que el rae del kindle que es la version 23?. Lo suyo es pillar una definición y ver si hay alguna diferencia.

**JIPG** · 23/11/2017, 13:01

Iniciado por elchamaco

Creo recordar que lo estuve mirando y estab encriptado. ¿De todas formas es mejor que el rae del kindle que es la version 23?. Lo suyo es pillar una definición y ver si hay alguna diferencia.

¿se puede usar ese en un KOBO?

**JIPG** · 23/11/2017, 18:21

Iniciado por surquizu

si me lo dejas en un enlace para descarga puedo probar de generar el fichero kobo

Tienes un privado

**JIPG** · 25/11/2017, 15:30

Para el que tenga curiosidad, el diccionario de español implementado en los KOBO, es el Diccionario de Uso del Español de América y España VOX del 2012. Lo tengo en formato .bgl para goldendict y es exactamente igual.

**JIPG** · 06/12/2017, 12:31

Aunque Surquizu ha dado instrucciones detalladas para cambiar/añadir diccionarios a los KOBO, he probado un procedimiento que aun siendo muy cutre, parece que funciona: quería tener el diccionario de la RAE pero sin quitar el que trae de origen (probé a sustituir el fichero del diccionario original por el de la RAE con el mismo nombre y funcionaba como comentó surquizu), así que he descargado un diccionario de portugués (u otro idioma no usado) desde la página de configuración/Idioma y diccionarios y después lo he sustituido por el de la RAE con el nombre dicthtml-pt.zip y voila, seleccionado portugués puedes ver las definiciones del RAE.

Lo dicho, es un poco cutre, pero funciona. Quería mantener el diccionario original, por que no está mal del todo y tener también el RAE sin tener que trastear de momento con parches y base de datos ...

Lo único que espero es que no se cambie por el diccionario original cunado sincronice el lector al comprar algún libro nuevo...

[Edición]: Ya estaba explicado por surquizu en su página, y sí, parece que se borran al sincronizar. Perdón por repetir información ya existente.

Tema: ¿Cómo incluir nuevos diccionarios en Kobo Aura HD?

Herramientas

Visualizar

Re: ¿Cómo incluir nuevos diccionarios en Kobo Aura HD?

Re: ¿Cómo incluir nuevos diccionarios en Kobo Aura HD?

El Siguiente Usuario Agradeció a surquizu Por Este Mensaje:

Re: ¿Cómo incluir nuevos diccionarios en Kobo Aura HD?

Re: ¿Cómo incluir nuevos diccionarios en Kobo Aura HD?

Los Siguientes 2 Usuarios Agradecieron a surquizu por Este Mensaje:

Re: ¿Cómo incluir nuevos diccionarios en Kobo Aura HD?

El Siguiente Usuario Agradeció a jotam Por Este Mensaje:

Re: ¿Cómo incluir nuevos diccionarios en Kobo Aura HD?

Re: ¿Cómo incluir nuevos diccionarios en Kobo Aura HD?

Re: ¿Cómo incluir nuevos diccionarios en Kobo Aura HD?

Re: ¿Cómo incluir nuevos diccionarios en Kobo Aura HD?

Re: ¿Cómo incluir nuevos diccionarios en Kobo Aura HD?

El Siguiente Usuario Agradeció a JIPG Por Este Mensaje:

Temas similares

Mi experiencia con el Kobo Aura HD

Nuevo Kobo Aura 6″

Dudas con Kobo Aura

¿Odyssey HD frontlight, Kobo Aura o Paperwhite2...?

Presentado el kobo Aura HD, 6,8", frontlight, 1440x1080.

Permisos de publicación