Ya he conseguido incluir las inflexiones en el diccionario de la 22ª edición y lo cierto es que ahora la experiencia de consultar palabras durante la lectura es por fin satisfactoria.
Al final han sido unas 525.000 definiciones extra en la tabla de índices, pero hay que tener en cuenta que no he filtrado plurales o formas verbales cuya semejanza con el singular o el infinitivo, respectivamente, hubieran permitido que el motor de búsqueda los hubiera localizado sin necesidad de tener su definición (registro) explícita, lo cual habría reducido considerablemente este número. Con todo, presupongo que seguirán existiendo errores y además, en las búsquedas que he realizado, he constatado la localización de alguna inflexión que, por coincidencia con otra forma verbal pronominal, no daba el resultado correcto, si bien son casos muy excepcionales. Describo someramente el proceso a continuación, pero ocultándolo para no dar información de más a quien no le interese.
Contenido oculto:
Extraer, mediante expresiones regulares, las definiciones en los ficheros del DUE de Vox y el GDL (Larousse), eliminando código y texto sobrante.
Eliminar las definiciones que aparecen repetidas; el diccionario de Vox contiene un buen número de ellas sobre todo en las formas verbales pronominales, no sé el motivo. También se eliminan aquellas definiciones que no tienen inflexiones pues no resultan de utilidad en el proceso.
Buscar las inflexiones de Vox que no estén en Larousse y añadirlas, ordenándolas tras el proceso.
Compararlas con las definiciones del diccionario de la RAE y eliminar aquellas que no coinciden: ya sea por tratarse de formas pronominales sin definición propia, porque no estaban incorporadas en la 22ª edición, o porque ya no existen, presumo que por anticuadas, en dicha edición.
Una vez expurgado el fichero, insertar en las filas correspondientes los tamaños en bytes de: definición, desplazamientos y número de fichero, necesarios para la tabla de índices (¡bendita función BUSCARV!).
Descomponer las definiciones de inflexiones en una fila por cada una, duplicando los datos numéricos correspondientes obtenidos en el paso anterior, mediante aplicación de búsquedas y sustituciones con expresiones regulares. Fueron necesarias algo más de veinte iteraciones hasta conseguir dejar una única palabra por fila.
Volver a eliminar definiciones repetidas, debidas sobre todo a coincidencias entre sustantivos/adjetivos y tiempos verbales.
Insertar los datos en la tabla de índices.
Mi agradecimiento a JIPG y jcn363 por su inestimable ayuda a la hora de obtener los diccionarios con las inflexiones, de los que me he servido para completar el trabajo.
La verdad es que lo he disfrutado y ahora me queda la posibilidad de hacer lo propio con la 23ª edición, si soy capaz de conseguirlo en formato electrónico, pero eso será otra historia.
He actualizado el fichero en la nube, no obstante vuelvo a incluir el enlace:
Ya he conseguido incluir las inflexiones en el diccionario de la 22ª edición y lo cierto es que ahora la experiencia de consultar palabras durante la lectura es por fin satisfactoria.
Al final han sido unas 525.000 definiciones extra en la tabla de índices, pero hay que tener en cuenta que no he filtrado plurales o formas verbales cuya semejanza con el singular o el infinitivo, respectivamente, hubieran permitido que el motor de búsqueda los hubiera localizado sin necesidad de tener su definición (registro) explícita, lo cual habría reducido considerablemente este número. Con todo, presupongo que seguirán existiendo errores y además, en las búsquedas que he realizado, he constatado la localización de alguna inflexión que, por coincidencia con otra forma verbal pronominal, no daba el resultado correcto, si bien son casos muy excepcionales. Describo someramente el proceso a continuación, pero ocultándolo para no dar información de más a quien no le interese.
Contenido oculto:
Extraer, mediante expresiones regulares, las definiciones en los ficheros del DUE de Vox y el GDL (Larousse), eliminando código y texto sobrante.
Eliminar las definiciones que aparecen repetidas; el diccionario de Vox contiene un buen número de ellas sobre todo en las formas verbales pronominales, no sé el motivo. También se eliminan aquellas definiciones que no tienen inflexiones pues no resultan de utilidad en el proceso.
Buscar las inflexiones de Vox que no estén en Larousse y añadirlas, ordenándolas tras el proceso.
Compararlas con las definiciones del diccionario de la RAE y eliminar aquellas que no coinciden: ya sea por tratarse de formas pronominales sin definición propia, porque no estaban incorporadas en la 22ª edición, o porque ya no existen, presumo que por anticuadas, en dicha edición.
Una vez expurgado el fichero, insertar en las filas correspondientes los tamaños en bytes de: definición, desplazamientos y número de fichero, necesarios para la tabla de índices (¡bendita función BUSCARV!).
Descomponer las definiciones de inflexiones en una fila por cada una, duplicando los datos numéricos correspondientes obtenidos en el paso anterior, mediante aplicación de búsquedas y sustituciones con expresiones regulares. Fueron necesarias algo más de veinte iteraciones hasta conseguir dejar una única palabra por fila.
Volver a eliminar definiciones repetidas, debidas sobre todo a coincidencias entre sustantivos/adjetivos y tiempos verbales.
Insertar los datos en la tabla de índices.
Mi agradecimiento a JIPG y jcn363 por su inestimable ayuda a la hora de obtener los diccionarios con las inflexiones, de los que me he servido para completar el trabajo.
La verdad es que lo he disfrutado y ahora me queda la posibilidad de hacer lo propio con la 23ª edición, si soy capaz de conseguirlo en formato electrónico, pero eso será otra historia.
He actualizado el fichero en la nube, no obstante vuelvo a incluir el enlace:
Impresionante. Lo he probado en mis dos Bookeen y funciona perfectamente. Yo le doy mucha importancia a los diccionarios y parece otro lector, además la presentación de la búsqueda es limpia y agradable a la vista.
Con este diccionario me parece que poco voy a leer en el Paperwhite, ya que el único motivo de tener un Kindle era por los diccionarios.
Se merece estar en la sección de descargas de la web.
Muchas gracias por tu trabajo.
Saludos.
Ya he conseguido incluir las inflexiones en el diccionario de la 22ª edición y lo cierto es que ahora la experiencia de consultar palabras durante la lectura es por fin satisfactoria.
Al final han sido unas 525.000 definiciones extra en la tabla de índices, pero hay que tener en cuenta que no he filtrado plurales o formas verbales cuya semejanza con el singular o el infinitivo, respectivamente, hubieran permitido que el motor de búsqueda los hubiera localizado sin necesidad de tener su definición (registro) explícita, lo cual habría reducido considerablemente este número. Con todo, presupongo que seguirán existiendo errores y además, en las búsquedas que he realizado, he constatado la localización de alguna inflexión que, por coincidencia con otra forma verbal pronominal, no daba el resultado correcto, si bien son casos muy excepcionales. Describo someramente el proceso a continuación, pero ocultándolo para no dar información de más a quien no le interese.
Contenido oculto:
Extraer, mediante expresiones regulares, las definiciones en los ficheros del DUE de Vox y el GDL (Larousse), eliminando código y texto sobrante.
Eliminar las definiciones que aparecen repetidas; el diccionario de Vox contiene un buen número de ellas sobre todo en las formas verbales pronominales, no sé el motivo. También se eliminan aquellas definiciones que no tienen inflexiones pues no resultan de utilidad en el proceso.
Buscar las inflexiones de Vox que no estén en Larousse y añadirlas, ordenándolas tras el proceso.
Compararlas con las definiciones del diccionario de la RAE y eliminar aquellas que no coinciden: ya sea por tratarse de formas pronominales sin definición propia, porque no estaban incorporadas en la 22ª edición, o porque ya no existen, presumo que por anticuadas, en dicha edición.
Una vez expurgado el fichero, insertar en las filas correspondientes los tamaños en bytes de: definición, desplazamientos y número de fichero, necesarios para la tabla de índices (¡bendita función BUSCARV!).
Descomponer las definiciones de inflexiones en una fila por cada una, duplicando los datos numéricos correspondientes obtenidos en el paso anterior, mediante aplicación de búsquedas y sustituciones con expresiones regulares. Fueron necesarias algo más de veinte iteraciones hasta conseguir dejar una única palabra por fila.
Volver a eliminar definiciones repetidas, debidas sobre todo a coincidencias entre sustantivos/adjetivos y tiempos verbales.
Insertar los datos en la tabla de índices.
Mi agradecimiento a JIPG y jcn363 por su inestimable ayuda a la hora de obtener los diccionarios con las inflexiones, de los que me he servido para completar el trabajo.
La verdad es que lo he disfrutado y ahora me queda la posibilidad de hacer lo propio con la 23ª edición, si soy capaz de conseguirlo en formato electrónico, pero eso será otra historia.
He actualizado el fichero en la nube, no obstante vuelvo a incluir el enlace:
Hola Negatus.
¿Sabes Se podría reconvertir el diccionario que has generado para el formato Nolim a stardict y/o al formato de kobo?
Sigo penando por tener un diccionario español completito, que encuentre inflexiones.
Pues entiendo que con Penelope sí que podría hacerse, aunque yo no llegué a hacerlo funcionar en el sentido Stardict->Bookeen. Podría intentar transformarlo, pero no podría probarlo. Voy a ver si es posible.
Pues entiendo que con Penelope sí que podría hacerse, aunque yo no llegué a hacerlo funcionar en el sentido Stardict->Bookeen. Podría intentar transformarlo, pero no podría probarlo. Voy a ver si es posible.
Me respondo a mí mismo. En principio me ha funcionado la conversión y he obtenido el fichero que comparto abajo, en formato stardict. Dime si te sirve o intentamos alguna otra cosa.
Me respondo a mí mismo. En principio me ha funcionado la conversión y he obtenido el fichero que comparto abajo, en formato stardict. Dime si te sirve o intentamos alguna otra cosa.
Me respondo a mí mismo. En principio me ha funcionado la conversión y he obtenido el fichero que comparto abajo, en formato stardict. Dime si te sirve o intentamos alguna otra cosa.
Lo he probado con goldendict y funciona muy bien (p.e. encuentra palabras como fue y te manda al verbo ir), pero los estilos no van (ejemplo de como se ve):
<p><strong>ir.</strong><p style="background:lightgray;">Del lat. ire.</p><strong>1.</strong> intr. moverse de un lugar hacia otro apartado de quien usa el verbo ir y de quien ejecuta el movimiento. U. t. c. prnl.<br/><strong>2.</strong> intr.
En otros ficheros stardict que tengo, la negrita aparece como <b> </b> en vez de <strong> </strong> <i></i> para la cursiva, <br> en vez de <br/> para el salto de línea y no hace falta el <p></p>para delimitar las frases. Puede que sea eso. Entiendo que si lo cambio , el fichero .idx ya no valdrá ¿no?
Lo he probado con goldendict y funciona muy bien (p.e. encuentra palabras como fue y te manda al verbo ir), pero los estilos no van (ejemplo de como se ve):
<p><strong>ir.</strong><p style="background:lightgray;">Del lat. ire.</p><strong>1.</strong> intr. moverse de un lugar hacia otro apartado de quien usa el verbo ir y de quien ejecuta el movimiento. U. t. c. prnl.<br/><strong>2.</strong> intr.
En otros ficheros stardict que tengo, la negrita aparece como <b> </b> en vez de <strong> </strong> <i></i> para la cursiva, <br> en vez de <br/> para el salto de línea y no hace falta el <p></p>para delimitar las frases. Puede que sea eso. Entiendo que si lo cambio , el fichero .idx ya no valdrá ¿no?
Muchas gracias por el esfuerzo.
Eso me pasa en el Inkpad 3 con CoolReader. En cambio, con KOReader se ve bien.
Probablemente sea porque han añadido diccionarios HTML.
En cuanto a Goldendict, creo que un simple cambio de <> a [] causaría el efecto deseado. Es probar.
Suerte.
Última edición por jcn363; 04/11/2018 a las 09:54
Es mejor permanecer callado y parecer tonto
que hablar y despejar las dudas definitivamente. Groucho Marx