Iniciado por
MadHatter
Otra de las dudas que me depara el ver tamaña cantidad de diccionarios disponibles es que no se da información precisa del número de lemas que contiene. En algunos sí que se habla de palabras, pero es un término que me resulta confuso. Me gustaría, antes de transferir los diccionarios al lector, poder echarles un vistazo previo para comprobar que todo está bien. Hay algún software para Windows o Linux que me permita echar un vistazo a la estructura de los diccionarios??
El formato DSL es texto plano, así que puedes abrirlo con cualquier editor de textos. Por ejemplo:
Código:
#NAME "Oxford Advanced Learners Dictionary 8th Ed."
#INDEX_LANGUAGE "English"
#CONTENTS_LANGUAGE "English"
(...)
seasick
[m0]sea·sick {{id=000038864}} [c rosybrown]\[[/c][c darkslategray]seasick[/c] [c darkslategray]seasickness[/c][c rosybrown]\][/c] [p]BrE[/p] [c darkgray] [/c][c darkcyan]\[ˈsiːsɪk\][/c] [s]z_seasick__gb_1.wav[/s] [p]NAmE[/p] [c darkgray] [/c][c darkcyan]\[ˈsiːsɪk\][/c] [s]z_seasick__us_1.wav[/s] [c orange] adjective[/c] [c darkgray] [/c][c orangered]not usually before noun[/c]
[m1]{{d}}feeling ill/sick or wanting to {{/d}} ↑<<vomit>> {{d}} when you are travelling on a boat or ship{{/d}}
[m2][ex][*]• [/*][/ex][ex][*]{{x}}to {{/x}} [/*][/ex][c darkslategray]{{cl}}be/feel/get seasick{{/cl}} [/c]
{{Derived Word}}[m3][c darkslategray]Derived Word:[/c] ↑<<seasickness>>{{/Derived Word}}
seasickness
[m0]ˈsea·sick·ness [c darkgray] [/c][p]BrE[/p] [c darkgray] [/c][c darkcyan]\[ˈsiːsɪknəs\][/c] [s]z_seasickness__gb_1.wav[/s][c darkgray]; [/c][p]NAmE[/p] [c darkgray] [/c][c darkcyan]\[ˈsiːsɪknəs\][/c] [s]z_seasickness__us_1.wav[/s] [c darkgray] [/c][c orange]noun[/c] [c darkgray] [/c][c orangered]uncountable[/c]
[m1][ex][*]• [/*][/ex][ex][*]{{x}}to suffer from seasickness{{/x}} [/*][/ex]
{{Main entry}}[m3][c darkslategray][u ]Main entry:[/ u][/c] ↑<<seasick>>[c rosybrown]derived[/c]{{/Main entry}}
Tendrías que contar las líneas que no comienzan con tabulador (\t) o sostenido (#). Yo lo hago con grep (uso linux).
Código:
grep -vP "^([\t#]|$)" oxford.dsl |wc -l
72835
Te dará una idea aproximada, porque algunos de esos "lemas" son de este tipo en algunos diccionarios...
'Fats' Waller
'Fatty' Arbuckle
'Gentleman Jim' Corbett
'Jelly Roll' Morton
'Leadbelly'
'Lucky' Luciano
'Muddy' Waters
Aprovecho para preguntar yo también a los expertos rooteadores
Todavía no lo he rooteado, me da pereza pero lo quiero hacer pronto para probar un diccionario con el goldendict. Uso ese sistema en Linux (se activa mediante una pulsación de teclado y da la definición de la palabra que tenga en el portapapeles). En inglés el tema de la morfología no es algo muy problemático (quitando -s, o -ed resuelves la mayor parte de los casos) pero en lenguas romances necesitas alguna manera de que el diccionario relacione cacé con cazar. En la versión para PC eso se resuelve instalando los diccionarios de myspell o hunspell. ¿Se puede hacer esto mismo en la versión de android? ¿Lo tenéis así en vuestros sistemas rooteados?
Lo de hunspell/myspell es una maravilla. En los diccionarios mobipocket creo que no hay mecanismos similares, con lo que has de incluir todas las variantes de un lema en el diccionario si quieres poder hacer búsquedas sobre ellas...