Resultados 1 al 9 de 9

Tema: algoritmo de silabeo.

  1. #1
    Veteran@ en el foro Avatar de silicon
    Fecha de ingreso
    31 dic, 10
    Mensajes
    389

    Predeterminado algoritmo de silabeo.

    Estoy pensando en añadir la opcion de silabeo, de forma opcional, al qualityebook.
    El silabeo consiste en dividir las palabras con un guion cuando se encuentran al final de la linea. Esto es soportado, siempre que este "preguionado" en el libro para los lectores que entgan el ADE (epub), el CR3 (FB2) y los kindle (AZW3).

    El problema es que no se cual es el algoritmo apropiado.

    Por un lado se me ocurre que lo mas sencillo seria incorporar un diccionario y asi estaria claro como se silabean las palabras, pero ¿donde obtenerlo?
    Otra opcion seria usar bloques de cuatro letras que siempre se silabeen igual, pero de nuevo no se donde obtener dichos bloques.
    Otro algoritmo posible seria usar reglas gramaticales, aunque me imagino que sea menos fiable. En cualquier caso desconozco dichas reglas, pues tengamos en cuenta que el ordenador no sabe como se pronuncian las palabras.

    ¿Podeis ayudarme?

  2. #2
    Veteran@ en el foro Avatar de jotam
    Fecha de ingreso
    02 dic, 10
    Mensajes
    2,937

    Predeterminado Re: algoritmo de silabeo.

    ¿Te sirve algo de esto?
    http://www.tex-tipografia.com/spanish_hyphen.html

    Con el T1, usábamos un archivo css modificado por solsticio/jotas para Cool Reader. Pero era para que el lector interpretara el güionado, no para generarlo. O quizá sí. El de solsticio estaba en el siguiente archivo.
    El de jotas, lo incorporaba a su Cool Reader modificado.

  3. #3
    Veteran@ en el foro Avatar de rfog
    Fecha de ingreso
    15 ago, 08
    Ubicación
    Schiedam (Holanda)
    Mensajes
    5,682

    Predeterminado Re: algoritmo de silabeo.

    No.

    Está preguntando por las reglas de guionado. Es decir, cuándo se puede dividir, cómo, excepciones, etc.

    Eso o el formato de uno de esos ficheros de guionado y cómo interpretarlos.

    La verdad es que creo que no está publicado en ningún lado, aunque de crío recuerdo que me lo explicaron...

    Yo también ando buscando algo similar...

  4. #4
    Veteran@ en el foro Avatar de Terisa
    Fecha de ingreso
    24 abr, 09
    Ubicación
    En el país de los espejos curvos
    Mensajes
    9,909

    Predeterminado Re: algoritmo de silabeo.

    ¿Pero publicado el algoritmo de programación o la reglas? Las reglas las podéis ver aquí. El algoritmo... es de los típicos que se estudian en la carrera. Ahora bien, a esto le falta un detalle: las reglas de construcción de sílabas en castellano.
    Ciao

    Terisa de Morgan







    Mi reto en goodreads



  5. #5
    Veteran@ en el foro Avatar de jotam
    Fecha de ingreso
    02 dic, 10
    Mensajes
    2,937

    Predeterminado Re: algoritmo de silabeo.

    Cita Iniciado por rfog Ver mensaje
    No.

    Está preguntando por las reglas de guionado. Es decir, cuándo se puede dividir, cómo, excepciones, etc.

    Eso o el formato de uno de esos ficheros de guionado y cómo interpretarlos.

    La verdad es que creo que no está publicado en ningún lado, aunque de crío recuerdo que me lo explicaron...

    Yo también ando buscando algo similar...
    A ver, el primer enlace que puse es el sistema de guionizado usado en TeX y LaTeX.

    Al final del articulo hay otro enlace: http://www.ctan.org/tex-archive/lang...h/hyphen/base/
    Éste el el proyecto con el archivo "eshyph.tex" creado para guionizar, creo que es, el patrón en castellano. También su código fuente.
    Así como un pdf con la documentación sobre el proyecto, explicando por su creador Javier Bezos. e aquí el resumen del mismo:
    Contenido oculto:

    La división de palabras con guiones es un problema ortográfico que todavía plantea
    problemas, tanto desde un punto de teórico como práctico. Es este artículo se analizan los
    posibles criterios para la división en castellano, con una serie de reglas, y a continuación es
    estudia la forma en la que se puede implementar un conjunto de tales normas en TEX. Entre
    otras se consideran las normas académicas de 1999 y, en especial, del 2005, con comentarios
    sobre cómo suplir sus deficiencias.
    El artículo se divide en dos partes, la primera de las cuales está dedicada al análisis de
    las reglas. En la segunda se hará una breve historia de los patrones y se tratará sobre su
    implementación


    Aunque se aplique para TeX, yo pensaba que podía servir de base para otras cosas. también para lo que pedía silicon. Pero desde luego vosotros sabéis más o quizá lo entendéis mejor.
    Y el diccionario que usa, quizá pueda aplicarse para la tarea. A mi me da, que pese a no entender demasiado, sí que sería posible.

  6. #6
    Veteran@ en el foro Avatar de silicon
    Fecha de ingreso
    31 dic, 10
    Mensajes
    389

    Predeterminado Re: algoritmo de silabeo.

    Me han servido de mucho vuestras referencias.
    La verdad es que el tema es sumamente complicado, pues son reglas con bastantes excepciones y no todo el mundo parece estar de acuerdo en la reglas.

    Por el momento he implementado algo muy sencillo, silabeando solamente las palabras largas, puesto que las cortas se justifican perfectamente a base de aumentar la separacion entre palabras. Por el mismo motivo pongo un maximo de dos guiones de silabeo por palabra, procurando que queden en el centro de esta.
    Ademas no silabeo los primeros 30 caracteres de cada parrafo pues, logicamente, no van a coincidir nunca al final de una linea.
    De esta forma obtengo un equilibrio entre la presentacion y el tamaño del archivo.

    He procurado que nunca se produzca un silabeo incorrecto, a costa de no silabear si hay dudas.

    Aqui os dejo una prueba para el formato AZW3, que es el unico que parece soportar esta funcion.
    En ePub el ADE parte las palabras, pero se olvida de poner el guion. En Fb2 parecen hacerlo los propios programas de lectura. En MOBI, AZW y LRF parece que no se soporta sta funcion.

    Descargalo de QualityEbook v0.67b1.zip y contarme que os parece.

    La configuracion consiste en editar el qualitytebook.ini y cambiar el valor de "Hyphenate=4"
    Un valor de 2 desactiva esta opcion.
    Un valor de 3 silabea palabras de 9 letras o mas.
    Un valor de 4 silabea palabras de 11 letras o mas.
    Un valor de 4 silabea palabras de 13 letras o mas.
    y asi sucesivamente.

  7. #7
    Veteran@ en el foro Avatar de milady133
    Fecha de ingreso
    26 jun, 08
    Mensajes
    983

    Predeterminado

    Una duda. Yo pensaba que lo del silabeo era cosa del firmware de lectura, su cuando generas el archivo no sabes en qué pantalla y con qué tamaño de letra se va a leer no le veo el sentido de añadirlo al libro. ¿Cuál es el motivo de añadirlo al libro?

  8. #8
    Veteran@ en el foro Avatar de johansolo
    Fecha de ingreso
    17 abr, 08
    Ubicación
    Irún, Guipúzcoa
    Mensajes
    1,507

    Predeterminado Re: algoritmo de silabeo.

    Cita Iniciado por milady133 Ver mensaje
    Una duda. Yo pensaba que lo del silabeo era cosa del firmware de lectura, su cuando generas el archivo no sabes en qué pantalla y con qué tamaño de letra se va a leer no le veo el sentido de añadirlo al libro. ¿Cuál es el motivo de añadirlo al libro?
    Hay un guión especial cuyo código html es &_shy; (sin guión bajo) que no se muestra salvo que coincida con el borde derecho de la pantalla. Es posible que haya más símbolos especiales en html que hagan lo mismo, pero no lo sé.

    Si tienes un programa que es capaz de sea capaz de reconocer correctamente las sílabas puedes insertar un guión de esos tras cada sílaba y así aunque no tenga función de silabeo se mostraría. Habría que comprobar que el Coolreader, el ADE y el kindle son capaces de visualizarlo, pero no creo que haya muchos problemas. También habría que ver si hay algún tipo de incompatibilidad con el silabeo de coolreader.

    Y ahora un ejemplo:
    E­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem ­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE ­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­ jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­p loE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­j em­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­pl oE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­je m­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­plo E­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem ­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE ­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­ jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­p loE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­j em­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­pl oE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­jem­ploE­je m­ploE­jem­ploE­jem­ploE­jem­ploE­jem­plo

    Y otro ejemplo más:

    E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo

    En realidad es:

    Código:
    E&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;ploE&_shy;jem&_shy;plo
    
    y 
    
    E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo E­jem­plo
    (quitando el guión bajo)

  9. #9
    Veteran@ en el foro Avatar de silicon
    Fecha de ingreso
    31 dic, 10
    Mensajes
    389

    Predeterminado Re: algoritmo de silabeo.

    Cita Iniciado por johansolo Ver mensaje
    Hay un guión especial cuyo código html es &_shy; (sin guión bajo) que no se muestra salvo que coincida con el borde derecho de la pantalla. Es posible que haya más símbolos especiales en html que hagan lo mismo, pero no lo sé.
    Efectivamente lo que se hace es instertar el SHY (Soft HYphen) y el lector decide si lo usa o no, dependiendo de donde coincida la palabra.
    Hay otros simbolor similares, que basicamente son:
    El Hard hyphen, el cual siempre se inserta.
    Un hypen para el Armenio y otro para el Mongol (desconozco como se usan, pues mi armenio esta un pelin oxidado.)
    Un No breakin Hyphen, que especifica justo lo contrario y es que una palabra nunca se divida por ahi.

    Cita Iniciado por johansolo Ver mensaje
    Si tienes un programa que es capaz de sea capaz de reconocer correctamente las sílabas puedes insertar un guión de esos tras cada sílaba y así aunque no tenga función de silabeo se mostraría. Habría que comprobar que el Coolreader, el ADE y el kindle son capaces de visualizarlo, pero no creo que haya muchos problemas. También habría que ver si hay algún tipo de incompatibilidad con el silabeo de coolreader.
    El Kindle en su formato AZW3 es capaz de visualizarlo correctamente.
    El Kindle en su formato AZW o MOBI no es capaz de visualizarlo correctamente.
    El ADE divide la palabra correctamente, pero se olvida de poner el guion. Al menos el la version que he probado.
    El coolreader, ni idea.

    Por tanto en el programa lo he implementado solamente para el formato AZW3. Si alguien lo desea en otro formato para hacer pruebas, solo tiene que decirlo.

Temas similares

  1. Periodicos y SILABEO
    Por uveral en el foro Sony Reader T1
    Respuestas: 4
    Último mensaje: 21/05/2012, 20:21
  2. Formatos que permiten silabeo
    Por gavin8822 en el foro Foro general
    Respuestas: 6
    Último mensaje: 08/02/2011, 17:09
  3. Silabeo papyre 6.2
    Por RAFAEL1813 en el foro Papyre
    Respuestas: 15
    Último mensaje: 20/12/2010, 17:24
  4. Muy curioso. Silabeo-hyphenation
    Por hedera en el foro Onyx Boox
    Respuestas: 9
    Último mensaje: 23/04/2010, 14:44
  5. Un poco de luz con el Silabeo o Hyphernation
    Por markmtc en el foro Papyre
    Respuestas: 3
    Último mensaje: 06/10/2008, 02:26

Permisos de publicación

  • No puedes crear nuevos temas
  • No puedes responder temas
  • No puedes subir archivos adjuntos
  • No puedes editar tus mensajes
  •