Resultados 1 al 6 de 6

Tema: Breves Ejemplos recetas PROGRAMACION en TV:. para leer en el eReader.

  1. #1
    Veteran@ en el foro Avatar de KRorschachZ
    Fecha de ingreso
    03 nov, 10
    Mensajes
    355

    Predeterminado Breves Ejemplos recetas PROGRAMACION en TV:. para leer en el eReader.

    Breves Ejemplos recetas PROGRAMACION en TV:. para leer en el eReader.

    Bueno, yo no tengo canales especiales, (ONO, DIGITAL+, etc), luego van las simples, las de toda la vida, ;-), pero si alguien se anima a "mejorar" la receta, así se "puede" ver en un eReader, el potencial es interesante...

    Fuentes de información util, aunque existirán otras...

    http://www.miguiatv.com/

    y otra fuente:

    http://www.laguiatv.com/especiales/rss/

    Contenido oculto:

    Código:
    class AdvancedUserRecipe1289098587(BasicNewsRecipe):
        title          = u'GUIA PROGRAMACION TV ejemplo'
        oldest_article = 1
        max_articles_per_feed = 150
    
        __author__  = ' KRorschachZ.'
        description = 'Tv rss'
        timefmt = ' [%d %b, %Y]'
        language = 'es_ES'
        no_stylesheets = True
        remove_javascript = True
    
        extra_css              = ' .txt_articulo{ font-family: sans-serif; font-size: medium; text-align: justify } .contentheading{font-family: serif; font-size: large; font-weight: bold; color: #000000; text-align: center}'
    
        feeds          = [(u'Noticias TV', u'http://www.sincroguia.tv/rss/rss.php?types=news'), (u'TVE 1', u'http://www.miguiatv.com/rss/tve1.xml'), (u'TVE 2', u'http://www.miguiatv.com/rss/la2.xml'),(u'ANT 3', u'http://www.miguiatv.com/rss/antena3.xml'), (u'Cuatro TV', u'http://www.miguiatv.com/rss/cuatro.xml'), (u'Tele 5', u'http://www.miguiatv.com/rss/telecinco.xml'), (u'La Sexta', u'http://www.miguiatv.com/rss/la-sexta.xml'), (u'Peliculas', u'http://www.laguiatv.com/rss/feeds/peliculas.xml')]
    
        remove_tags_before = dict(id='article')
        remove_tags_after  = dict(id='article')
        remove_tags = [dict(attrs={'class':[
                                'articleFooter',
                                'articleTools',
                                'columnGroup doubleRule',
                                'columnGroup singleRule',
                                'columnGroup last',
                                'columnGroup  last',
                                'doubleRule',
                                'dottedLine',
                                'entry-meta',
                                'entry-response module',
                                'icon enlargeThis',
                                'leftNavTabs',
                                'module box nav',
                                'nextArticleLink',
                                'nextArticleLink clearfix',
                                'post-tools',
                                'relatedSearchesModule',
                                'side_tool',
                                'singleAd',
                                'subNavigation clearfix',
                                'subNavigation tabContent active',
                                'subNavigation tabContent active clearfix',
                                ]}),
                       dict(id=[
                                'adxLeaderboard',
                                'archive',
                                'articleExtras',
                                'articleInline',
                                'blog_sidebar',
                                'businessSearchBar',
                                'cCol',
                                'entertainmentSearchBar',
                                'footer',
                                'header',
                                'header_search',
                                'login',
                                'masthead',
                                'masthead-nav',
                                'memberTools',
                                'navigation',
                                'portfolioInline',
                                'relatedArticles',
                                'respond',
                                'side_search',
                                'side_index',
                                'side_tool',
                                'toolsRight',
                                ]),
                       dict(name=['script', 'noscript', 'style'])]
    
        remove_tags        = [
                                 dict(name=['object','link','script','ul','iframe','ol'])
                                ,dict(name='span', attrs={'class':['article-section']})
                                ,dict(name='span', attrs={'class':['content_rating']})
                                ,dict(name='span', attrs={'class':['content_vote']})
                                ,dict(name='span', attrs={'class':['createby']})
                                ,dict(name='div', attrs={'class':['dialog']})
                                ,dict(name='div', attrs={'id':['jcWrapper']})
                                ,dict(name='div', attrs={'class':['buttonheading']})
                                ,dict(name='div', attrs={'class':['authordetails']})
                                ,dict(name='table', attrs={'class':['pagenav']})
                                ,dict(name='div', attrs={'id':['jc_commentFormDiv']})
                             ]
    
        remove_tags_after = dict(name='div', attrs={'id':'sidebar'})
    
        remove_attributes = ['width','height']
    
        extra_css              = '''
                                    h2{font-family: serif; font-size: small; font-weight: bold; color: #000000; text-align: justify}
                                    '''
    
        remove_tags        = [
                                 dict(name=['object','link','script','ul'])
                                ,dict(name='div', attrs={'id':['scrAdSense','herramientas2','participacion','participacion2','bloque1resultados','bloque2resultados','cont_vinyetesAnt','tinta','noticiasSuperior','cintillopublicidad2']})
                                ,dict(name='p', attrs={'class':['masinformacion','hora']})
                                ,dict(name='a', attrs={'class':["'link'"]})
                                ,dict(name='div', attrs={'class':['addthis_toolbox addthis_default_style','firma','pretitularnoticia']})
                                ,dict(name='form', attrs={'id':['formularioDeBusquedaAvanzada']})
                             ]
    
        def preprocess_html(self, soup):
                for item in soup.findAll(style=True):
                   del item['style']
    #	 del item['link']
                return soup


    (Os paso un ejemplo, "falta" la seccion "noticias" en alguna captura, pues todas eran mas antiguas de los dias de filtro en esa pasada, ..., en este caso de receta serían importantes las fechas y el día, (van hacia el futuro, tal vez tenga relevancia, el objetivo es distinto... no se si me explico, ;-), asi como "tal vez" programar la receta para "loggin" de usuario, he visto que en la receta del New York Times se permite esa opcion, asi hay acceso a los resumenes de los links que apuntan las Rss, en este caso los textos largos no son relevantes, e interesa más un formato indice, como ven en las fotos, mas que el apartado individual, que sobran cosas, por cierto..., pinchando en "articulos", alli se ve una breve entrada por sección...)

    Hay que limpiar links y datos que aparecen en el codigo de esas paginas, tienen un formato muy parecido, la receta de arriba es un ejemplo... para empezar... sobra codigo a manta tambien en la receta...

    PD: unas capturas para "abrir" boca del potencial de la cosa esta, del potencial de "nuestros" eReaders y del Calibre, por supuesto... ;-)

    (yo aconsejo, descargarlos y verlos ordenados por nombre... para seguir "la estela" de navegación, principal, indice, articulos y articulo individual de las capturas por orden cronológico...)
    obviamente, "fecha" filtro tiene un efecto curioso en este caso, ¿alguna persona interesada "en lo que se emitió en la televisión de los últimos 5 días antes? ;-) la parte superior de los artículos debe ser alta en este caso, porque" cada programa "se considera una entrada ... (estas rss estan bien organizadas pues coge noticias de hoy en adelante, para el futuro)... pero... en el confing no hay opcion a limitar fechas en ese sentido..

    Saludos, desde España.

    (guardarme una copia cuando entre todos "la depuremos", ;-)
    Imágenes adjuntadas Imágenes adjuntadas                       
    Última edición por KRorschachZ; 07/11/2010 a las 19:36

  2. Los Siguientes 2 Usuarios Agradecieron a KRorschachZ por Este Mensaje:


  3. #2
    Veteran@ en el foro Avatar de Lagarto
    Fecha de ingreso
    21 ago, 08
    Mensajes
    143

    Predeterminado Re: Breves Ejemplos recetas PROGRAMACION en TV:. para leer en el eReader.

    Buena receta KRorschachZ, has conseguido mejorarla?

  4. #3
    Veteran@ en el foro Avatar de KRorschachZ
    Fecha de ingreso
    03 nov, 10
    Mensajes
    355

    Predeterminado Re: Breves Ejemplos recetas PROGRAMACION en TV:. para leer en el eReader.

    Cita Iniciado por Lagarto Ver mensaje
    Buena receta KRorschachZ, has conseguido mejorarla?
    gracias, pues no. asi se quedó... 8-)

  5. #4
    Veteran@ en el foro Avatar de Lagarto
    Fecha de ingreso
    21 ago, 08
    Mensajes
    143

    Predeterminado Re: Breves Ejemplos recetas PROGRAMACION en TV:. para leer en el eReader.

    A ver si alguien enterado puede mejorarla un poco yo es que de python no entiendo ni papa, no me saques de remove_tags , lo ideal seria ver la programacion entera de un vistazo o un canal por pagina. Por cierto buen curro

  6. #5
    Jovencit@ en el foro Avatar de rickydh
    Fecha de ingreso
    02 feb, 11
    Mensajes
    19

    Predeterminado Re: Breves Ejemplos recetas PROGRAMACION en TV:. para leer en el eReader.

    No se si esto es lo que queriais...

    Código:
    class AdvancedUserRecipe1289098587(BasicNewsRecipe):
        title          = u'GUIA PROGRAMACION TV'
        oldest_article = 1
        max_articles_per_feed = 20
    
        __author__  = ' KRorschachZ./Rickydh'
        description = 'Tv rss'
        timefmt = ' [%d %b, %Y]'
        language = 'es_ES'
        no_stylesheets = True
        remove_javascript = True
    
        keep_only_tags = [
                     dict(name='div', attrs={'id':'show'}),
                     dict(name='div', attrs={'class':'intro-datasheet'})
                     ]    
    
        remove_tags = [
                     dict(name='div', attrs={'class':'toolbox'}),
                     dict(name='div', attrs={'class':'rater inline'})
                     ]    
    
        remove_tags_after = [
                     dict(name='div', attrs={'class':'toolbox'}),
                     dict(name='div', attrs={'class':'rater inline'})
                     ]    
    
    
        feeds          = [
    		(u'Noticias TV', u'http://www.sincroguia.tv/rss/rss.php?types=news')
    		,(u'TVE 1', u'http://www.miguiatv.com/rss/tve1.xml')
    		,(u'TVE 2', u'http://www.miguiatv.com/rss/la2.xml')
    		,(u'ANT 3', u'http://www.miguiatv.com/rss/antena3.xml')
    		,(u'Cuatro TV', u'http://www.miguiatv.com/rss/cuatro.xml')
    		,(u'Tele 5', u'http://www.miguiatv.com/rss/telecinco.xml')
    		,(u'La Sexta', u'http://www.miguiatv.com/rss/la-sexta.xml')
    		,(u'Peliculas', u'http://www.laguiatv.com/rss/feeds/peliculas.xml')
    		]
    
    #    remove_attributes = ['width','height']
    
        extra_css              = '''
                                    h2{font-family: serif; font-size: small; font-weight: bold; color: #000000; text-align: justify}
                                    h1{font-family: serif; font-size: 120%; font-weight: bold; color: #000000; text-align: justify}
    			.desc{ font-family: sans-serif; font-size: 130%; font-weight: bold; text-align: justify }
    			.txt_articulo{ font-family: sans-serif; font-size: medium; text-align: justify }
    			.contentheading{font-family: serif; font-size: large; font-weight: bold; color: #000000; text-align: center}
                                    '''
    
    
    #    def preprocess_html(self, soup):
    #            for item in soup.findAll(style=True):
    #               del item['style']
    #	 del item['link']
    #            return soup
    --
    Saludos

  7. #6
    Veteran@ en el foro Avatar de KRorschachZ
    Fecha de ingreso
    03 nov, 10
    Mensajes
    355

    Predeterminado Re: Breves Ejemplos recetas PROGRAMACION en TV:. para leer en el eReader.

    Cita Iniciado por rickydh Ver mensaje
    No se si esto es lo que queriais...

    Código:
    class AdvancedUserRecipe1289098587(BasicNewsRecipe):
        title          = u'GUIA PROGRAMACION TV'
        oldest_article = 1
        max_articles_per_feed = 20
    
        __author__  = ' KRorschachZ./Rickydh'
        description = 'Tv rss'
        timefmt = ' [%d %b, %Y]'
        language = 'es_ES'
        no_stylesheets = True
        remove_javascript = True
    
        keep_only_tags = [
                     dict(name='div', attrs={'id':'show'}),
                     dict(name='div', attrs={'class':'intro-datasheet'})
                     ]    
    
        remove_tags = [
                     dict(name='div', attrs={'class':'toolbox'}),
                     dict(name='div', attrs={'class':'rater inline'})
                     ]    
    
        remove_tags_after = [
                     dict(name='div', attrs={'class':'toolbox'}),
                     dict(name='div', attrs={'class':'rater inline'})
                     ]    
    
    
        feeds          = [
    		(u'Noticias TV', u'http://www.sincroguia.tv/rss/rss.php?types=news')
    		,(u'TVE 1', u'http://www.miguiatv.com/rss/tve1.xml')
    		,(u'TVE 2', u'http://www.miguiatv.com/rss/la2.xml')
    		,(u'ANT 3', u'http://www.miguiatv.com/rss/antena3.xml')
    		,(u'Cuatro TV', u'http://www.miguiatv.com/rss/cuatro.xml')
    		,(u'Tele 5', u'http://www.miguiatv.com/rss/telecinco.xml')
    		,(u'La Sexta', u'http://www.miguiatv.com/rss/la-sexta.xml')
    		,(u'Peliculas', u'http://www.laguiatv.com/rss/feeds/peliculas.xml')
    		]
    
    #    remove_attributes = ['width','height']
    
        extra_css              = '''
                                    h2{font-family: serif; font-size: small; font-weight: bold; color: #000000; text-align: justify}
                                    h1{font-family: serif; font-size: 120%; font-weight: bold; color: #000000; text-align: justify}
    			.desc{ font-family: sans-serif; font-size: 130%; font-weight: bold; text-align: justify }
    			.txt_articulo{ font-family: sans-serif; font-size: medium; text-align: justify }
    			.contentheading{font-family: serif; font-size: large; font-weight: bold; color: #000000; text-align: center}
                                    '''
    
    
    #    def preprocess_html(self, soup):
    #            for item in soup.findAll(style=True):
    #               del item['style']
    #	 del item['link']
    #            return soup
    --
    Saludos
    genial, ha quedao to chula y limpia...

    ya la tengo instalada, y me informa de lo que van a echar en la tv, en las proximas horas/dias, con mucha claridad...

    salu2

Temas similares

  1. Pequeña Guía para agregar recetas a Calibre
    Por jefferson_frantz en el foro Calibre
    Respuestas: 9
    Último mensaje: 07/01/2014, 16:45
  2. ¿Esta prohibido leer un eReader en el cine?
    Por Chaman en el foro Foro general
    Respuestas: 23
    Último mensaje: 07/11/2010, 19:59
  3. Script para descarga de recetas de Calibre
    Por alf en el foro Amazon Kindle
    Respuestas: 1
    Último mensaje: 27/10/2010, 00:04
  4. Leer blogs y rss, offline, con ereader. Zinepal
    Por parker03 en el foro Foro general
    Respuestas: 2
    Último mensaje: 18/09/2009, 09:50

Permisos de publicación

  • No puedes crear nuevos temas
  • No puedes responder temas
  • No puedes subir archivos adjuntos
  • No puedes editar tus mensajes
  •