GESTOR Noticias y Periodicos

**Speedy Cebiche** · 13/04/2010, 16:45

Y seguí jugando con las recetas y descubrí que también se puede realizar un formateo de posición deimagenes. Resulta con el visor de calibre. Me falta probarlo con mi reader. Acá va el código de la Revista El Periodista, que formatea las imagenes flotando a la izquierda, con el texto fluyendo a su derecha y con "aire" separándolos:

Código:

#!/usr/bin/env  python

__license__   = 'GPL v3'
__copyright__ = '2010, Speedy Cebiche'
'''
elperiodistaonline.cl
'''

from calibre.web.feeds.news import BasicNewsRecipe

class ElPeriodistaChile(BasicNewsRecipe):
    title          = u'El Periodista'
    oldest_article = 7
    max_articles_per_feed = 100
    __author__     = 'Speedy Cebiche'
    description    = 'Noticias e Investigación desde Chile'
    language = 'es_CL'
    extra_css = '''
                    h1{font-family:Arial,Helvetica,sans-serif; font-size:large; color:#0E5398; }
                    h2{color:#666666;}
                   img {float:left; padding:5px 20px 10px 5px;}
                    '''
    feeds          = [
                      (u'Locales', u'http://www.elperiodistaonline.cl/locales/feed/')
					  ,(u'Globales','http://www.elperiodistaonline.cl/globales/feed/')
					  ,(u'Panoramas',u'http://www.elperiodistaonline.cl/panoramas/feed/')
					  ,(u'Salud',u'http://www.elperiodistaonline.cl/salud/feed/')
					  ,(u'Bolsillo',u'http://www.elperiodistaonline.cl/bolsillo/feed/')
					  ,(u'Digital',u'http://www.elperiodistaonline.cl/digital/feed/')
					  ,(u'Cancha',u'http://www.elperiodistaonline.cl/cancha/feed/')
					  ,(u'La Voz de...',u'http://www.elperiodistaonline.cl/la-voz-de/feed/')
                    ]

Edito: ¡Funciona! Eso quiere decir que se pueden formatear los libros con hojas de estilo!!! esto me abre nuevas posibilidades (desarrollo sitios web

)

**Speedy Cebiche** · 13/04/2010, 17:31

Y otro más (es super simple). Este es un diario ciudadano de por acá.

Código:

#!/usr/bin/env  python

__license__   = 'GPL v3'
__copyright__ = '2010, Speedy Cebiche'
'''
elciudadano.cl
'''

from calibre.web.feeds.news import BasicNewsRecipe

class ElCiudadanoChile(BasicNewsRecipe):
    title          = u'El Ciudadano'
    oldest_article = 7
    max_articles_per_feed = 100
    __author__     = 'Speedy Cebiche'
    description    = 'Noticias y Periodismo Ciudadano desde Chile'
    no_stylesheets = False
    language = 'en_CL'
    extra_css = '''
                    h1{font-family:Arial,Helvetica,sans-serif; font-size:large; color:#0E5398; }
                    h2{color:#666666;}
                   img {float:left; padding:5px;}
                    '''

    feeds          = [
                      (u'Entrevistas', u'http://www.elciudadano.cl/noticias/entrevistas/feed/')
					  ,(u'Salud','http://www.elciudadano.cl/noticias/salud/feed/')
					  ,(u'Educacion','http://www.elciudadano.cl/noticias/educacion/feed/')
					  ,(u'Justicia','http://www.elciudadano.cl/noticias/justicia/feed/')
					  ,(u'Economia','http://www.elciudadano.cl/noticias/economia/feed/')
					  ,(u'Politica','http://www.elciudadano.cl/noticias/politica/feed/')
					  ,(u'Ciencias','http://www.elciudadano.cl/noticias/ciencias/feed/')
					  ,(u'Artes','http://www.elciudadano.cl/noticias/artes/feed/')
					  ,(u'Medios','http://www.elciudadano.cl/noticias/medios/feed/')
					  ,(u'Pueblos','http://www.elciudadano.cl/noticias/pueblos/feed/')
					  ,(u'Tecnologia','http://www.elciudadano.cl/noticias/tecnologia/feed/')
					  ,(u'Org. Sociales','http://www.elciudadano.cl/noticias/organizacion-social/feed/')
					  ,(u'Medio Ambiente','http://www.elciudadano.cl/noticias/medio-ambiente/feed/')
					  ,(u'Local','http://feeds.feedburner.com/ElCiudadanoLaMiradaLocal')
					  ,(u'Columnas','http://www.elciudadano.cl/noticias/columnas/feed/')
                    ]

**franchute** · 18/04/2010, 22:02

hola

he estado fuera unos dias y intentare ponerme al dia

veo que al final te has puesto en serio con el tema

a ver si somos capaces de descifrar los detalles de este programa

saludos

**Phyros** · 25/06/2010, 08:10

Hola, normalmente me descargo el país para leerlo en el reader. La verdad es que se lee de fábula pero me gustaría poder descargarme la versión en Inglés del mismo periódico, alguien me echa un cable?? No tengo ni idea de cómo se haría......

Gracias!

**wishu** · 15/07/2010, 17:27

Como haceis para que el índice salga al inicio? Estoy descargando las noticias con Calibre y me sale la típica portada de Calibre y luego salen todas las noticias y al final es cuando sale el índice... se puede poner al inicio?

**Phyros** · 16/07/2010, 12:34

A mi me sale por defector, no he hecho nada

Le doy a descargar y listo. Descargo en lrf y epub y en los dos me sale índice.

**Abato** · 22/09/2010, 19:23

Iniciado por franchute

Bueno

Abro este post para ver si entre todos somos capaces de descifrar el uso del programa Calibre para crear periodicos u otros grupos de noticias e indexarlos al programa Calibre en el Apartado "Descargar Noticias"

Las bases son simples

En esta direccion se explica el funcionamiento del Gestor de Noticias
http://calibre-ebook.com/user_manual/news.html

yo lo que he hecho es con el google traductor , traducir el link para ver si me entero

Estoy intentando poner un grupo de noticias

www.diariosur.es
www.diariocordoba.com

no es dificil, lo unico que hay que ponerse y la parte mas jodida es que te baja todo el contenido incluyendo la publicidad.

esto se puede quitar poniendo una serie de opciones y de eso se trata

aqui tenemos una direccion en la que han puesto multitud de peticiones
http://www.mobileread.com/forums/showthread.php?t=32543

dentro de una pagina web si pinchas en el boton derecho tienes la ocpion "ver codigo fuente de la pagina"
con este codigo tenemos que basarnos por ejemplo para poner
"remove tags div ... " y asi quitamos por ejemplo publicidad y otros

A VER SI NOS ANIMAMOS QUE A LOS ESPAÑOLES EN GENERAL nos gusta que nos lo den todo mascadito, pero ES MEJOR ENSEÑAR A PESCAR a que te den pescado.

Amigos, soy incapaz de fabricar la receta de El Cultural (la revista de El Mundo), y me interesa mucho poder descargar la revista en el calibre lo más completa posible. Agradecería mucho que aquellos que soys tan buenos fabricando recetas, pudierais echarme una mano y compartir esa receta con aquellos que esten interesados. Veo que ahorso también la busca.

Gracias por anticipado porque haceis un gran trabajo del que le estamos sacando mucho provecho.

**jefferson_frantz** · 09/10/2010, 02:49

Iniciado por Abato

Amigos, soy incapaz de fabricar la receta de El Cultural (la revista de El Mundo), y me interesa mucho poder descargar la revista en el calibre lo más completa posible. Agradecería mucho que aquellos que soys tan buenos fabricando recetas, pudierais echarme una mano y compartir esa receta con aquellos que esten interesados. Veo que ahorso también la busca.

Gracias por anticipado porque haceis un gran trabajo del que le estamos sacando mucho provecho.

Hola, acabo de hacer una receta para la version en papel de El Cultural. La unica sección que no he incluido es la de opinión ya que me daba algunos problemas y no me la traia completa. Si quieres la descomentas en el metodo parse_index.
Espero que te sirva.

Código:

from calibre.web.feeds.news import re
from calibre.web.feeds.recipes import BasicNewsRecipe
from BeautifulSoup import BeautifulSoup, Tag, NavigableString

class RevistaElCultural(BasicNewsRecipe):

    title       = 'Revista El Cultural'
    __author__  = 'Jefferson Frantz'
    description = 'Revista de cultura'
    timefmt = ' [%d %b, %Y]'
    language = 'es_ES'

    no_stylesheets = True
    remove_javascript = True

    extra_css              = 'h1{ font-family: sans-serif; font-size: large; font-weight: bolder; text-align: justify } h2{ font-family: sans-serif; font-size: small; font-weight: 500; text-align: justify } h3{ font-family: sans-serif; font-size: small; font-weight: 500; text-align: justify } h4{ font-family: sans-serif; font-weight: lighter; font-size: medium; font-style: italic; text-align: justify } .rtsArticuloFirma{ font-family: sans-serif; font-size: small; text-align: justify } .column span-13 last{ font-family: sans-serif; font-size: medium; text-align: justify } .rtsImgArticulo{font-family: serif; font-size: small; color: #000000; text-align: justify}'


    def preprocess_html(self, soup):
            for item in soup.findAll(style=True):
               del item['style']

            return soup

    keep_only_tags = [dict(name='div', attrs={'class':['column span-13 last']}),dict(name='div', attrs={'class':['rtsImgArticulo']})]

    remove_tags        = [
                             dict(name=['object','link','script','ul'])
                            ,dict(name='div', attrs={'class':['rtsRating']})

                         ]


    #TO GET ARTICLES IN SECTION
    def ec_parse_section(self, url, titleSection):
            print 'Section: '+ titleSection
            soup = self.index_to_soup(url)
            div = soup.find(attrs={'id':'gallery'})
            current_articles = []
            
            for a in div.findAllNext('a', href=True):
                    if a is None:
                        continue
                    title = self.tag_to_string(a)

                    url = a.get('href', False)
                    if not url or not title:
                        continue

                    if not url.startswith('/version_papel/'+titleSection+'/'):
                        if len(current_articles) > 0 and not url.startswith('/secciones/'):
                            break
                        continue

                    if url.startswith('/version_papel/'+titleSection+'/'):
                         url = 'http://www.elcultural.es'+url

                    self.log('\t\tFound article:', title[0:title.find("|")-1])
                    self.log('\t\t\t', url)
                    current_articles.append({'title': title[0:title.find("|")-1], 'url':url,
                        'description':'', 'date':''})

            return current_articles


    # To GET SECTIONS
    def parse_index(self):
            feeds = []
            for title, url in [
                ('LETRAS',
                 'http://www.elcultural.es/pdf_sumario/cultural/Sumario_El_Cultural_en_PDF'),
                ('ARTE',
                 'http://www.elcultural.es/pdf_sumario/cultural/Sumario_El_Cultural_en_PDF'),
                ('CINE',
                 'http://www.elcultural.es/pdf_sumario/cultural/Sumario_El_Cultural_en_PDF'),
                ('CIENCIA',
                 'http://www.elcultural.es/pdf_sumario/cultural/Sumario_El_Cultural_en_PDF'),
##                ('OPINION',
##                 'http://www.elcultural.es/pdf_sumario/cultural/Sumario_El_Cultural_en_PDF'),
                ('ESCENARIOS',
                 'http://www.elcultural.es/pdf_sumario/cultural/Sumario_El_Cultural_en_PDF'),
             ]:
               articles = self.ec_parse_section(url,title)
               if articles:
                   feeds.append((title, articles))

            
            return feeds

Saludos.

Jeff.

**Abato** · 12/10/2010, 10:31

Jeff, primero de todo, muy agradecido por tu trabajo y ayuda. Pero te diré que he tratado durante días de convertir la receta en un archivo recipe para poderla cargar directamente desde el calibre, pero no he sido capaz. ¿Podrías hacer el favor de converti¡rla en un fichero y colgarlo aquí para que lo pueda descargar?

Muchas gracias de antemano,

Iniciado por jefferson_frantz

Hola, acabo de hacer una receta para la version en papel de El Cultural. La unica sección que no he incluido es la de opinión ya que me daba algunos problemas y no me la traia completa. Si quieres la descomentas en el metodo parse_index.
Espero que te sirva.

Código:

from calibre.web.feeds.news import re
from calibre.web.feeds.recipes import BasicNewsRecipe
from BeautifulSoup import BeautifulSoup, Tag, NavigableString

class RevistaElCultural(BasicNewsRecipe):

    title       = 'Revista El Cultural'
    __author__  = 'Jefferson Frantz'
    description = 'Revista de cultura'
    timefmt = ' [%d %b, %Y]'
    language = 'es_ES'

    no_stylesheets = True
    remove_javascript = True

    extra_css              = 'h1{ font-family: sans-serif; font-size: large; font-weight: bolder; text-align: justify } h2{ font-family: sans-serif; font-size: small; font-weight: 500; text-align: justify } h3{ font-family: sans-serif; font-size: small; font-weight: 500; text-align: justify } h4{ font-family: sans-serif; font-weight: lighter; font-size: medium; font-style: italic; text-align: justify } .rtsArticuloFirma{ font-family: sans-serif; font-size: small; text-align: justify } .column span-13 last{ font-family: sans-serif; font-size: medium; text-align: justify } .rtsImgArticulo{font-family: serif; font-size: small; color: #000000; text-align: justify}'


    def preprocess_html(self, soup):
            for item in soup.findAll(style=True):
               del item['style']

            return soup

    keep_only_tags = [dict(name='div', attrs={'class':['column span-13 last']}),dict(name='div', attrs={'class':['rtsImgArticulo']})]

    remove_tags        = [
                             dict(name=['object','link','script','ul'])
                            ,dict(name='div', attrs={'class':['rtsRating']})

                         ]


    #TO GET ARTICLES IN SECTION
    def ec_parse_section(self, url, titleSection):
            print 'Section: '+ titleSection
            soup = self.index_to_soup(url)
            div = soup.find(attrs={'id':'gallery'})
            current_articles = []
            
            for a in div.findAllNext('a', href=True):
                    if a is None:
                        continue
                    title = self.tag_to_string(a)

                    url = a.get('href', False)
                    if not url or not title:
                        continue

                    if not url.startswith('/version_papel/'+titleSection+'/'):
                        if len(current_articles) > 0 and not url.startswith('/secciones/'):
                            break
                        continue

                    if url.startswith('/version_papel/'+titleSection+'/'):
                         url = 'http://www.elcultural.es'+url

                    self.log('\t\tFound article:', title[0:title.find("|")-1])
                    self.log('\t\t\t', url)
                    current_articles.append({'title': title[0:title.find("|")-1], 'url':url,
                        'description':'', 'date':''})

            return current_articles


    # To GET SECTIONS
    def parse_index(self):
            feeds = []
            for title, url in [
                ('LETRAS',
                 'http://www.elcultural.es/pdf_sumario/cultural/Sumario_El_Cultural_en_PDF'),
                ('ARTE',
                 'http://www.elcultural.es/pdf_sumario/cultural/Sumario_El_Cultural_en_PDF'),
                ('CINE',
                 'http://www.elcultural.es/pdf_sumario/cultural/Sumario_El_Cultural_en_PDF'),
                ('CIENCIA',
                 'http://www.elcultural.es/pdf_sumario/cultural/Sumario_El_Cultural_en_PDF'),
##                ('OPINION',
##                 'http://www.elcultural.es/pdf_sumario/cultural/Sumario_El_Cultural_en_PDF'),
                ('ESCENARIOS',
                 'http://www.elcultural.es/pdf_sumario/cultural/Sumario_El_Cultural_en_PDF'),
             ]:
               articles = self.ec_parse_section(url,title)
               if articles:
                   feeds.append((title, articles))

            
            return feeds

Saludos.

Jeff.

**Abato** · 12/10/2010, 11:05

Iniciado por Abato

Jeff, primero de todo, muy agradecido por tu trabajo y ayuda. Pero te diré que he tratado durante días de convertir la receta en un archivo recipe para poderla cargar directamente desde el calibre, pero no he sido capaz. ¿Podrías hacer el favor de converti¡rla en un fichero y colgarlo aquí para que lo pueda descargar?

Muchas gracias de antemano,

Jeff, he logrado incorporar la receta y el resultado en magnífico. Muchas gracias. Paso la receta a otro usuario que estaba interesado en la misma en éste foro.

Gracias por el buen trabajo realizado.

Tema: GESTOR Noticias y Periodicos

Herramientas

Visualizar

Receta El Cultural (del diario El Mundo)

Ayuda

¡ Logrado !

Temas similares

problema periodicos calibre

CALIBRE COMO GESTOR DE BIBLIOTECA

Descargar periodicos en CALIBRE

Gestor de libros

Leer Periodicos en el Sony Reader 505

Permisos de publicación