Ayuda para corregir receta del Marca
Buenas, me he preparado una receta del Marca, con mucho contenido, pero cada noticia sale con los comentarios que salen en la pagina del marca, con lo cual la noticia termina siendo larga y con contenido que no es necesario, esta por ejemplo: http://www.marca.com/2011/01/19/moto...295460113.html
Hay alguna forma para que solo aparezca la noticia y quitar los comentarios?
Saludos.
Re: Ayuda para corregir receta del Marca
Sí que hay formas de quitarlos. Pasate por la explicación que se da aquí:
http://www.lectoreselectronicos.com/...etas-a-Calibre
Suerte e ilusión
Re: Ayuda para corregir receta del Marca
Pues va a ser que la parte de los comentarios no se puede eliminar.
Re: Ayuda para corregir receta del Marca
Yo probaría a quitar las class bloque_int_corr estirar, el de id comentarios... vamos que sí se puede
Re: Ayuda para corregir receta del Marca
Algo debo de estar haciendo mal, pongo esto en el modo avanzado:
Cita:
class AdvancedUserRecipe1295853008(BasicNewsRecipe):
title = u'Fuente de noticias desconocida'
oldest_article = 7
max_articles_per_feed = 100
feeds = [(u'Superbike', u'http://www.marca.com/2011/01/19/motor/superbikes/1295434101.html')]
remove_tags =[dict(name='div', attrs={'class':['estirar', 'publi-rascacielosIzq', 'publi-rascacielosDer', 'publi990','bloque izquierda', 'publi_630_noticia estirar','bloque_int_corr estirar','bloque_otras','comentarios']}),
, ]
y desde ahi mismo, al pulsar actualizar o añadir esta receta me da este error:
http://img140.imageshack.us/img140/2485/dibujotyb.jpg
Si en vez de eso, cambio a modo basico, actualizo o añado la receta y luego entro a mirar esa receta en modo avanzado, no se han aplicado los cambios, me sale esto:
Cita:
class AdvancedUserRecipe1295857497(BasicNewsRecipe):
title = u'Fuente de noticias desconocida'
oldest_article = 7
max_articles_per_feed = 100
feeds = [(u'Superbike', u'http://www.marca.com/2011/01/19/motor/superbikes/1295434101.html')]
Re: Ayuda para corregir receta del Marca
¿Te das cuenta que el remove no tiene el indentado correcto? Debiera estar alineado con feeds, max_articles... En este lenguaje la indentación cuenta
Re: Ayuda para corregir receta del Marca
Efectivamente, ese era el error
http://img17.imageshack.us/img17/3664/dibujovju.jpg
el texto completo es este:
Cita:
remove_tags =[
dict(name='div', attrs={'class':['publi_630_noticia estirar', 'bloque_int_corr estirar', 'bloque_otras', 'comentarios']}),
]
Pero asi me salen las noticias en el lector:
http://img225.imageshack.us/img225/5007/dibujopmx.jpg
O yo no entiendo mucho este lenguaje o algo se me pasa que no lo veo.
Saludos.
Re: Ayuda para corregir receta del Marca
Yo empezaría quitando también el javascript, y marcando algo para dejar (keep_tag)
Re: Ayuda para corregir receta del Marca
Pues nada, no logro que salga bien, sigue saliendome "deforme" las noticias.
Re: Ayuda para corregir receta del Marca
¿Calibre no tiene una receta ya hecha para el marca, o es que quieres mejorar lo que ya hay?