Les VOD de la salle Pleyel en RSS
La salle Pleyel diffuse ses concerts en vidéo à la demande, et un tel contenu mérite vraiment le détour. Cependant, les concerts ne sont disponibles que pendant une certaine période, et le seul moyen de se tenir informé des nouveautés à voir et écouter est d'aller régulièrement consulter la liste des concerts. C'est plutôt rébarbatif, un flux RSS aurait été très pratique.
Le petit bout de script suivant permet de parser la page des concerts, et produit des données au format RSS sur sa sortie standard.
Il suffit simplement de l'invoquer à partir d'un agrégateur pour pouvoir savoir quand un nouveau concert apparaît.
# -*- coding: utf-8 -*-
import urllib2
from lxml import etree
from datetime import datetime
from PyRSS2Gen import RSSItem, RSS2
from md5 import md5
URL="http://www.sallepleyel.fr/francais/concerts/videos.aspx"
opener = urllib2.build_opener()
req = urllib2.Request(URL)
html = etree.HTML(opener.open(req).read())
vodlist = filter(lambda ul: ul.attrib.get('class') == "vod",
html.findall(".//ul"))[0]
items = list()
for e in vodlist.findall(".//li"):
a = e.findall(".//a")[1]
title = a.find(".//strong").text
link = a.attrib.get('onclick').split("'")[1]
items.append(RSSItem(title = title,
link = link,
description=title,
guid=md5(link).hexdigest(),
pubDate=datetime.now()))
rss = RSS2(title = "Salle Pleyel en VOD",
link = "http://www.sallepleyel.fr/francais/concerts/videos.aspx",
description = "Concerts en vidéo à la demande (VOD)",
lastBuildDate = datetime.now(),
items = items)
print rss.to_xml()
Bonne écoute.