import urllib re num urllib urlopen http www xkcd ru num read num re f

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
import urllib, re
num = urllib.urlopen('http://www.xkcd.ru/num/').read()
num = re.findall('<li class="real "><a href="/(\d+)/">\d+</a></li>', num)
for i in num:
img = urllib.urlopen('http://www.xkcd.ru/' + i).read()
f = re.search('"http://www\.xkcd\.ru/xkcd_img/.+?"', img)
img = img[f.start():f.end()][1:-1]
print i, img,
urllib.urlretrieve(img, img.split('/')[-1])
print ' OK'