webspider

 

webspider.py

python 抓取每日一文文章

import urllib2

# get webpage
headers = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/30.0.1599.101 Safari/537.36‘}
fd   = urllib2.Request(‘http://meiriyiwen.com/‘,headers = headers)  
data = urllib2.urlopen(fd).read()

# save as a file
f = open(‘issue.htm‘, ‘w‘)
f.write(data)
f.close()

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。