网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

python爬虫笔记3

浏览数：30 / 时间：2015年06月08日

10.伪装成浏览器访问 某些网站反感爬虫的到访，于是对爬虫一律拒绝请求这时候我们需要伪装成浏览器，这可以通过修改http包中的header来实现

headers = {

‘User-Agent‘:‘Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6‘

}

req = urllib2.Request(

url = ‘http://secure.verycd.com/signin/*/http://www.verycd.com/‘,

data = postdata,

headers = headers

)

11.对付"反盗链" 某些站点有所谓的反盗链设置，其实说穿了很简单，

就是检查你发送请求的header里面，referer站点是不是他自己，

所以我们只需要像把headers的referer改成该网站即可，以cnbeta为例：

headers = {
    ‘Referer‘:‘http://www.cnbeta.com/articles‘
}

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

python爬虫笔记3

标签：编程语言 Java C C# Javascript js Python Ruby Spring 程序 VB

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

Chinajoy 部分精选

Chinajoy 部分精选

姚奠中书法

姚奠中书法

印度诞生罕见双头女婴 “第二头颅”长在肚子上

印度诞生罕见双头女婴 “第二头颅”长在肚子上

60后大叔成功求婚90后萝莉

60后大叔成功求婚90后萝莉

香港团体再次发起反水货客游行 33人被捕

香港团体再次发起反水货客游行 33人被捕

中国超模

中国超模

北京电影学院表演系毕业照：美女纷纷自拍

北京电影学院表演系毕业照：美女纷纷自拍

香港生活成本世界最高底层人蜗居“棺材间”

香港生活成本世界最高底层人蜗居“棺材间”

幼儿园疑发劣质食物家长讨说法

幼儿园疑发劣质食物家长讨说法

厦门旅游海边夜拍（2）

厦门旅游海边夜拍（2）

您可能还喜欢

更多

非礼勿视！日本如此变态的成人文化

非礼勿视！日本如此变态的成人文化

乌克兰芭比娃美女

乌克兰芭比娃美女

NBA 新晋第一女神走红

NBA 新晋第一女神走红

美国成人展

美国成人展

美国罕见单羊膜双胞胎女婴牵手出生

美国罕见单羊膜双胞胎女婴牵手出生

深圳宝安机场一奔驰失控撞向行人致9死23伤

深圳宝安机场一奔驰失控撞向行人致9死23伤

美国小姐著比基尼参加水上排球大赛

美国小姐著比基尼参加水上排球大赛

车臣47岁已婚军阀逼婚17岁少女

车臣47岁已婚军阀逼婚17岁少女

尼泊尔四个月大婴儿震后22小时获救

尼泊尔四个月大婴儿震后22小时获救

悉尼海滩百人裸泳狂欢一丝不挂惊爆眼球

悉尼海滩百人裸泳狂欢一丝不挂惊爆眼球