网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

关于网络爬虫与网站限制IP的思考

浏览数：146 / 时间：2015年06月09日

网络爬虫者和网站开发人员一直在玩着“潜伏”的游戏，开发人员需要火眼金睛，网络爬虫者需要72般变化，成功演绎一场攻防战。

作为网站后台开发人员，需要对恶意频繁访问的请求进行限制，甚至将请求IP拉入到黑名单，以免给网站带来大量的并发。

而对于网络爬虫者，为了获取查询数据结果，他们会尽量模仿真实用户的请求，防止被网站设别。
采取的方式有：
1、user agent 伪装和轮换，尽量模拟真实用户请求
2、使用多IP或者代理IP进行轮换
3、访问时间间隔设长一点，访问时间设置为随机数

当然，作为一个有良心的coder，如果能够通过正规途径来抓取网站数据（比如webservice），请采用正规途径，这样也可以得到网站的技术支持。如果需要线下来抓取，
则尽量把抓取频率降低些，一方面是防止网站后台识别；另一方面也是考虑网站的承受压力。毕竟如果真把别人惹毛了，人家随意一个程序修改，就可以让你的
程序前功尽弃，就如12306不断的更新就是恶意防止别个软件的访问。

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

关于网络爬虫与网站限制IP的思考

标签：网络爬虫网络爬虫

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

姚奠中书法

姚奠中书法

深圳小区现4层楼深大坑保安被吞噬亡

深圳小区现4层楼深大坑保安被吞噬亡

狠心母亲将两孩子扔进车流碾死

狠心母亲将两孩子扔进车流碾死

巴西男子头颈颠倒身残志坚

巴西男子头颈颠倒身残志坚

货车侧翻市民：不抢是傻子

货车侧翻市民：不抢是傻子

广州一男子当街拿刀杀死妻子暧昧对象

广州一男子当街拿刀杀死妻子暧昧对象

海南岛试拍

海南岛试拍

深圳宝安机场一奔驰失控撞向行人致9死23伤

深圳宝安机场一奔驰失控撞向行人致9死23伤

周杰伦的新婚妻子昆凌

周杰伦的新婚妻子昆凌

女子占座被指责飞踹老人

女子占座被指责飞踹老人

您可能还喜欢

更多

普京政敌、俄罗斯前副总理遭枪杀

普京政敌、俄罗斯前副总理遭枪杀

近代康生的书法

近代康生的书法

澳门赌场实拍美女

澳门赌场实拍美女

全球最贵劳斯莱斯SUV或定名“库利南”

全球最贵劳斯莱斯SUV或定名“库利南”

曝快播公司现大量警察员工只进不出

曝快播公司现大量警察员工只进不出

老人被轧躺倒路中间 9中学生合力救人将其送医

老人被轧躺倒路中间 9中学生合力救人将其送医

奥马巴儿时旧照

奥马巴儿时旧照

你见过这种饥荒吗？

你见过这种饥荒吗？

重庆街拍衣服买大了

重庆街拍衣服买大了

厦门旅游海边夜拍

厦门旅游海边夜拍