网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

使用wget工具抓取网页和图片

浏览数：72 / 时间：2015年06月09日

使用wget工具抓取网页和图片：

包括css\js\html\图片文件

wget -e robots=off -w 1 -xq -np -nH -pk -m  -t 1 -P "$PATH" "$URL"

这里robots=off是因为wget默认会根据网站的robots.txt进行操作，如果robots.txt里是User-agent: * Disallow: /的话，wget是做不了镜像或者下载目录的

-e 用来执行额外的.wgetrc命令，会在.wgetrc中所有命令之后执行，因此会覆盖.wgetrc中相同的配置项。

-w seconds 资源请求下载之间的等待时间（减轻服务器的压力）

-x 创建镜像网站对应的目录结构

-q 静默下载，即不显示下载信息，你如果想知道wget当前在下载什么资源的话，可以去掉这个选项

-np 只下载给定URL下的内容，不下载它的上级内容

-nH 禁止wget以接收的URL为名称创建文件夹

-p 下载有关页面需要用到的所有资源，包括图片和css样式

-k 将绝对路径转换为相对路径（这个很重要，为了在用户打开网页的时候，加载的相关资源都在本地寻找）

-m 它会打开镜像相关的选项，比如无限深度的子目录递归下载

-t times 某个资源下载失败后的重试下载次数

-P 下载到哪个路径,，没有的话，wget会帮你自动创建

示例：

技术分享

抓取的成果：

技术分享

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

使用wget工具抓取网页和图片

标签：使用wget工具抓取网页和图片使用wget工具抓取网页和图片

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

美女翻译头戴发卡清纯小清新

美女翻译头戴发卡清纯小清新

你见过这种饥荒吗？

你见过这种饥荒吗？

泰国平潭岛旅游

泰国平潭岛旅游

北京车展美女礼仪一览

北京车展美女礼仪一览

周杰伦的新婚妻子昆凌

周杰伦的新婚妻子昆凌

姚奠中书法

姚奠中书法

广州一男子当街拿刀杀死妻子暧昧对象

广州一男子当街拿刀杀死妻子暧昧对象

老人被轧躺倒路中间 9中学生合力救人将其送医

老人被轧躺倒路中间 9中学生合力救人将其送医

第十八届深港澳车展

第十八届深港澳车展

工藤美樱写真集

工藤美樱写真集

您可能还喜欢

更多

近代康生的书法

近代康生的书法

范曾书法部分展览

范曾书法部分展览

惠州海滩试拍

惠州海滩试拍

越战结束40年裂痕犹在：越南仍未实现南北和解

越战结束40年裂痕犹在：越南仍未实现南北和解

斯米兰海水是真不错

斯米兰海水是真不错

长春刘老根大舞台不雅泥塑被拆

长春刘老根大舞台不雅泥塑被拆

海南岛试拍

海南岛试拍

2014年Chinajoy精选

2014年Chinajoy精选

超模刘雯

超模刘雯

伊拉克40年来首次选美：第一张就被惊艳了

伊拉克40年来首次选美：第一张就被惊艳了