网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

Python urllib和urllib2模块学习

浏览数：44 / 时间：2015年06月08日

Python标准库中有许多实用的工具类，但是在具体使用时，标准库文档上对使用细节描述的并不清楚，比如 urllib和urllib2 这个 HTTP 客户端库。这里总结了一些 urllib和urlib2 库的使用细节。

Python urllib 库提供了一个从指定的 URL 地址获取网页数据，然后对其进行分析处理，获取想要的数据。

一、urllib常用函数介绍：

1.　urlopen()函数：即创建一个类文件对象为指定的 url 来读取。

可以使用help(urllib.urlopen)查看函数说明。

urlopen(url, data=None, proxies=None)
Create a file-like object for the specified URL to read from.

urlopen返回一个类文件对象，它提供了如下方法：

read(),readline,readlines,fileno和close：这些方法的使用和文件对象一样；

info(): 返回一个httplib.HTTPMessage对象，表示远程服务器返回的头信息。

getcode():返回Http状态码，如果是http请求，200表示请求成功完成，404表示网址没有找到。

getutl: 返回请求的url地址。

示例：

>>>import urllib

>>>baidu = urllib.urlopen(‘http://www.baidu.com‘)

>>>baidu.read()

>>> print baidu.info()

输出：

Date: Fri, 24 Apr 2015 05:41:40 GMT
Server: Apache
Cache-Control: max-age=86400
Expires: Sat, 25 Apr 2015 05:41:40 GMT
Last-Modified: Tue, 12 Jan 2010 13:48:00 GMT
ETag: "51-4b4c7d90"
Accept-Ranges: bytes
Content-Length: 81
Connection: Close
Content-Type: text/html

>>>for line in baidu: #等价于read(),就像在操作本地文件，将网页数据打印出来。

　　　　print line,

　　baidu.close()

补充：

urllib.open的参数有特别要示，要遵循一些网络协议，比如http,ftp，也就是说在网址的开头必须要有http://或ftp://如：

　　urllib.urlopen(‘http://www.baidu.com‘)

　　urllib.urlopen(‘ftp://192.168.1.200‘)

若要使用本地文件，就需要在前面加filt关键字，如：

　　urllib.urlopen(‘file:nowangic.py‘)

　　urllib.urlopen(‘file:F:\test\helloworld.py‘)

2.　urlretrieve()函数：直接将远程数据下载到本地。

可以使用help(urllib.urlretvieve）查看函数说明

　　Help on function urlretrieve in module urllib:

　　urlretrieve(url, filename=None, reporthook=None, data=None)

参数 finename 指定了保存本地路径（如果参数未指定，urllib会生成一个临时文件保存数据。）
参数 reporthook 是一个回调函数，当连接上服务器、以及相应的数据块传输完毕时会触发该回调，我们可以利用这个回调函数来显示当前的下载进度。
参数 data 指 post 到服务器的数据，该方法返回一个包含两个元素的(filename, headers)元组，filename 表示保存到本地的路径，header 表示服务器的响应头。

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

Python urllib和urllib2模块学习

标签：编程语言 Java C C# Javascript js Python Ruby Spring 程序 VB

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

佛山14岁学生坠楼亡打赌跳对面宿舍失足

佛山14岁学生坠楼亡打赌跳对面宿舍失足

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

深圳宝安机场一奔驰失控撞向行人致9死23伤

深圳宝安机场一奔驰失控撞向行人致9死23伤

第十八届深港澳车展

第十八届深港澳车展

土耳其海滩

土耳其海滩

广州海陆空盛筵开场比基尼美女助阵

广州海陆空盛筵开场比基尼美女助阵

香港团体再次发起反水货客游行 33人被捕

香港团体再次发起反水货客游行 33人被捕

欧美比基尼精选

欧美比基尼精选

河南一男童走失半年再见成“干尸”

河南一男童走失半年再见成“干尸”

车模精选

车模精选

您可能还喜欢

更多

泰国地下女子裸体泰拳比赛照曝光

泰国地下女子裸体泰拳比赛照曝光

2014春南宁车展部分模特

2014春南宁车展部分模特

深圳小区现4层楼深大坑保安被吞噬亡

深圳小区现4层楼深大坑保安被吞噬亡

2014年安徽摔婴事件

2014年安徽摔婴事件

大学生全裸图书馆前静坐呼吁尊重身体

大学生全裸图书馆前静坐呼吁尊重身体

小众海滩试拍

小众海滩试拍

印度火车出轨已致34死150伤

印度火车出轨已致34死150伤

美国成人展

美国成人展

尼泊尔四个月大婴儿震后22小时获救

尼泊尔四个月大婴儿震后22小时获救

中山路人徒手接住空中坠落小孩

中山路人徒手接住空中坠落小孩