网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

用 python 或者curl 抓取web数据时

浏览数：29 / 时间：2015年06月08日

　　今天接到一个web的同事求助，他本来通过java抓取一个web页面的内容，但是发现抓取得都是些乱码，然后又尝试用 python的urllib来获取，依然是乱码，不过在浏览器访问却是正常的json格式数据。

　　首先，我先用curl获取了下这个web，发现确实是一些不可见的字符，把它保存下来。

　　再使用浏览器获取下这个web内容，对比下发现字节数是不一样的，说明不是编码显示的问题。

　　这个时候我考虑可能是http协议参数的问题，于是使用wireshark捕获用浏览器的请求，用tcpdump捕获了curl的请求，通过对比http get请求参数发现，在curl访问的时候有一项Content-Encoding:gzip，推断难道是使用gzip压缩了？

　　使用gzip命令把刚才通过curl命令获取的web数据解压下... 果然是这样...问题解决。

　　对web不是很了解的我，觉得还挺有意思的...

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

用 python 或者curl 抓取web数据时

标签：编程语言 Java C C# Javascript js Python Ruby Spring 程序 VB

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

桂林旅游实拍

桂林旅游实拍

小偷刺业主3刀民警赶到时躺地上装死

小偷刺业主3刀民警赶到时躺地上装死

广西办首届"校花校草大赛" 颜值不忍直视

广西办首届"校花校草大赛" 颜值不忍直视

米兰时装周火辣上演美模抱萌娃走秀场面温馨

米兰时装周火辣上演美模抱萌娃走秀场面温馨

杰布·布什宣布参加2016年美国总统大选

杰布·布什宣布参加2016年美国总统大选

泰国地下女子裸体泰拳比赛照曝光

泰国地下女子裸体泰拳比赛照曝光

刘亦菲神仙姐姐十年颜值一直在线

刘亦菲神仙姐姐十年颜值一直在线

狠心母亲将两孩子扔进车流碾死

狠心母亲将两孩子扔进车流碾死

阿富汗发生山体滑坡或造成2700人死亡

阿富汗发生山体滑坡或造成2700人死亡

重庆街拍衣服买大了

重庆街拍衣服买大了

您可能还喜欢

更多

沈鹏书法欣赏

沈鹏书法欣赏

印象回到中国1993年

印象回到中国1993年

尼泊尔四个月大婴儿震后22小时获救

尼泊尔四个月大婴儿震后22小时获救

广西桂平石龙镇的5月22日车祸事故

广西桂平石龙镇的5月22日车祸事故

印度强奸犯被民众绑架游街杀害

印度强奸犯被民众绑架游街杀害

车模精选

车模精选

实拍明代干尸开棺全过程(图)

实拍明代干尸开棺全过程(图)

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

2014春南宁车展部分模特

2014春南宁车展部分模特

国外甜美金发MM

国外甜美金发MM