网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

BeautifulSoup解决中文网页乱码

浏览数：44 / 时间：2015年06月09日

以下代码，在执行结果中的中文出现乱码。

from bs4 import BeautifulSoup
import urllib2

request = urllib2.Request(‘http://www.163.com‘)
response = urllib2.urlopen(request)
html_doc = response.read()
soup = BeautifulSoup(html_doc)

print soup.find_all(‘a‘)

因为中文页面编码是gb2312，gbk，在BeautifulSoup构造器中传入from_encoding = "gb18030"参数可解决乱码问题。

注：在BeautifulSoup3中，from_encoding需修改为fromEncoding。

from bs4 import BeautifulSoup
import urllib2

request = urllib2.Request(‘http://www.163.com‘)
response = urllib2.urlopen(request)
html_doc = response.read()
soup = BeautifulSoup(html_doc, from_encoding = "gb18030")

print soup.find_all(‘a‘)

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

BeautifulSoup解决中文网页乱码

标签： class style 代码 com log html 问题 http la class style 代码 com log html 问题 http la

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

7080后儿时集体回忆插画

7080后儿时集体回忆插画

Cara Delevingne 选集

Cara Delevingne 选集

乌克兰美女领导克里米亚辛菲罗波尔

乌克兰美女领导克里米亚辛菲罗波尔

北京车展美女礼仪一览

北京车展美女礼仪一览

1927年第五次索尔维物理会议

1927年第五次索尔维物理会议

刘雯秀场新造型太震撼，两条带子做衣服太时髦，肩部“凹凸不平”

刘雯秀场新造型太震撼，两条带子做衣服太时髦，肩部“凹凸不平”

车臣47岁已婚军阀逼婚17岁少女

车臣47岁已婚军阀逼婚17岁少女

海南岛试拍

海南岛试拍

巴西男子头颈颠倒身残志坚

巴西男子头颈颠倒身残志坚

深圳富豪轰动澳洲买豪宅开派对会巨星

深圳富豪轰动澳洲买豪宅开派对会巨星

您可能还喜欢

更多

60后大叔成功求婚90后萝莉

60后大叔成功求婚90后萝莉

NBA 新晋第一女神走红

NBA 新晋第一女神走红

国外甜美金发MM

国外甜美金发MM

大学生全裸图书馆前静坐呼吁尊重身体

大学生全裸图书馆前静坐呼吁尊重身体

韩国票选亚洲最美女神排行榜

韩国票选亚洲最美女神排行榜

男子在背上刺《清明上河图》历时7天完成

男子在背上刺《清明上河图》历时7天完成

冷艳与纯真的美女艺术照

冷艳与纯真的美女艺术照

第十八届深港澳车展

第十八届深港澳车展

泰国平潭岛旅游

泰国平潭岛旅游

美女翻译头戴发卡清纯小清新

美女翻译头戴发卡清纯小清新