网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

HtmlParser 2.0 中文乱码问题

浏览数：51 / 时间：2015年06月09日

对于HTMLParser 2.0 工具包我们需要修改其中的Page.java文件使其适用中文的html文件分析。

主要是把protected static final String DEFAULT_CHARSET = "ISO-8859-1"；
修改成protected static final String DEFAULT_CHARSET = "gb2312"；

主要是兼容 charset = ‘GBK ‘声明的页面。

--因为采用默认的字符集"ISO-8859-1"对含有中文的html文件进行分析的时候就会出现乱码。必须进行new String(str.getBytes("ISO-8859-1")，"GB2312")的转换工作。

这样做比较麻烦。

对于修改好的htmlparser工具包，需要重新编译压缩成.jar文件，供项目调用。

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

HtmlParser 2.0 中文乱码问题

标签： java html 问题文件 ha static har 工作 set java html 问题文件 ha static har 工作 set

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

印象回到中国1993年

印象回到中国1993年

车臣47岁已婚军阀逼婚17岁少女

车臣47岁已婚军阀逼婚17岁少女

男子在背上刺《清明上河图》历时7天完成

男子在背上刺《清明上河图》历时7天完成

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

黄海波事件的女主角

黄海波事件的女主角

大海陪衬白色衣裙

大海陪衬白色衣裙

佛山14岁学生坠楼亡打赌跳对面宿舍失足

佛山14岁学生坠楼亡打赌跳对面宿舍失足

让人心灵震惊！你能坚持看到第几张？

让人心灵震惊！你能坚持看到第几张？

李嘉诚年轻中年时照片

李嘉诚年轻中年时照片

任由男子手触侧胸辣妹参加IT公司年会走红

任由男子手触侧胸辣妹参加IT公司年会走红

您可能还喜欢

更多

湖北砍小学生现场及凶手曝光

湖北砍小学生现场及凶手曝光

网红赵喵喵

网红赵喵喵

中戏艺考美女PK传媒艺考美女都百里挑一

中戏艺考美女PK传媒艺考美女都百里挑一

世界美女地图个个都十分美丽身材惹火性感

世界美女地图个个都十分美丽身材惹火性感

惠州海滩试拍

惠州海滩试拍

2014年Chinajoy精选

2014年Chinajoy精选

11岁女孩因抄作业被父亲发现吊打身亡

11岁女孩因抄作业被父亲发现吊打身亡

专业摄影师视野是与生俱来的

专业摄影师视野是与生俱来的

郭沫若书法

郭沫若书法

车模精选

车模精选