HttpClient 乱码
使用HttpClient抓取网页,一直乱码,发现字符编码是gb2312。一直怀疑自己的编码设置错误,一直不停的尝试去换编码。却不得结果。
在跟踪页面返回的头信息的时候如果发现:
Content-Encoding :gzip
原来启动了文件压缩。所以要先解压流信息: GzipDecompressingEntity zipRes = new GzipDecompressingEntity(response.getEntity());
查询资料得知:
GzipDecompressingEntity zipRes = new GzipDecompressingEntity(response.getEntity());
String s = EntityUtils.toString(zipRes, "gb2312");
done!!搞定
郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。