HttpClient 乱码

  1. 使用HttpClient抓取网页,一直乱码,发现字符编码是gb2312。一直怀疑自己的编码设置错误,一直不停的尝试去换编码。却不得结果。

  2. 在跟踪页面返回的头信息的时候如果发现:

        Content-Encoding :gzip

       原来启动了文件压缩。所以要先解压流信息: GzipDecompressingEntity zipRes = new GzipDecompressingEntity(response.getEntity());

 查询资料得知:

GzipDecompressingEntity zipRes = new GzipDecompressingEntity(response.getEntity());

String s = EntityUtils.toString(zipRes, "gb2312");

done!!搞定

   


郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。