使用java.net.URLDecoder获取请求中的中文字符

在web中使用java.net.URLDecoder可以帮助我们解决中文乱码的问题。

JDK手册中的定义如下:

public class URLDecoderextends ObjectHTML
它是格式解码的实用工具类。该类包含了将 String 从 application/x-www-form-urlencoded MIME 格式解码的静态方法。 
该转换过程正好与 URLEncoder 类使用的过程相反。假定已编码的字符串中的所有字符为下列之一:"a" 到 "z"、"A" 到 "Z"、"0" 到 "9" 和 "-"、"_"、"." 以及 "*"。允许有 "%" 字符,但是将它解释为特殊转义序列的开始。 
转换中使用以下规则: 
字母数字字符 "a" 到 "z"、"A" 到 "Z" 和 "0" 到 "9" 保持不变。 
特殊字符 "."、"-"、"*" 和 "_" 保持不变。 
加号 "+" 转换为空格字符 " "。 
将把 "%xy" 格式序列视为一个字节,其中 xy 为 8 位的两位十六进制表示形式。然后,所有连续包含一个或多个这些字节序列的子字符串,将被其编码可生成这些连续字节的字符所代替。可以指定对这些字符进行解码的编码机制,或者如果未指定的话,则使用平台的默认编码机制。 
该解码器处理非法字符串有两种可能的方法。一种方法是不管该非法字符,另一种方法是抛出 IllegalArgumentException 异常。解码器具体采用哪种方法取决于实现。

它的构造方法为URLDecoder()
方法有两个
1.static String decode(String s) 
这个方法已过时。 结果字符串可能因平台默认编码不同而不同。因此,改用 decoe(String,String) 方法指定编码。 
2.static String decode(String s, String enc) 
使用指定的编码机制对 application/x-www-form-urlencoded 字符串解码。 
轻重s表示要解码的String,enc表示所支持的字符编码的名称。

返回值为新解码的String


实例如下:

form.jsp的文件的内容如下:

<%@ page contentType="text/html; charset=GBK" language="java" errorPage="" %>
<html>

<head>
<title> 收集参数的表单页 </title>
<meta name="website" content="http://www.crazyit.org" />
</head>
<body>
<form id="form1" method="get" action="getrequest.jsp">
<input type="text" name="name"/>
<input type="submit" value="提交">
</form>
</body>
</html>

上面的程序中只有一个输入框和一个提交的表单。

getrequest.jsp的文件的内容如下:

<%@page import="java.net.URLDecoder"%>
<%@ page language="java" import="java.util.*" pageEncoding="utf-8"%>
<html>
  <head>
    <base href="<%=basePath%>">
    <title>My JSP ‘form1Request.jsp‘ starting page</title>
  </head>
  <body>
       <%
           String str = request.getQueryString();
           out.println("原始的查询字符串为:"+str);
           String temp = URLDecoder.decode(str, "gbk");
           out.println("解码后的查询字符串为"+temp);
        %>
  </body>
</html>

在浏览器执行的结果如下:

原始的查询字符串为:name=%D6%D0%BB%AA%C8%CB%C3%F1%B9%B2%BA%CD%B9%FA 

解码后的查询字符串为name=中华人民共和国



郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。