通过http.client解析url返回的数据时为什么中文变成了unicode码

发布时间：2023-09-06 01:21责任编辑：郭大石关键词：url http

今天在解析json数据的时候得到了一堆这样的数据：{"errNum":0,"errMsg":"success","retData":[{"title":"\u6536\u5e9f\u54c1\u5927\u53d4\u521a\u4e0a\u53f0\uff0c\u5c31\u60e8\u906d\u8bc4\u59d4\u706d\u706f\uff0c\u4f46\u63a5\u4e0b\u6765\u5168\u573a\u90fd\u9707\u60ca\u4e86\uff01","url":"http:\/\/toutiao.com\/group\/6263036756505920002\/","abstract":"\u8ba2\u9605\u6211\u83b7\u53d6\u66f4\u591a\u7cbe\u5f69\u5185\u5bb9\uff01","image_url":"http:\/\/p1.pstatp.com\/list\/2f90009a31a7ee8bb15"}]}

这是因为，为了更好的传输中文，json进行了Unicode编码。

这样一来，我们在解析json之前，就得要先将json数据中的Unicode编码转换为我们使用的中文；

一：http请求数据返回json中string字段包含unicode的转码

[java] view plain copy

publicstaticStringdecodeUnicode(StringtheString){
charaChar;
intlen=theString.length();
StringBufferoutBuffer=newStringBuffer(len);
for(intx=0;x<len;){
aChar=theString.charAt(x++);
if(aChar==‘\\‘){
aChar=theString.charAt(x++);
if(aChar==‘u‘){
//Readthexxxx
intvalue=0;
for(inti=0;i<4;i++){
aChar=theString.charAt(x++);
switch(aChar){
case‘0‘:
case‘1‘:
case‘2‘:
case‘3‘:
case‘4‘:
case‘5‘:
case‘6‘:
case‘7‘:
case‘8‘:
case‘9‘:
value=(value<<4)+aChar-‘0‘;
break;
case‘a‘:
case‘b‘:
case‘c‘:
case‘d‘:
case‘e‘:
case‘f‘:
value=(value<<4)+10+aChar-‘a‘;
break;
case‘A‘:
case‘B‘:
case‘C‘:
case‘D‘:
case‘E‘:
case‘F‘:
value=(value<<4)+10+aChar-‘A‘;
break;
default:
thrownewIllegalArgumentException(
"Malformed\\uxxxxencoding.");
}
}
outBuffer.append((char)value);
}else{
if(aChar==‘t‘)
aChar=‘\t‘;
elseif(aChar==‘r‘)
aChar=‘\r‘;
elseif(aChar==‘n‘)
aChar=‘\n‘;
elseif(aChar==‘f‘)
aChar=‘\f‘;
outBuffer.append(aChar);
}
}else
outBuffer.append(aChar);
}
returnoutBuffer.toString();
}

二、普通string含有unicode转码方法

thrownewRuntimeException(e);

}

returnstr;

}

三、说一下比较奇怪的方案，测试中无意发现的，暂时没弄明白原理（有明白原理的大神，请告知一声，谢谢）

我用HttpClent的post方式获取的json数据，得到的是带Unicode码的数据，需要转换成中文才行，但是转换的时间感觉有点长，就用HttpURLConnection的get方式又试了一下，在不转码的情况下，经过gson解析后，竟然神奇的自动转换成了中文：

简直是太神奇了，而且需要的时间相对于HttpClient的post请求方式的请求和处理时间更短，所以，果断换用HttpURLConnection的get方式了

①现在先贴一下HttpURLConnection的get的方式：

[java] view plain copy

@Test
publicvoidtest(){
try{
longstart=System.currentTimeMillis();
URLurl=newURL("http://apis.baidu.com/songshuxiansheng/news/news");
HttpURLConnectionconnection=(HttpURLConnection)url.openConnection();
connection.addRequestProperty("apikey","0fc807e45a37ce264f45d169646f4a9e");
StringdataString=newString(GsonTools.IsToByte(connection.getInputStream()),"utf-8");
HeadlineJsonnewsJson=GsonTools.getObjectData(dataString,HeadlineJson.class);
List<Headline>list=newsJson.getRetData();
System.out.println(list.toString());
longend=System.currentTimeMillis();
System.out.println("timeGap:"+(end-start));
}catch(Exceptione){
//TODOAuto-generatedcatchblock
e.printStackTrace();
}
}

调用的GsonTools的方法：（之前的博文中有写到过）

[java] view plain copy

publicstatic<T>TgetObjectData(StringjsonString,Class<T>type){
Tt=null;
try{
Gsongson=newGson();
t=gson.fromJson(jsonString,type);
}catch(JsonSyntaxExceptione){
//TODOAuto-generatedcatchblock
e.printStackTrace();
}
returnt;
}

②然后贴一下HttpClient的post方式：

[java] view plain copy

@Test
publicvoidTestHeadLine(){
longstart=System.currentTimeMillis();
List<NameValuePair>params=newArrayList<NameValuePair>();
Stringurl="http://apis.baidu.com/songshuxiansheng/news/news";
StringjsonString=HttpUtils.getBaiDuString2(url,params);
HeadlineJsonlineJson=GsonTools.getObjectData(jsonString,HeadlineJson.class);
System.out.println(lineJson.toString());
longend=System.currentTimeMillis();
System.out.println("timeGap:"+(end-start));
}

调用的HttpUtils的方法：

[java] view plain copy

publicstaticStringgetBaiDuString(Stringurl,List<NameValuePair>params){
StringserverDataString=null;
HttpPostpost=newHttpPost(url);
try{
post.setEntity(newUrlEncodedFormEntity(params,HTTP.UTF_8));
post.addHeader("apikey",UrlUtils.BAIDU_API_KEY);
HttpClientclient=newDefaultHttpClient();
HttpResponseresponse=client.execute(post);
intcode=response.getStatusLine().getStatusCode();
System.out.println("StatusCode:"+code);
if(code==200){
serverDataString=decodeUnicode(EntityUtils.toString(response.getEntity()));
//serverDataString=EntityUtils.toString(response.getEntity());
System.out.println("接收字符串数据成功\nServerData:"+serverDataString);
}
}catch(Exceptione){
//TODOAuto-generatedcatchblock
e.printStackTrace();
}
returnserverDataString;
}

③调用的HttpClient的get方式

[java] view plain copy

publicstaticStringgetBaiDuString2(Stringurl,List<NameValuePair>params){
StringserverDataString=null;
HttpGetget=newHttpGet(url);
try{get.addHeader("apikey",UrlUtils.BAIDU_API_KEY);
HttpClientclient=newDefaultHttpClient();
HttpResponseresponse=client.execute(get);
intcode=response.getStatusLine().getStatusCode();
System.out.println("StatusCode:"+code);
if(code==200){
//serverDataString=decodeUnicode(EntityUtils.toString(response.getEntity()));
serverDataString=EntityUtils.toString(response.getEntity());
System.out.println("接收字符串数据成功\nServerData:"+serverDataString);
}
}catch(Exceptione){
//TODOAuto-generatedcatchblock
e.printStackTrace();
}
returnserverDataString;
}

谷歌提供的HttpClient的通信和HttpURLConnection网络通信的时间间隔我也做了比较，明显，HttpURLConnection的请求时间更短，所以果断使用HttpURLConnection的方式

四、java中本身就提供了对Unicode 的url进行解码的方法了：

[java] view plain copy

System.out.println(URLDecoder.decode("\u82f9\u679c","utf-8"));

通过http.client解析url返回的数据时为什么中文变成了unicode码

原文地址：http://www.cnblogs.com/qianzf/p/7750761.html

通过http.client解析url返回的数据时为什么中文变成了unicode码

知识推荐