Java String编码转换(转自http://blog.csdn.net/okman1214/article/details/4397772)-白红宇

Java String编码转换(转自http://blog.csdn.net/okman1214/article/details/4397772)

阅读量：7071 次

发布时间：2019-06-28

本文共 2440 字，大约阅读时间需要 8 分钟。

String newStr = new

String(oldStr.getBytes(), "UTF-8");

java中的

String类是按照unicode进行编码的，当使用

String(byte[] bytes,

String encoding)构造字符串时，encoding所指的是bytes中的数据是按照那种方式编码的，而不是最后产生的

String是什么编码方式，换句话说，是让系统把bytes中的数据由encoding编码方式转换成unicode编码。如果不指明，bytes的编码方式将由jdk根据操作系统决定。

当我们从文件中读数据时，最好使用InputStream方式，然后采用

String(byte[] bytes,

String encoding)指明文件的编码方式。不要使用Reader方式，因为Reader方式会自动根据jdk指明的编码方式把文件内容转换成unicode 编码。

当我们从数据库中读文本数据时，采用ResultSet.getBytes()方法取得字节数组，同样采用带编码方式的字符串构造方法即可。

ResultSet rs;

bytep[] bytes = rs.getBytes();

String str = new

String(bytes, "gb2312");

不要采取下面的步骤。

ResultSet rs;

String str = rs.getString();

str = new

String(str.getBytes("iso8859-1"), "gb2312");

这种编码转换方式效率底。之所以这么做的原因是，ResultSet在getString()方法执行时，默认数据库里的数据编码方式为 iso8859-1。系统会把数据依照iso8859-1的编码方式转换成unicode。使用str.getBytes("iso8859-1")把数据还原，然后利用new

String(bytes, "gb2312")把数据从gb2312转换成unicode，中间多了好多步骤。

从HttpRequest中读参数时，利用reqeust.setCharacterEncoding()方法设置编码方式，读出的内容就是正确的了。

转:http://www.blogjava.net/rabbit/archive/2008/03/27/189009.html

pageEncoding是jsp文件本身的编码

contentType的charset是指服务器发送给客户端时的内容编码

JSP要经过两次的“编码”，第一阶段会用pageEncoding，第二阶段会用utf-8至utf-8，第三阶段就是由Tomcat出来的网页，用的是contentType。

第一阶段是jsp编译成.java，它会根据pageEncoding的设定读取jsp，结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码（即.java），如果pageEncoding设定错了，或没有设定，出来的就是中文乱码。

第二阶段是由JAVAC的JAVA源码至java byteCode的编译，不论JSP编写时候用的是什么编码方案，经过这个阶段的结果全部是UTF-8的encoding的java源码。

网络上传输数据，都是以二进制流发送的吧

/**

@param

args

public

static

void main(String[] args) {

TODO Auto-generated method stub

byte[] bytes8859;

byte[] bytesgbk;

byte[] bytesutf8;

try {

bytes8859 = "中国".getBytes("iso-8859-1");

bytesgbk = "中国".getBytes("gbk");

bytesutf8 = "中国".getBytes("utf-8");

for (

byte b : bytes8859) {

System.out.println(b);

}

System.out.println(

new String(bytes8859, "utf-8"));

System.out.println("--------------------------------------------------");

for (

byte b : bytesgbk) {

System.out.println(b);

}

System.out.println(

new String(bytesgbk, "utf-8"));

System.out.println("--------------------------------------------------");

for (

byte b : bytesutf8) {

System.out.println(b);

}

System.out.println(

new String(bytesutf8, "utf-8"));

}

catch (UnsupportedEncodingException e) {

TODO Auto-generated catch block

e.printStackTrace();

}

结果：

--------------------------------------------------

-42

-48

-71

-6

?й?

--------------------------------------------------

-28

-72

-83

-27

-101

-67

中国

转载于:https://www.cnblogs.com/talk/archive/2012/04/27/2473122.html

你可能感兴趣的文章

GOlang eclipse install

App Store优化推广如何提高海外搜索排名

查看>>

POJ3580 SuperMemo(Splay的区间操作)

hdu 4001 To Miss Our Children Time( sort + DP )

查看>>

日常note

查看>>

Leetcode 727. Minimum Window Subsequence

查看>>

java切换jdk版本

查看>>

hdu 1005 Number Sequence zoj 1105

查看>>

VLAN

查看>>

Oracle12c 性能优化攻略：攻略1-2：创建具有最优性能的表空间

查看>>

yum install 报错[Errno 14] curl#37 - Couldn't open file /mnt/repodata/repomd.xml

查看>>

box-sizeing

查看>>

bzoj 3669 [Noi2014]魔法森林