扫码关注官方订阅号
Java的char型变量中能不能存贮一个中文汉字?为什么?
人生最曼妙的风景,竟是内心的淡定与从容!
java内部其实是使用的UTF-16的编码,所以是支持大部分非生僻汉字的。
UTF-16
上面那个文档的意思是说java不能支持世界上全部的文字,如果你用的字母不在这个UTF-16的标准里,那么程序会出错,所以你需要自己采用补增字符的方式解决。
不知道给出oracle官方连接那哥们写没写过这样的代码
public String getRandomChar(){ char[] arr = {'一','二','三','四'....}; ...... return "" + arr[random1] + arr[random2] +arr[random3]; } ... main{ ...... System.out.Println("请输入以下验证码"+ getRandomChar()); ...... }
unicode 并不是一个具体的字符集,而是一类标准。其中包含好几种具体的字符集,有
unicode
定长,双字节表示一个字符的: UTF-16;
定长,四字节表示一个字符的: UTF-32;
UTF-32
不定长,1-4个字节表示一个字符的:UTF-8; (英语一般一个字节,汉字一般三个字节,特殊的生僻字四个字节)。
UTF-8
所以请不要一张嘴就说 双字节不支持unicode编码。
java的char可以存放两个字节,可以存储一个中文
char ch='汉'; System.out.println(ch);
像这样是可以的
首先 大部分的汉字是可以用一个char表示的。Unicode 好像是1994年正式公布 那年头2个byte大概65536个字是够用的 就是utf-16。但计算机是全人类的,所以后来又加入了很多其他语言,于是2个byte不够用了。后来就用4个byte表示。 于是就有了utf-32但这货太大于是就有了utf-8,他本着能少用字节就少用的原则。而java在1.5以后也发现了这个问题所以有些字符必须用俩个char表示.链接描述
微信扫码关注PHP中文网服务号
QQ扫码加入技术交流群
Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号
PHP学习
技术支持
返回顶部
java内部其实是使用的
UTF-16的编码,所以是支持大部分非生僻汉字的。上面那个文档的意思是说java不能支持世界上全部的文字,如果你用的字母不在这个
UTF-16的标准里,那么程序会出错,所以你需要自己采用补增字符的方式解决。不知道给出oracle官方连接那哥们写没写过这样的代码
额外知识补充
unicode并不是一个具体的字符集,而是一类标准。其中包含好几种具体的字符集,有
定长,双字节表示一个字符的:
UTF-16;定长,四字节表示一个字符的:
UTF-32;不定长,1-4个字节表示一个字符的:
UTF-8; (英语一般一个字节,汉字一般三个字节,特殊的生僻字四个字节)。所以请不要一张嘴就说 双字节不支持unicode编码。
java的char可以存放两个字节,可以存储一个中文
像这样是可以的
首先 大部分的汉字是可以用一个char表示的。
Unicode 好像是1994年正式公布 那年头2个byte大概65536个字是够用的 就是utf-16。
但计算机是全人类的,所以后来又加入了很多其他语言,于是2个byte不够用了。
后来就用4个byte表示。 于是就有了utf-32但这货太大于是就有了utf-8,他本着能少用字节就少用的原则。
而java在1.5以后也发现了这个问题所以有些字符必须用俩个char表示.
链接描述