foreach(unpack( ‘n*’, mb_convert_encoding(‘你好’, ‘unicode’, ‘gbk’) ) as $i) { echo ‘\u’,dechex($i); } 回复 ↓
* 0xxxxxxx (00-7f) * 110xxxxx 10xxxxxx (c0-df)(80-bf) * 1110xxxx 10xxxxxx 10xxxxxx (e0-ef)(80-bf)(80-bf) * 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx (f0-f7)(80-bf)(80-bf) 回复 ↓
UTF是一种变长的编码,它的字节数是不固定的,使用第一个字节确定字节数。第一个字节首为0即一个字节,110即2字节,1110即3字节,字符后续 字节都用10开始,这样不会混淆且单字节英文字符可仍用ASCII编码 回复 ↓
foreach(unpack(
‘n*’,
mb_convert_encoding(‘你好’, ‘unicode’, ‘gbk’)
) as $i) {
echo ‘\u’,dechex($i);
}
http://topic.csdn.net/u/20100607/15/5d2f4993-7789-44a3-986b-ba011ffb78ba.html
http://stallman.blogbus.com/logs/41709878.html
* 0xxxxxxx (00-7f)
* 110xxxxx 10xxxxxx (c0-df)(80-bf)
* 1110xxxx 10xxxxxx 10xxxxxx (e0-ef)(80-bf)(80-bf)
* 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx (f0-f7)(80-bf)(80-bf)
http://hi.baidu.com/loveyoursmile/blog/item/671afcdc771d91a7cd11662f.html
UTF是一种变长的编码,它的字节数是不固定的,使用第一个字节确定字节数。第一个字节首为0即一个字节,110即2字节,1110即3字节,字符后续 字节都用10开始,这样不会混淆且单字节英文字符可仍用ASCII编码
http://stallman.blogbus.com/logs/41737425.html