PHP的Unicode到ASCII

ICONV编码转换从UTF-8到ASCII，中文字符的问题 [问题点数：40分，结帖人finrod86921812] ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码）是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准，并等同于国际标准ISO/IEC 646。ASCII第一次以规范标准的类型发表是在1967年，最后一次更新则是在1986年，到目前为止共 ascii到unicode到utf-8 1.很久以前使用的是ascii:只有一个字节,也就是2的8次方,可以表示256个不同状态,电脑最初起源于美国,够用了,刚开始只是使用了127位,后来后面的部分被他们用来表示一些横线字符之类的128-255的扩展字符集. 2.后来传入中国,中国汉字太多了,ascii不够用,中国人就不承认扩展字符集了,而是没错从 ASCII 48开始到57 都表示数字 0到9 。 ASCII 97 到 122 表示小写字母 a 到 z 。比如：我们看到的字母 a ，其实计算机并不认识啥字母a , 她只认识 97。比对上面的 unicode 字节位表的第一列。为啥 PHP能用中文来做变量名。 PHP官方文档给的变量名正则 UTF-8 就是 Unicode Transformation Format-8，是 Unicode 的一种变换编码格式。 UTF-8 有以下特性: UCS 字符 U+0000 到 U+007F (ASCII) 被编码为字节 0x00 到 0x7F (ASCII 兼容). 这意味着只包含 7 位 ASCII 字符的文件在 ASCII 和 UTF-8 两种编码方式下是一样的.

用php的chr和ord函数实现字符串和ASCII码互转 - 相关文章

今天使PHP开发用到了Unicode的编码与解码，将unicode转为中文，再将中文转Unicode这样的操作是非常常见的，所以小编将这两个unicode中文互转函数给作为一个笔记保存起来，非常的博文来自：太平洋学习网www.tpyyes.com的博客 \ 没错从 ASCII 48开始到57 都表示数字 0到9 。 ASCII 97 到 122 表示小写字母 a 到 z 。比如：我们看到的字母 a ，其实计算机并不认识啥字母a , 她只认识 97。比对上面的 unicode 字节位表的第一列。为啥 PHP能用中文来做变量名。 PHP官方文档给的变量名正则例如“汉”字的Unicode编码是6C49。 6C49在0800-FFFF之间，所以肯定要用3字节模板了：1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是：0110 110001 001001，用这个比特流依次代替模板中的x，得到：11100110 10110001 10001001，即E6 B1 89。今天使PHP开发用到了Unicode的编码与解码，将unicode转为中文，再将中文转Unicode这样的操作是非常常见的，所以小编将这两个unicode中文互转函数给作为一个笔记保存起来，非常的简单，会用就行了。

但是，你试着写的不是unicode; 你采取unicode并自己编码iso-8859-1。这就是unicode.encode方法所做的，并且编码unicode字符串的结果是字节字符串（str类型。）你应该使用正常的open()并自己编码unicode，或者（通常更好的想法）使用codecs.open()并且不自己编码数据。

浅析PHP中的UNICODE 编码与解码例如在ASCII编码中，用数字97表达字符‘a‘与字符集相对应，常见的字符编码有ASCII，GBK，GB18030，Unicode等。两位共可以表示16*16=256个数，即可以表示2^8=2568位的二进制数可以表示的数。再注意到‘\u4e2d\u6587‘直接输出和print都会 ascii编码是鼻祖了，不过由于ascii只有8bits，而且实际上用到的是7位，所以能表示的只有128个字符（00000000~01111111）。这128个字符包括了可打印的普通字符，也包括了不可打印的命令字符。看下表。 unicode与ascii的区别最早只有127个字母被编码到计算机里，也就是大小写英文字母、数字和一些符号，这个编码表被称为ascii编码，比如大写字母a的编码是65，小写字母z的编码是122。但是要处理中文显然一个字节是不够的，至少需要两个字节，而且还不能和ascii编码冲突，所以，中国制定了gb2312编码今天使PHP开发用到了Unicode的编码与解码，将unicode转为中文，再将中文转Unicode这样的操作是非常常见的，所以小编将这两个unicode中文互转函数给作为一个笔记保存起来，非常的博文来自：太平洋学习网www.tpyyes.com的博客 \ 也罢，找不到的话就自己实现一下了。。。 Unicode和Utf-8编码的区别. Unicode是一个字符集，而UTF-8是Unicode的其中一种，Unicode是定长的都为双字节，而UTF-8是可变的，对于汉字来说Unicode占有的字节比UTF-8占用的字节少1个字节。Unicode为双字节，而UTF-8中汉字占三个字节。

ascii 是一种字符集,包括大小写的英文字母、数字、控制字符等，它用一个字节表示，范围是 -127unicode分为utf-8和utf-16。utf-8变长度的，最多 6 个字节，小于 127 的字符用一个字节表示，与 ascii 字符集的结果一样，ascii 编码下的英语文本不需要修改就可以当作 utf-8 编码进行处理。

UTF-8（8-bit Unicode Transformation Format）是一种针对Unicode的可变长度字符编码，又称万国码，由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码Unicode字符。用在网页上可以统一页面显示中文简体在线ASCII编码解码 - 码工具在线ASCII编码解码，ASCII代码转换. 工具简介. 本工具主要用于各类代码中各类本地字符的Unicode转换，可以将整个代码直接拷入转换，如果勾选“不转换字母和数字”复选框，系统将自动跳过字母、数字与字符。

非unicode官方的utf编码还有utf-7，主要用于邮件传输。utf-8的单字节部分是和iso-8859-1兼容的，这主要是一些旧的系统和库函数不能正确处理utf-16而被迫出来的，而且对英语字符来说，也节省保存的文件空间（以非英语字符浪费空间为代价）。

html 字符集要正确显示一个 html 页面，浏览器必须知道要使用的字符集（字符编码）。 html 字符集在 html 中，正确的字符编码是什么？ html5 中默认的字符编码是 utf-8。这并非总是如此。早期网络的字符编码是 ascii 码。后来，从 html 2.0 到 html 4.01，iso-8859-1 被认定为标准。 UTF-8（ 8-bit Unicode Transformation Format ）是一种针对Unicode的可变长度字符编码，也是一种前缀码。它可以用一至四个字节对Unicode字符集中的所有有效编码点进行编码，属于Unicode标准的一部分，最初由肯·汤普逊和罗布·派克提出。由于较小值的编码点一般使用频率较高，直接使用Unicode编码效率低下 idea查看properties中文变成unicode码如何解决,在使用idea打开项目文件的时候，如果项目中包含有roertie配置文件的时候，打开往往默认会显示成uicode编码，而不到中文，其实是可以设置下，就可以显示成中文的