关于编码方式

编码

将人类语言解释为机器语言的一种关系映射

常见编码方式

ASCII

128个
0-31控制字符、换行、删除、回车
32-126打印字符

ISO8859-1

在ASCII上 加上了大多数修语言字符、256个字符 

{———-}
GB2312

信息交换用汉字编码字符集基本集、双字节编码、
A1-A9 符号区
B0-F7 汉字区

GBK

汉字内码扩展规范
对GB2312扩展
编码范围 8140-FEFE 与GB2312兼容

GB18030

数字交换用汉字编码字符集
单字节、双字节、四字节、与GB2312兼容

UTF-16

Unicode字符集的存取方法
使用2字节标识Unicode转化格式、定长表示

UTF-8
边长字符集、1-6个字节
涵盖了所有各国字符编码

UTF-8mb4

在UTF8基础上 增加了表情字符