编码
将人类语言解释为机器语言的一种关系映射
常见编码方式
ASCII
128个
0-31控制字符、换行、删除、回车
32-126打印字符
ISO8859-1
在ASCII上 加上了大多数修语言字符、256个字符
{———-}
GB2312
信息交换用汉字编码字符集基本集、双字节编码、
A1-A9 符号区
B0-F7 汉字区
GBK
汉字内码扩展规范
对GB2312扩展
编码范围 8140-FEFE 与GB2312兼容
GB18030
数字交换用汉字编码字符集
单字节、双字节、四字节、与GB2312兼容
UTF-16
Unicode字符集的存取方法
使用2字节标识Unicode转化格式、定长表示
UTF-8
边长字符集、1-6个字节
涵盖了所有各国字符编码
UTF-8mb4
在UTF8基础上 增加了表情字符