You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

14 lines
817 B

  1. # 进制和编码
  2. 1. 计算机上所有的东西最终都会转换成为二进制再去运行。
  3. 2. ascii编码、unicode字符集、utf-8编码本质上都是字符与二进制的关系。
  4. - ascii,字符和二进制的对照表。
  5. - unicode,字符和二进制(码位)的对照表。
  6. - utf-8,对unicode字符集的码位进行压缩处理,间接也维护了字符和二进制的对照表。
  7. 3. ucs2和ucs4指的是使用多少个字节来表示unicode字符集的码位。
  8. 4. 目前最广泛的编码为:utf-8,他可以表示所有的字符且存储或网络传输也不会浪费资源(对码位进行压缩了)。
  9. 5. 二进制、八进制、十进制、十六进制其实就是进位的时机不同。
  10. 6. 一个字节8位
  11. 7. b/B/KB/M/G的关系。
  12. 8. utf-8用3个字节表示中文。