写点什么

utf-8

0 人感兴趣 · 6 次引用

  • 最新
  • 推荐

计算机字符编码的前世今生

有人丢给你下面这张图,如果你能清楚地说明它们之间的关系以及用途,那么你对字符编码的理解肯定过关了。

https://static001.geekbang.org/infoq/06/06ecc11a12ebee78c942569dc098988b.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Go 的 UTF-8 实现

用户头像
Rayjun
2021-04-24

计算机刚诞生的时候,计算机内的字符可以全部由 ASCII 来表示,ASCII 字符的长度是 7 位,可以表示 128 个字符,对于美国等国家来说是够了,但是对于世界上的其他国家,特别是东亚国家,文字不是由字母组成,汉字就有几万个,ASCII 码根本不够用。

https://static001.geekbang.org/infoq/c1/c16aa198bdcc03948289964496bc8ab9.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

深入剖析 go 中字符串的编码问题——特殊字符的 string 怎么转 byte?

用户头像
Gopher指北
2020-10-08

go中的代码总是用utf8编码,并且字符串能够存储任何字节。 没有经过字节级别的转义,那么字符串是一个标准的utf8序列。

https://static001.geekbang.org/infoq/f3/f3fc3cc4864c67af1017de2843ac011d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

关于字符编码那些你应该知道的事情

用户头像
꯭🇫꯭
2020-05-29

为什么 Windows 上使用 Notepad 会出现乱码

字符与编码

用户头像
引花眠
2020-05-25

字符集是各种字符的集合,可以包括文字、数字、标点符号等各种字符。常见的字符集包括:

https://static001.geekbang.org/infoq/99/994929ccf2ff5635de99907fa3c40b6f.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

看完这篇,你也是字符编码大神(ASCII、Unicode、UTF-8、UTF-16、UTF-32)

用户头像
Meandni
2020-05-16

程序中的所有信息都是以二进制的形式存储在计算机的底层,也就是说我们在代码中定义的一个 char 字符都会被转换成二进制码储存起来,这个过程可以被称为编码,而将计算机底层的二进制码转换成屏幕上有意义的字符(如“hello world”),这个过程就称为解码。

utf-8_utf-8技术文章_InfoQ写作社区