写点什么

utf-8

0 人感兴趣 · 5 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/06/06ecc11a12ebee78c942569dc098988b.jpeg?x-oss-process=image/resize,w_416,h_234

Go 的 UTF-8 实现

用户头像
Rayjun4 月 24 日

计算机刚诞生的时候,计算机内的字符可以全部由 ASCII 来表示,ASCII 字符的长度是 7 位,可以表示 128 个字符,对于美国等国家来说是够了,但是对于世界上的其他国家,特别是东亚国家,文字不是由字母组成,汉字就有几万个,ASCII 码根本不够用。

https://static001.geekbang.org/infoq/c1/c16aa198bdcc03948289964496bc8ab9.jpeg?x-oss-process=image/resize,w_416,h_234

深入剖析 go 中字符串的编码问题——特殊字符的 string 怎么转 byte?

用户头像
Gopher指北2020 年 10 月 8 日

go中的代码总是用utf8编码,并且字符串能够存储任何字节。 没有经过字节级别的转义,那么字符串是一个标准的utf8序列。

https://static001.geekbang.org/infoq/f3/f3fc3cc4864c67af1017de2843ac011d.png?x-oss-process=image/resize,w_416,h_234

关于字符编码那些你应该知道的事情

用户头像
꯭🇫꯭2020 年 5 月 29 日

为什么 Windows 上使用 Notepad 会出现乱码

字符与编码

用户头像
引花眠2020 年 5 月 25 日

字符集是各种字符的集合,可以包括文字、数字、标点符号等各种字符。常见的字符集包括:

https://static001.geekbang.org/infoq/99/994929ccf2ff5635de99907fa3c40b6f.png?x-oss-process=image/resize,w_416,h_234

看完这篇,你也是字符编码大神(ASCII、Unicode、UTF-8、UTF-16、UTF-32)

用户头像
Meandni2020 年 5 月 16 日

程序中的所有信息都是以二进制的形式存储在计算机的底层,也就是说我们在代码中定义的一个 char 字符都会被转换成二进制码储存起来,这个过程可以被称为编码,而将计算机底层的二进制码转换成屏幕上有意义的字符(如“hello world”),这个过程就称为解码。

utf-8_utf-8资料文章-InfoQ写作平台