码点

码点 是分配给文本表示系统(例如 Unicode)中的抽象字符的一个数字。在 Unicode 中,码点表示为“U+1234”的形式,其中“1234”是分配的数字。例如,字符“A”被分配的码点是 U+0041。

UTF-8UTF-16 这样的字符编码形式,决定了 Unicode 码点如何被编码为字节序列。不同的编码形式可能会将相同的码点编码为不同的字节序列:例如,西里尔字母“Ф”(其码点为 U+0424)在 UTF-8 中编码为 0xd0a4,在 UTF-16 中编码为 0x0424

另见