代码点

**码点**是在用于表示文本的系统(例如Unicode)中,分配给表示抽象字符的数字。在Unicode中,码点以“U+1234”的形式表示,其中“1234”是分配的数字。例如,字符“A”被分配了U+0041的码点。

字符编码形式(例如UTF-8和UTF-16)确定如何将Unicode码点编码为字节序列。不同的编码形式可能会将相同的码点编码为不同的字节序列:例如,西里尔字母“Ф”(其码点为U+0424)在UTF-8中编码为0xd0a4,在UTF-16中编码为0x0424

另请参阅