碼點

碼點 是分配給文字表示系統(例如 Unicode)中的抽象字元的一個數字。在 Unicode 中,碼點表示為“U+1234”的形式,其中“1234”是分配的數字。例如,字元“A”被分配的碼點是 U+0041。

UTF-8UTF-16 這樣的字元編碼形式,決定了 Unicode 碼點如何被編碼為位元組序列。不同的編碼形式可能會將相同的碼點編碼為不同的位元組序列:例如,西裡爾字母“Ф”(其碼點為 U+0424)在 UTF-8 中編碼為 0xd0a4,在 UTF-16 中編碼為 0x0424

另見