字符集

字符集是一种编码系统,用于告知计算机如何识别字符,包括字母、数字、标点符号和空格。

过去,由于语言不同,各国都开发了自己的字符集,例如日语的 Kanji JIS 码(如 Shift-JIS、EUC-JP 等),繁体中文的 Big5,以及俄语的 KOI8-R。然而,Unicode 因其通用的语言支持而逐渐成为最被接受的字符集。

如果字符集使用不当(例如,对以 Big5 编码的文章使用了 Unicode),您可能会看到一堆乱码,这被称为Mojibake

另见