100KB 上下文大小
在计算机存储中,100KB 通常指 100 × 1024 = 102400 字节。具体能容纳的汉字和英文单词数量取决于编码方式:
- 汉字(常见中文字符集):
- 若使用 GBK/GB2312 编码(每个汉字占 2 字节),则约 51,200 个汉字。
- 若使用 UTF-8 编码(每个汉字通常占 3 字节),则约 34,133 个汉字。
- 英文单词(ASCII 编码,每个字母占 1 字节):
- 英文单词平均长度约为 5 个字母,加上一个空格(或标点)约为 6 字节/单词,因此约 17,067 个单词。
实际数量会因文本中的标点、数字、换行符等略有浮动,以上为常见估算。