大模型的tokens是通过Tokenizer模型计算出来的。如果只是要预估大模型的tokens和字符数的换算关系,可以参考:
中文场景下
一个 token ≈ 1.6汉字
英文场景下
一个 token ≈ 0.75单词 ≈ 4个字符
大模型的tokens是通过Tokenizer模型计算出来的。如果只是要预估大模型的tokens和字符数的换算关系,可以参考:
一个 token ≈ 1.6汉字
一个 token ≈ 0.75单词 ≈ 4个字符
本文标题:token和字符的粗略换算关系
本文链接:https://www.haomeiwen.com/subject/kbfzkjtx.html
网友评论