What Are Tokens in Java

About 56,100,000 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › question
vllm内部怎么根据max_model_len自动计算max_num_batched_toke…
4. 内存使用效率：模型需要在保证性能的同时，尽量减少内存的使用。 max_num_batched_tokens 的计算可能不是简单的数学公式，而是模型内部通过一系列测试和评估来确定的最佳值。这 …
zhihu.com
https://www.zhihu.com › question
阿里云通义千问击穿大模型底价，两百万tokens只需一元，有哪些 …
两百万tokens只要一元，我都怀疑电费够不够…. 但上次DeepSeekV2发布后，他们作者说V2那价格还有得赚，那说明模型token的成本最近的确降得很厉害。一方面是英伟达等基础硬件厂商 …
zhihu.com
https://www.zhihu.com › question
使用Deepseek需要付费的吗？ - 知乎
使用Deepseek如何收费官方赠送10元使用量如果用完了也不用担心，因为是开源大模型，各大厂商都自行部署了大模型，并提供API调用服务，同样新用户注册，赠送很多tokens可用。例 …
zhihu.com
https://www.zhihu.com › question
ChatGPT如何计算token数？ - 知乎
终于有人意识到这个问题了。首先 OpenAI token 的计算包含两部分。输入给 GPT 模型的 token 数和 GPT 模型生成文本的 token 数。例如，你提问耗费了 100 token，GPT 根据你的输入， …
zhihu.com
https://www.zhihu.com › question
关于知识库是否计入tokens? - 知乎
当你上传了十部三百万字的小说并创建了向量知识库后，在提问时勾选该知识库，输入tokens的计算方式如下：输入 tokens 只会计算你当前提问的问题字数，不会将整个知识库的内容都算作 …
zhihu.com
https://www.zhihu.com › question
大模型的token究竟是什么？ - 知乎
1. 什么是 Token（词元）？ Token 是 LLM 处理文本时的最小单元，也被称为 “词元”。但 token 并不总是等同于一个词。根据不同的分词方式，一个 token 可以是：一个字符一个子 …
zhihu.com
https://www.zhihu.com › pin
CVPR'25：PDrop层次化裁剪加速 | 【视觉tokens裁剪】是一 …
CVPR'25：PDrop层次化裁剪加速 | 【视觉tokens裁剪】是一近期非常流行的一类MLLM加速手段，虽然它们在加速的同时不可避免地带来性能损失😭💡最近中科大等机构的同行们分析了MLLM各 …
zhihu.com
https://www.zhihu.com › question
大模型训练的性能指标：吞吐率 Throughput 是指什么？ - 知乎
每秒处理的Token数： Throughput_ {tokens} = Throughput_ {samples} * seq\_len \\ 假设GLM10B网络模型使用DGX A100（8x 80GB）训练的吞吐量为25 samples/s，max seq_len …
zhihu.com
https://www.zhihu.com › question
NLP领域中的token和tokenization到底指的是什么？ - 知乎
Tokenizer是将文本切分成多个tokens的工具或算法。它负责将原始文本分割成tokens 序列。在NLP中，有多种不同类型的tokenizer，每种tokenizer都有其特定的应用场景和适用范围。基 …
zhihu.com
https://www.zhihu.com › question
硅基流动deepseekR1的API的python输出后显示Invalid token如何 …
检查 API key 对应的账号是否还有余额，首次注册会赠送2000W tokens 也就是大概14元的余额，一般用完之后就需要自己再充值余额，能扣除余额才能继续使用。

Pagination
- Next
- Next