生成下一个 Token
重置
点击 "生成下一个 Token" 观察 Attention 计算过程和 KV Cache 变化
已生成序列:
Attention 计算 (当前步):
KV Cache 状态:
有 KV Cache
无 KV Cache