初始状态: m=-∞, l=0, O=0。4 个 KV 块待处理
Score 向量 s = [q_i × K^T] — 共 8 个值,分 4 块:
m (running max)
-∞
l (rescaled Σexp)
0
O (rescaled Σexp×v)
[0, 0]
简化为 2-d