GPU0 GPU1 GPU2 GPU3
环形拓扑: 每个 GPU 只向右邻居发送 (GPU3 → GPU0 wrap)
0 / 6