tag: transformer.md

Tag: transformer

2 posts
从 Self-Attention 到 Flash Attention

从 Self-Attention 到 Flash Attention,理解现代 LLM 的核心计算原理。本文正文为 markdown,关键机制配有可交互动画(点按钮逐步演示)。

...
ML Systems 面试题库:60 道高频题

精选 60 道 ML Systems 高频面试题,覆盖 Transformer、GPU & CUDA、分布式训练、推理系统、RLHF、系统设计与 Debugging 七大方向。下面是一个可交互题库:支持按分类、难度筛选与关键词搜索,点击题目可展开提示与解答。

...