标签

注意力机制

Oct 16, 2025 NLP 技术前沿 32 分钟

自然语言处理(四):注意力机制与 Transformer

从 Seq2Seq 的瓶颈到 Attention Is All You Need,建立缩放点积注意力、多头注意力、位置编码和因果掩码的直觉,并用 PyTorch 从零搭一个完整 Transformer。