标签

深度学习

Oct 26, 2025 NLP 技术前沿 24 分钟

从 GPT-1 到 GPT-4：理解自回归语言建模、解码策略（贪心、束搜索、top-k、top-p）、上下文学习，并用 HuggingFace 构建聊天机器人。

Oct 21, 2025 NLP 技术前沿 30 分钟

BERT 如何让双向预训练成为 NLP 的默认范式：从架构到 80/10/10 掩码规则，到微调技巧，再到 RoBERTa/ALBERT/ELECTRA 全家桶，并附完整 HuggingFace 代码。

Oct 11, 2025 NLP 技术前沿 24 分钟

RNN、LSTM、GRU 如何通过记忆处理序列。从第一性原理推导梯度消失，用 PyTorch 实现字符级文本生成器和 Seq2Seq 翻译器。

Oct 6, 2025 NLP 技术前沿 32 分钟

深入理解 Word2Vec、GloVe 和 FastText 如何将词语转化为捕获语义的向量。掌握数学原理，用 Gensim 训练自己的词嵌入，理解嵌入与语言模型的关系。

Oct 1, 2025 NLP 技术前沿 30 分钟

从第一性原理出发的 NLP 入门：梳理四个时代的脉络，亲手搭建从清洗到向量化的完整流水线，把分词、TF-IDF、n-gram 与分布式表示背后的数学讲清楚。

Dec 15, 2024 时间序列预测 26 分钟

Informer 用 ProbSparse 注意力、编码器蒸馏、生成式解码器把 Transformer 复杂度从 O(L^2) 降到 O(L log L)。完整数学推导、PyTorch 代码与 ETT/气象 benchmark。

Nov 30, 2024 时间序列预测 28 分钟

N-BEATS 把深度学习的表达力和经典分解的可解释性合二为一：基函数展开、双重残差堆叠、M4 竞赛分析，以及完整的 PyTorch 代码。

Nov 15, 2024 时间序列预测 26 分钟

TCN 用因果膨胀卷积换取并行训练和指数级感受野。完整 PyTorch 实现，附交通流和多变量传感器两个实战案例。

Oct 31, 2024 时间序列预测 24 分钟

时间序列的 Transformer 全景：编码器-解码器结构、时序位置编码、O(n^2) 注意力瓶颈、Decoder-only 自回归预测与 Patching 策略。含 Autoformer / FEDformer / Informer / PatchTST 选型与可直接运行的实现。

Oct 16, 2024 时间序列预测 22 分钟

自注意力、多头注意力和位置编码在时间序列中的应用。逐步推导数学公式，附 PyTorch 实现和注意力可视化。

Oct 1, 2024 时间序列预测 24 分钟

GRU 把 LSTM 精炼为两个门，参数减少 25%，训练快 10--15%。本文用公式、基准测试和决策矩阵告诉你 GRU 何时优于 LSTM。

Sep 16, 2024 时间序列预测 24 分钟

LSTM 的遗忘门、输入门和输出门如何解决梯度消失问题。完整的 PyTorch 时间序列预测代码和实用调参技巧。

Dec 30, 2021 核方法 66 分钟

深度核学习把神经特征提取和核方法结合。何时选核而非深网、超参调优手册、常见故障模式，以及一张最终的 5 步核方法决策流程图。