深度学习
自然语言处理(六):GPT 与生成式语言模型
从 GPT-1 到 GPT-4:理解自回归语言建模、解码策略(贪心、束搜索、top-k、top-p)、上下文学习,并用 HuggingFace 构建聊天机器人。
自然语言处理(五):BERT 与预训练模型
BERT 如何让双向预训练成为 NLP 的默认范式:从架构到 80/10/10 掩码规则,到微调技巧,再到 RoBERTa/ALBERT/ELECTRA 全家桶,并附完整 HuggingFace 代码。
自然语言处理(三):RNN 与序列建模
RNN、LSTM、GRU 如何通过记忆处理序列。从第一性原理推导梯度消失,用 PyTorch 实现字符级文本生成器和 Seq2Seq 翻译器。
自然语言处理(二):词向量与语言模型
深入理解 Word2Vec、GloVe 和 FastText 如何将词语转化为捕获语义的向量。掌握数学原理,用 Gensim 训练自己的词嵌入,理解嵌入与语言模型的关系。
自然语言处理(一):NLP 入门与文本预处理
从第一性原理出发的 NLP 入门:梳理四个时代的脉络,亲手搭建从清洗到向量化的完整流水线,把分词、TF-IDF、n-gram 与分布式表示背后的数学讲清楚。
时间序列模型(八):Informer——高效长序列预测
Informer 用 ProbSparse 注意力、编码器蒸馏、生成式解码器把 Transformer 复杂度从 O(L^2) 降到 O(L log L)。完整数学推导、PyTorch 代码与 ETT/气象 benchmark。
时间序列模型(七):N-BEATS——可解释的深度架构
N-BEATS 把深度学习的表达力和经典分解的可解释性合二为一:基函数展开、双重残差堆叠、M4 竞赛分析,以及完整的 PyTorch 代码。
时间序列模型(六):时序卷积网络 (TCN)
TCN 用因果膨胀卷积换取并行训练和指数级感受野。完整 PyTorch 实现,附交通流和多变量传感器两个实战案例。
时间序列模型(五):时间序列的 Transformer 架构
时间序列的 Transformer 全景:编码器-解码器结构、时序位置编码、O(n^2) 注意力瓶颈、Decoder-only 自回归预测与 Patching 策略。含 Autoformer / FEDformer / Informer / PatchTST 选型与可直接运行的实现。
时间序列模型(四):Attention 机制——直接的长程依赖
自注意力、多头注意力和位置编码在时间序列中的应用。逐步推导数学公式,附 PyTorch 实现和注意力可视化。
时间序列模型(三):GRU——轻量门控与效率权衡
GRU 把 LSTM 精炼为两个门,参数减少 25%,训练快 10--15%。本文用公式、基准测试和决策矩阵告诉你 GRU 何时优于 LSTM。
时间序列模型(二):LSTM——门控机制与长期依赖
LSTM 的遗忘门、输入门和输出门如何解决梯度消失问题。完整的 PyTorch 时间序列预测代码和实用调参技巧。
核方法(八):深度核学习 vs 深度学习——选择指南与故障排查
深度核学习把神经特征提取和核方法结合。何时选核而非深网、超参调优手册、常见故障模式,以及一张最终的 5 步核方法决策流程图。












