分类

论文笔记

Jul 29, 2025 单点深潜 18 分钟

Prefix-Tuning:为生成任务优化连续提示

Prefix-Tuning 冻结整个语言模型,只学习一组注入到注意力层的连续向量来引导生成。本文从注意力公式、重参数化、KV cache 机制到 GPT-2 上的实验,把这套方法和 Adapter、Prompt Tuning、LoRA 的边界讲清楚。

Sep 1, 2024 单点深潜 20 分钟

Mixture-of-Subspaces in Low-Rank Adaptation (MoSLoRA)

MoSLoRA 用一个 k×k 可学习 mixer 组合 k 个低秩子空间,整体重写为干净的 BWA 乘积,保留可合并性与零推理开销。

May 1, 2024 单点深潜 22 分钟

HCGR —— Hyperbolic Contrastive Graph Representation Learning for Session-based Recommendation

HCGR 把会话图嵌入洛伦兹双曲流形,切空间跑 GNN 注意力聚合,再加 InfoNCE 对比损失,长尾深层数据集增益最大。

Jun 26, 2023 单点深潜 22 分钟

paper2repo:GitHub Repository Recommendation for Academic Papers

paper2repo(WWW 2020)双塔 GCN:引用图与协同标星图分头训练,靠余弦桥接对加 WARP 排序损失打通跨塔嵌入空间。

Jun 25, 2023 单点深潜 20 分钟

SR-GNN —— Session-based Recommendation with Graph Neural Networks

SR-GNN 把一段点击会话拆成有向加权图,再用门控 GNN 做下一跳预测。本文系统讲清会话图构建、GGNN 更新、局部+全局池化、训练细节、基准对比,以及决定要不要在生产里用它的几类失败模式。

Jan 29, 2023 单点深潜 16 分钟

Graph Contextualized Self-Attention Network for Session-based Recommendation

GC-SAN(IJCAI 2019)会话推荐:SR-GNN 抓局部转移加自注意力抓长距离意图,再用一个标量权重融合最后一击与全局意图。

Jan 22, 2023 单点深潜 22 分钟

Integrating Large Language Models with Graphical Session-Based Recommendation

LLMGR 用混合编码层把 64 维 ID 映射到 4096 维 LLM 空间,两阶段 prompt tuning,冷启动 HR@20 提升 8.68%。

Apr 3, 2022 单点深潜 22 分钟

Graph Neural Networks for Learning Equivariant Representations of Neural Networks

把神经网络本身画成一张图(神经元做节点、权重做边),再让 GNN 来读它,就能得到一个对隐藏单元置换天然等变的表示。换对了对称性,预测泛化、检索相似模型、跨架构合并权重这类任务才真正变得可学。