Tagged

Multimodal

May 5, 2024 Standalone 21 min read

多模态大模型与下游任务研究

梳理多模态大模型的核心技术:视觉-语言对齐、跨模态融合、多模态预训练,以及 LLM 在传统 NLP 任务中的应用与优化(提示/微调/蒸馏/检索增强)。