标签

Multimodal

Feb 27, 2026 阿里云百炼 18 分钟

阿里云百炼(三):Qwen-Omni 多模态理解

Qwen-Omni 生产实践:四种输入、文档没强调的流式必填,加上一个真实可跑的视频理解示例和合理的像素预算。

Apr 9, 2022 单点深潜 36 分钟

多模态大模型与下游任务研究

梳理多模态大模型的核心技术:视觉-语言对齐、跨模态融合、多模态预训练,以及 LLM 在传统 NLP 任务中的应用与优化(提示/微调/蒸馏/检索增强)。