<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Meta-Learning on Chen Kai Blog</title><link>https://www.chenk.top/zh/tags/meta-learning/</link><description>Recent content in Meta-Learning on Chen Kai Blog</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Sat, 20 Sep 2025 09:00:00 +0000</lastBuildDate><atom:link href="https://www.chenk.top/zh/tags/meta-learning/index.xml" rel="self" type="application/rss+xml"/><item><title>强化学习（十一）：层次化强化学习与元学习</title><link>https://www.chenk.top/zh/reinforcement-learning/11-%E5%B1%82%E6%AC%A1%E5%8C%96%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0%E4%B8%8E%E5%85%83%E5%AD%A6%E4%B9%A0/</link><pubDate>Sat, 20 Sep 2025 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/reinforcement-learning/11-%E5%B1%82%E6%AC%A1%E5%8C%96%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0%E4%B8%8E%E5%85%83%E5%AD%A6%E4%B9%A0/</guid><description>&lt;p>标准强化学习将每个问题视为一系列原子级别的决策：观察状态、选择动作、接收奖励，然后重复。这种方法在任务时间跨度较短、奖励密集时效果不错，但面对人类能轻松完成的任务时就会失效。“做早餐”显然不是单次决策，而是一棵由多个子任务组成的树——&lt;em>煮咖啡&lt;/em>、&lt;em>煎蛋&lt;/em>、&lt;em>烤面包&lt;/em>、&lt;em>装盘上桌&lt;/em>——每个子任务本身都是一套小型策略。&lt;strong>层次化强化学习（HRL）&lt;/strong> 的核心思想是将宏动作视为一等公民，让智能体能在多个时间尺度上进行推理和行动。&lt;/p></description></item><item><title>迁移学习（四）：小样本学习</title><link>https://www.chenk.top/zh/transfer-learning/04-few-shot-learning/</link><pubDate>Mon, 19 May 2025 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/transfer-learning/04-few-shot-learning/</guid><description>&lt;p>给小孩看一张穿山甲的照片，他这辈子都能认出穿山甲；而给深度学习模型看一张照片，它的回答基本是随机瞎猜。小样本学习旨在填补这一差距，使分类器在每类只有 1 到 10 个标注样本的情况下也能正常工作。&lt;/p></description></item></channel></rss>