<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Informer on Chen Kai Blog</title><link>https://www.chenk.top/zh/tags/informer/</link><description>Recent content in Informer on Chen Kai Blog</description><generator>Hugo</generator><language>zh-CN</language><lastBuildDate>Sun, 15 Dec 2024 09:00:00 +0000</lastBuildDate><atom:link href="https://www.chenk.top/zh/tags/informer/index.xml" rel="self" type="application/rss+xml"/><item><title>时间序列模型（八）：Informer——高效长序列预测</title><link>https://www.chenk.top/zh/time-series/08-informer%E9%95%BF%E5%BA%8F%E5%88%97%E9%A2%84%E6%B5%8B/</link><pubDate>Sun, 15 Dec 2024 09:00:00 +0000</pubDate><guid>https://www.chenk.top/zh/time-series/08-informer%E9%95%BF%E5%BA%8F%E5%88%97%E9%A2%84%E6%B5%8B/</guid><description>&lt;p>Transformer 在序列建模上确实很强大，但只要序列一变长，问题就来了。普通自注意力机制在计算和显存上的开销都是 &lt;span class="math-inline">$\mathcal{O}(L^2)$&lt;/span>
 级别——一周的小时级窗口（168 步）还能轻松处理，一个月窗口（720 步）就已经吃力，而三个月窗口（2160 步）在单张 GPU 上基本无法运行。偏偏现实世界中的长 horizon 预测任务，比如气象、能源、金融和 IoT，恰恰就落在这个区间。&lt;/p></description></item></channel></rss>