大模型做时序预测也很强!华人团队激活LLM新能力,超越一众传统模型实现SOTA

近日,一支由华人组成的团队揭示了大语言模型时序预测领域的惊人潜力,无需额外训练即可超越传统时序模型,实现最新最优技术(SOTA)。该团队来自蒙纳士大学、蚂蚁集团和IBM研究院,他们提出了一种创新的通用框架,即“Time-LLM”,能够激活大语言模型处理跨模态时序数据的能力。

时序预测对于各类复杂系统的决策至关重要,如城市规划、能源管理、交通控制和遥感分析。借助Time-LLM,大模型有望革新时序数据的挖掘方法。该框架的核心技术包括时序输入重编程和提示做前缀,使得大语言模型能够理解和处理时序数据,同时增强了模型对任务的理解。

研究团队的主要贡献在于:
1. 引入了不改动大语言模型主体的时序分析新方法。
2. 提出Time-LLM框架,通过文本原型转换和任务指令增强,引导LLM进行跨域推理。
3. 在各种预测任务中表现出色,特别是在少量样本和零样本场景下,同时保持高效率。

Time-LLM首先对时序数据进行标准化和分块处理,然后利用文本原型和跨注意力机制将其转化为自然语言表示。为了激活LLM的时序任务处理能力,研究者引入了提示做前缀的方法,利用先验信息和自然语言描述来指导LLM进行预测。实验表明,Time-LLM在多个公开数据集上优于现有最佳模型,特别是在零样本预测中表现出强大效能。

该项目获得了蚂蚁集团智能引擎事业部的支持,感兴趣的研究者可以查阅相关论文获取详细信息。

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...