【Letta资讯】MemGPT团队正式宣布创业,获得1000万美元融资,硅谷巨头Jeff Dean倾力投资——探索大语言模型与上下文内存管理的未来

一、为大语言模型构建更长的上下文,并让开发者自由切换基础模型

近年来,人工智能领域发展迅猛,尤其是大语言模型(LLM)的应用越来越广泛。然而,由于上下文窗口长度的限制,大语言模型在多轮对话和文档分析等任务中的表现仍有待提升。为了解决这一问题,Letta公司推出了一款名为Letta的AI上下文内存管理平台。

Letta平台将大语言模型的上下文分为“主上下文”和“外部上下文”。主上下文直接由模型访问和操作,而外部上下文则用于存储暂时不需要但在未来可能需要的信息。通过特定的内存管理算法,Letta可以在主上下文和外部上下文之间智能地移动信息,从而扩展模型的上下文容量。

此外,Letta平台支持多种AI模型,允许开发者在不同模型提供商之间自由切换,例如OpenAI、Anthropic和Mistral等。这让开发者能够更加灵活地选择最适合其应用场景的模型,而不必担心数据丢失或迁移问题。

二、脱胎于高校实验室项目,走红仅凭白皮书,正式发布时再次受到瞩目

Letta公司起源于加州大学伯克利分校的Sky Computing Lab,该实验室由知名教授Ion Stoica领导。实验室曾孵化了多个重要项目,如Gorilla LLM、vLLM和SGLang。其中,MemGPT项目在发布前仅凭借一份白皮书就引起了广泛关注。

MemGPT项目在2023年10月正式发布白皮书,并计划在一周后发布详细的论文和代码。然而,在白皮书发布后的第二天,项目就在Hacker News上迅速走红。随后,MemGPT在GitHub上正式发布,再次引发了广泛关注,收获了11000个星标和1200个Fork。

Letta公司的创始人Sarah Wooders和Charles Packer也因MemGPT项目的成功吸引了众多投资者的关注,其中包括谷歌的Jeff Dean、Hugging Face的Clem Delangue、Runway的Cristóbal Valenzuela以及Anyscale的Robert Nishihara等知名天使投资人。

尽管Letta项目备受瞩目,但面临的竞争也不小。例如,LangChain也在从事类似的工作,并且已经开始盈利。此外,OpenAI推出的最新模型o1也可能解决上下文“失忆”的问题。

本文来源: 智东西【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...