近日,人工智能公司Anthropic正式推出了其最新的“混合推理模型”——Claude 3.7 Sonnet。这款新模型不仅能够处理更复杂的问题,在数学和编程等领域的表现也超越了以往的版本。Anthropic表示,这是他们迄今为止最智能的AI模型,具备独特的“推理模式”与传统模式相结合的能力,使其成为市场上唯一的“混合型”AI模型。
自主性编程工具——Claude Code
除了推出Claude 3.7 Sonnet,Anthropic还发布了自主性编程工具Claude Code的“有限研究预览版”。这款工具可以作为开发者的“积极合作伙伴”,帮助搜索和阅读代码、编辑文件、编写和运行测试、提交代码至GitHub,并使用命令行工具。从本周一开始,用户可以在Claude应用程序中体验这一新模型,开发者也可以通过Anthropic的API、亚马逊Bedrock和谷歌云的Vertix AI获取该模型。
成本与性能优势
Claude 3.7 Sonnet的运行成本与前代产品3.5 Sonnet相同,输入每百万token收费3美元,输出每百万token收费15美元。尽管OpenAI等公司提供独立的推理模型,但Anthropic的产品研究主管Dianne Penn指出,公司希望简化使用模型的体验,认为推理是AI的一个特征而非独立的事物。Penn还提到,Claude 3.7 Sonnet在回答简单问题和应对复杂任务时,回应速度差异不大,尤其在“自主性编程”、金融和法律任务上的表现尤为突出。
模型功能与应用
尽管该模型目前不具备实时网络搜索功能,但其知识更新至2024年10月,比其他模型更为新颖。Anthropic允许开发者通过“草稿纸”功能指导模型的思考方式,甚至可以精确控制响应时间。Anthropic的产品副总裁Michael Gerstenhaber表示,有时开发者只需明确指出,回答不应超过200毫秒。此外,Anthropic内部员工已利用Claude 3.7 Sonnet完成前端网站设计、交互式游戏开发等任务,展现了其强大的实用性。
实际案例与未来展望
Claude 3.7 Sonnet的成功不仅仅体现在理论数据上,实际应用中也表现出色。例如,通过反复构建和编辑测试用例,支持长达45分钟的编码工作。公司还通过将模型的API映射到游戏控制器方案,测试模型在经典《宝可梦》电子游戏中的表现,结果显示3.7版本成功击败了多个道馆馆主。这表明,行业正朝着一个模型能够完成所有任务的未来迈进,而不仅仅是提供独立的推理模型。
