标签：AI软件工程师

GPT4单项仅7.1分，揭露大模型写代码三大短板，最新基准测试来了

随着AI技术的飞速进步，一款名为Devin的AI软件工程师横空出世，它在软件开发全周期中展现出卓越的能力，引发业界热议。在SWE-Bench基准测试中，Devin解决问题的能力远超GPT-4，展示了其在GitHub问题解决上的强大实力。然而，上海人工智能实验室、字节跳动SE Lab和SWE-Bench团队共同推出了新的测试基准DevBench，以揭示大模型在软件开发中的局限性。DevBench评估了从产品需求文档到项目开发各阶段，包括软件设计、环境设置、代码实现、集成测试和单元测试。实验表明，大模型在面向对象编程、复杂脚本编写和参数匹配等方面仍有...

来源：

量子位【阅读原文】
Tags：AI软件工程师 DevBench Devin SWE-Bench 大语言模型

1年前 (2024)

全球首个AI程序员诞生，码农饭碗一夜被砸！10块IOI金牌华人团队震撼打造，996写代码训练模型

Cognition AI公司推出了一款名为Devin的AI软件工程师，它具备全栈开发能力，能够从头至尾构建和部署应用程序，自我修正错误，甚至训练和优化AI模型。Devin在SWE-bench上的表现超越了其他著名AI模型，证明了其已经具备了通过专业面试的水平。这款AI是由一支由IOI金牌得主组成的初创团队开发的，其中包括CEO Scott Wu和首席技术官Steven Hao等杰出人才。Devin的出现引发了业界的广泛关注，有人担忧它可能取代人类程序员的工作，但也有人看到了其带来的巨大潜力和无代码未来的可能性。

来源：

新智元公众号【阅读原文】
Tags：AI软件工程师 Devin 全栈技能无代码未来自主学习

1年前 (2024)