标签:Devin

世界首个 AI 程序员 Devin 视频竟造假?博主逐帧解析,Devin 代码任务完成很糟糕

在全球范围内引起热议的AI程序员Devin,近期被揭示其宣传视频可能存在造假行为。一位资深软件工程师通过逐帧分析Devin在Upwork平台上完成任务的视频,发现AI无法像人类工程师一样高效地执行任务。YouTube博主发布的25分钟视频详尽揭示了Devin的局限性,指出其代码创建混乱且复杂,远未达到独立完成工作的水平。此外,博主本人仅用36分钟就完成了Devin耗时至少6小时的任务。质疑声中,有人认为Devin更多是营销手段而非真正的技术突破。Devin背后的初创公司Cognition AI曾声称其AI具有神奇能力,但如今这一说法受到严重质疑。 ...

GPT4单项仅7.1分,揭露大模型写代码三大短板,最新基准测试来了

随着AI技术的飞速进步,一款名为Devin的AI软件工程师横空出世,它在软件开发全周期中展现出卓越的能力,引发业界热议。在SWE-Bench基准测试中,Devin解决问题的能力远超GPT-4,展示了其在GitHub问题解决上的强大实力。然而,上海人工智能实验室、字节跳动SE Lab和SWE-Bench团队共同推出了新的测试基准DevBench,以揭示大模型在软件开发中的局限性。DevBench评估了从产品需求文档到项目开发各阶段,包括软件设计、环境设置、代码实现、集成测试和单元测试。实验表明,大模型在面向对象编程、复杂脚本编写和参数匹配等方面仍有...

从最近出圈的AI初创,看2024年的YC

在人工智能领域持续创新的浪潮中,YC投资的一些AI与软件结合的初创公司引起广泛关注。其中,Cognition AI以其研发的“人类首个AI软件工程师”Devin引领了一场技术革命。Devin具备全栈开发能力,从云端部署到代码编写,再到AI模型的训练,它的出现引发了业界对传统软件工程师角色的质疑。尽管Cognition AI是个仅有10人的小团队,但成员实力非凡,多位成员拥有IOI金牌背景,还有曾在DeepMind和Waymo等知名机构工作的经验。在成立短短两个月后,公司已获得了Peter Thiel的Founders Fund领投的2100万美元A轮融资。 与此同时,Devi...

Devin 第一手使用体验:完成度很高,开始编码就停不下来,但要替代程序员还很远

全球首个AI程序员智能体Devin引发热议,由Cognition AI团队开发的这款产品在演示中展现了能独立完成复杂编程工作的能力。一位获得测试资格的斯坦福网友分享了他的体验。Devin成功完成了获取股票价格的API项目,但处理复杂任务如让用户与大模型下棋的网站时,速度较慢,需要19分钟询问API密钥。此外,Devin能进行地图数据的分析,但在南极洲海水温度地图的绘制中遇到困难。尽管如此,Devin的亮点在于其产品化程度高,能自动部署、保护API密钥并接受需求变更。然而,反应速度慢和无法直接编辑代码是目前的不足。用户期待Devin...

全球首个AI程序员诞生,码农饭碗一夜被砸!10块IOI金牌华人团队震撼打造,996写代码训练模型

Cognition AI公司推出了一款名为Devin的AI软件工程师,它具备全栈开发能力,能够从头至尾构建和部署应用程序,自我修正错误,甚至训练和优化AI模型。Devin在SWE-bench上的表现超越了其他著名AI模型,证明了其已经具备了通过专业面试的水平。这款AI是由一支由IOI金牌得主组成的初创团队开发的,其中包括CEO Scott Wu和首席技术官Steven Hao等杰出人才。Devin的出现引发了业界的广泛关注,有人担忧它可能取代人类程序员的工作,但也有人看到了其带来的巨大潜力和无代码未来的可能性。