标签:AI程序员
AI程序员巅峰:Genie GPT-4o 加持下,从需求到实现仅84秒 – SWE-Bench自动编码效能展示
随着人工智能领域的飞速发展,Cosine——一家由Y Combinator支持的初创公司,近期推出了其最新力作Genie,一款革命性的自主AI工程师。Genie不仅在SWE-Bench基准测试中取得了30%的优异成绩,超越了先前由Devin创造的13.8%的记录,还一举超越了亚马逊的Q和Factory的Code Droid的19%得分,成为了全球性能最佳的AI程序员。 创新突破:Genie的诞生 Genie是一款基于先进的AI技术打造的软件工程模型,它能够根据人类工程师的指示自主处理各种编码任务,如bug修复、功能构建、代码重构和测试等。该模型不仅可以独立运行,还能与用户...
全球顶尖AI程序员登场:Genie结合SWE-Bench与自我改进机制,创新编程语言领域!
在今年三月份,AI初创企业Cognition推出了其首款AI程序员——Devin,这一创新技术以其媲美人类的编程能力而引起了业界广泛关注。Devin能够在无需人工介入的情况下,独立完成部署、调试和优化代码等编程工作。不过,最近Cosine公司发布的Genie更是以惊人表现超越了Devin,成为了新一代的AI编程领导者。 全球最强AI程序员诞生 Cosine公司推出的Genie,在权威测试平台SWE-Bench上取得了高达30.08%的评分,远远超过了Devin的13.8%和Swe-agent+GPT-4组合的12.47%,确立了其在全球AI编程领域的领先地位。实际上,Genie的研发并非...
世界首个 AI 程序员 Devin 视频竟造假?博主逐帧解析,Devin 代码任务完成很糟糕
在全球范围内引起热议的AI程序员Devin,近期被揭示其宣传视频可能存在造假行为。一位资深软件工程师通过逐帧分析Devin在Upwork平台上完成任务的视频,发现AI无法像人类工程师一样高效地执行任务。YouTube博主发布的25分钟视频详尽揭示了Devin的局限性,指出其代码创建混乱且复杂,远未达到独立完成工作的水平。此外,博主本人仅用36分钟就完成了Devin耗时至少6小时的任务。质疑声中,有人认为Devin更多是营销手段而非真正的技术突破。Devin背后的初创公司Cognition AI曾声称其AI具有神奇能力,但如今这一说法受到严重质疑。 ...