标签：AI编程

谷歌Gemini大模型在AI编程领域全面屠榜，称霸大模型竞技场！SWE-bench verified认证，Humanitas Last Exam成绩超越OpenAI，免费体验最强推理模型

第一段智东西（公众号：zhidxcom）作者 | 陈骏达编辑 | 心缘智东西3月26日报道，谷歌正式推出了Gemini 2.5思考模型家族的首个成员——Gemini 2.5 Pro实验版本。这款模型在多项基准测试中全面超越了OpenAI o3-mini、Claude 3.7 Sonnet、Grok-3和DeepSeek-R1等竞争对手，并在大模型竞技场获得了1443分，以39分的优势稳居榜首。然而，谷歌并未公开Gemini 2.5 Pro与OpenAI o1、o1-Pro和o3等模型的对比数据。此外，在SWE-bench verified编程评估基准上，其得分略低于Claude 3.7 Sonnet。第二段 Gemini 2.5 Pro不仅在...

来源：

智东西【阅读原文】
Tags：AI编程 Humanitas Last Exam SWE-bench verified 大模型竞技场谷歌Gemini

1周前

2025年最值得推荐的AI产品大全：DeepSeek、AI聊天、AI搜索、AI编程与AI绘图，一篇文章带你全面了解最新、最好用的AI工具，确保内容原创且SEO友好，帮助你轻松找到最适合的AI解决方案。

公众号两周年回顾与AI工具推荐 2025年，我的公众号即将迎来两周年。在这两年里，感谢各位粉丝和品牌方的支持，我测试了众多公开和未公开的AI产品。经过多次筛选和评估，今天我将为大家带来2025年最值得使用的AI产品推荐，涵盖9大类别，包括AI聊天、搜索、编程、绘图、声音、音乐、视频和3D建模。 AI Chat 类别推荐 1. DeepSeek - 网址： [https：//chat.deepseek.com/](https：//chat.deepseek.com/) - 作为2025年的现象级产品，DeepSeek凭借其开源性和强大的推理能力迅速走红。虽然它有一些局限性，但依然备受推崇。 2. ...

来源：

数字生命卡兹克公众号【阅读原文】
Tags：AI搜索 AI绘图 AI编程 AI聊天 DeepSeek

2个月前

Claude 3.5 AI编程收入激增10倍，超越Cursor挑战OpenAI， Anthropic估值180亿三年内颠覆硅谷AI领域

Anthropic挑战OpenAI的崛起之路在人工智能领域，OpenAI一直是最受瞩目的公司之一，但近年来，Anthropic的迅速崛起让OpenAI的高管们感到不安。特别是今年7月，曾获OpenAI 800万美元投资的编程助手Cursor将默认模型从GPT换成了Claude，这一举动引起了广泛关注。Cursor的联合创始人Aman Sanger在Lex Fridman的播客中高度评价了Claude，称其为“当前最佳的编程工具”。 OpenAI的危机与应对 OpenAI在内部基准测试中发现，自家模型在自动编程任务上已经落后于Anthropic。这一发现让OpenAI的领导层感到震惊。Anthropic在编程领域...

来源：

新智元公众号【阅读原文】
Tags：AI编程 Anthropic ChatGPT Claude OpenAI

4个月前

阿里云内部全面推行AI写代码

阿里云正引领一场编程领域的革新，通过引入先进的AI技术，大力推广AI编程应用。其创新产品“通义灵码”被设计用于协助程序员进行日常的编码、阅读、调试和优化任务，极大地提升了开发效率。值得注意的是，通义灵码在阿里云内部已被正式赋予员工身份，拥有工号AI001，显示了公司对这一智能工具的高度重视。据阿里云内部消息，预计未来有20%的代码编写工作将由通义灵码承担。然而，这并不意味着程序员的角色会被取代，相反，他们将能够将更多的精力集中在系统架构的设计和关键业务的创新上，以实现更高效、更有价值的工作模式。

来源：

界面新闻【阅读原文】
Tags：AI编程代码优化程序员通义灵码阿里云

1年前 (2024)