标签：GPT-4

开源模型打败GPT-4！LLM竞技场最新战报，Cohere Command R+上线

在AI领域，开源模型Cohere的Command R+近期在LLM竞技场中击败了GPT-4，引发了广泛关注。这款模型在4月11日的排行榜上超越了早期版本的GPT-4，与GPT-4-0314并列第7，成为首个在性能上胜过GPT-4的开源模型。尽管OpenAI迅速推出了GPT-4-Turbo-2024-04-09版本夺回榜首，但Command R+的开源特性仍为开源社区带来了荣耀。Cohere的机器学习总监Nils Reimers指出，Command R+的真正实力在于RAG和工具使用，而这在竞技场中并未完全展现。 Command R+不仅在性能上优于竞争对手，而且价格更低。Cohere已与多家大企业合作，将LLM部署到A...

来源：

新智元公众号【阅读原文】
Tags：Command R+ GPT-4 LLM竞技场 RAG解决方案开源模型

12个月前

看懂网飞版「三体」！Reka Core登场：挑战GPT-4、Claude 3

AI初创公司Reka近期推出了创新的多模态语言模型Reka Core，该模型展现出理解图像、音频和视频等多元数据的卓越能力，成为继谷歌Gemini Ultra之后的又一瞩目之作。Reka Core在性能上与GPT-4相当，证明了其研发团队的努力成果。这款模型是通过数千台H100设备训练得出，支持32种语言和大量词汇上下文，尤其擅长处理长篇文档。Reka Core不仅在视频感知测试中超越Gemini Ultra，在图像任务的MMMU基准测试中也有出色表现，与行业领先模型相媲美。尽管训练时间较短，但其性能已超越许多顶级AI模型。值得注意的是，Reka Core具备强大...

来源：

新智元公众号【阅读原文】
Tags：AI初创公司 GPT-4 Reka Core 图像理解多模态语言模型

12个月前

AI日报：PR重大更新!Sora加入Adobe全家桶；文心大模型4.0工具版发布；世界首届AI选美大赛开始；GPT-4整顿学术圈

在这个快速发展的AI时代，每天都有新变化。今天，让我们一起探索一下人工智能领域的最新动态。首先，Adobe Premiere Pro引领了一场视频编辑革命，引入AI工具Firefly，让编辑工作变得前所未有的简单高效。用户现在可以享受到对象添加、移除等创新功能，大大提升了创作自由度。另一边，百度Create AI开发者大会释放了三大重要信号：文心大模型4.0的发布、智能计算操作系统万源的推出，以及AgentBuilder、AppBuilder、ModelBuilder工具的诞生，降低了开发门槛。同时，GPT-4Turbo在Chatbot Arena中脱颖而出，重新证明了其作为...

来源：

站长之家【阅读原文】
Tags：Adobe Premiere Pro AI工具 GPT-4 图像转文字多机器人聊天

12个月前

GPT-4推理能力为0？开发者悬赏1万美金被打脸，神秘提示正确率直冲100%

本文讲述了关于人工智能模型GPT-4和Claude3在解决一个看似简单的脑筋急转弯推理题上的表现。一位开发者质疑GPT模型在训练集之外缺乏推理能力，认为它们无法实现人工智能（AGI），并悬赏1万美元发起挑战。然而，很快就有网友通过巧妙的提示让GPT-4和Claude3成功解决了这个问题，证明了模型的潜力。开发者Taelin承认了自己的错误，并支付了奖金。文章还讨论了模型的局限性，如无法进行长期逻辑推理，以及提示的重要性。尽管如此，人们还是对GPT模型的性能表示了赞赏，认为它们在很多领域已经展现出强大的应用价值。

来源：

新智元公众号【阅读原文】
Tags：AGI GPT-4 推理能力提示脑筋急转弯

12个月前

15 秒语音片段就能合成某人声音，OpenAI 小规模开放 Voice Engine 模型

OpenAI近期宣布，它已开始有限度地开放其创新Voice Engine的访问，这是一种能根据15秒语音片段创造合成语音的先进技术。这一举措旨在通过小规模的实操部署，逐步推动产品的成熟和完善，同时在实践中探索Voice Engine在各个行业中的广泛应用。OpenAI已经向几家领先公司，如教育科技领域的Age of Learning、视觉故事平台HeyGen、医疗健康软件制造商Dimagi、人工智能通讯应用开发商Livox和健康系统Lifespan，提供了初步的访问权限。 Age of Learning已经在使用这项技术制作预设的语音旁白，并利用GPT-4生成实时、个性化的学生...

来源：

IT之家【阅读原文】
Tags：GPT-4 OpenAI Voice Engine 合成语音教育科技

1年前 (2024)

马斯克突发Grok 1.5！上下文长度至128k、HumanEval得分超GPT-4

特斯拉CEO马斯克近期推出了Grok模型的最新升级版——Grok 1.5，该模型在推理能力和上下文处理上实现了显著提升。新版本的Grok上下文长度增加至128k，与GPT-4相当，这意味着它可以更好地理解和处理复杂及长篇幅的输入。在推理性能上，Grok 1.5在数学和编程任务上的表现超过了GPT-4和其他一些知名大模型。在MATH和HumanEval基准测试中，Grok 1.5取得了优异的成绩。值得注意的是，Grok 1.5采用了独特的分布式训练架构，不依赖Python和Pytorch，而是利用Rust、JAX和Kubernetes进行构建，并拥有自定义训练协调器以提高训练效率和稳...

来源：

量子位【阅读原文】
Tags：GPT-4 Grok-1.5 上下文长度推理性能马斯克

1年前 (2024)

优于人类专家，GPT-4 准确注释单细胞类型，成本低且稳健

在最新的科研成果中，哥伦比亚大学和杜克大学的研究人员发现，大型语言模型GPT-4能够在单细胞RNA测序分析中有效进行细胞类型注释，极大地减少了传统方法中的人工工作量。这项研究发表在《Nature Methods》上，展示了GPT-4在生物医学领域的潜力。GPT-4通过使用标记基因信息，可以准确地识别细胞类型，与手动注释的一致性很高。研究人员为此开发了R软件包GPTCelltype，以支持自动化注释过程。 GPT-4在多个数据集和多种组织类型的测试中表现出色，尤其是在免疫细胞如粒细胞的识别上。然而，它在某些复杂情况下，如B淋巴瘤的识...

来源：

机器之心【阅读原文】
Tags：GPT-4 GPTCelltype 单细胞RNA测序细胞类型注释自动化分析

1年前 (2024)

Claude 3再次登顶！化学专业一骑绝尘，全面碾压GPT-4

Claude3，全球领先的通用人工智能模型，再次引起轰动，尤其在化学任务上展现出超越GPT-4的强大能力。OSU团队创建的SMolInstruct数据集针对化学任务进行了指令微调，使得大型语言模型（LLM）能够胜任这些专业任务。通过对Galactica、Llama2、Code Llama和Mistral等四个开源LLM的微调，诞生了专门的LlaSMol模型，其在化学任务上的表现远超未微调的LLM，甚至在某些方面接近最先进的任务特定模型。在SMolInstruct基准测试中，尽管Claude3Opus不敌LlaSMol，但仍然在多数任务上优于GPT-4，证明了其在专业领域的学习优势。随着LLM的...

来源：

新智元公众号【阅读原文】
Tags：Claude3 GPT-4 LLM 化学任务指令微调

1年前 (2024)

微软英伟达力挺，OpenAI强敌出手：训练计算量仅40%、性能直逼GPT-4！

近日，美国AI新秀Inflection AI发布Inflection-2.5大模型，其性能可媲美GPT-4，但训练成本仅为GPT-4的40%。这款智能聊天机器人Pi现可在多种平台上免费体验，为用户提供个性化AI服务。近一个月内，GPT-4已面临多个强劲对手，标志着大模型领域的竞争加剧。 Inflection AI由前DeepMind科学家和LinkedIn创始人共同创建，今年6月获得13亿美元融资，估值40亿美元，成为全球第四大生成式AI公司。公司致力于构建世界最大的AI计算集群，并推出了具备同理心和安全性的Pi聊天助手。 Inflection-2.5模型拥有高智商和独特个性，四大亮点...

来源：

智东西【阅读原文】
Tags：GPT-4 Inflection AI Pi聊天机器人大语言模型生成式AI

1年前 (2024)

击败GPT-4的那群人

Claude3，新一代AI大模型，由 Anthropic 公司推出，以其在多个领域的卓越性能超越了GPT-4。该模型分为三档，最高级的 Claude3Opus 在数学、编程、多语种理解和视觉任务上树立新标准，其知识相当于人类本科生水平。值得注意的是，Claude3在安全性上的独特优势，采用“宪法 AI”训练技术，遵循多元化的道德准则，以减少有害言论的产生。 Anthropic，由前OpenAI员工创立，专注于AI安全，其公益企业身份允许他们在追求利润的同时履行社会责任。公司得到了有效利他主义者的支持，包括富有的科技高管投资。尽管对安全的重视可能导致...

来源：

机器之能公众号【阅读原文】
Tags：AI safety Anthropic Claude3 GPT-4 OpenAI

1年前 (2024)

1 2 345