标签:GPT-4
开源模型打败GPT-4!LLM竞技场最新战报,Cohere Command R+上线
在AI领域,开源模型Cohere的Command R+近期在LLM竞技场中击败了GPT-4,引发了广泛关注。这款模型在4月11日的排行榜上超越了早期版本的GPT-4,与GPT-4-0314并列第7,成为首个在性能上胜过GPT-4的开源模型。尽管OpenAI迅速推出了GPT-4-Turbo-2024-04-09版本夺回榜首,但Command R+的开源特性仍为开源社区带来了荣耀。Cohere的机器学习总监Nils Reimers指出,Command R+的真正实力在于RAG和工具使用,而这在竞技场中并未完全展现。 Command R+不仅在性能上优于竞争对手,而且价格更低。Cohere已与多家大企业合作,将LLM部署到A...
看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3
AI初创公司Reka近期推出了创新的多模态语言模型Reka Core,该模型展现出理解图像、音频和视频等多元数据的卓越能力,成为继谷歌Gemini Ultra之后的又一瞩目之作。Reka Core在性能上与GPT-4相当,证明了其研发团队的努力成果。这款模型是通过数千台H100设备训练得出,支持32种语言和大量词汇上下文,尤其擅长处理长篇文档。Reka Core不仅在视频感知测试中超越Gemini Ultra,在图像任务的MMMU基准测试中也有出色表现,与行业领先模型相媲美。尽管训练时间较短,但其性能已超越许多顶级AI模型。值得注意的是,Reka Core具备强大...
AI日报:PR重大更新!Sora加入Adobe全家桶;文心大模型4.0工具版发布;世界首届AI选美大赛开始;GPT-4整顿学术圈
在这个快速发展的AI时代,每天都有新变化。今天,让我们一起探索一下人工智能领域的最新动态。首先,Adobe Premiere Pro引领了一场视频编辑革命,引入AI工具Firefly,让编辑工作变得前所未有的简单高效。用户现在可以享受到对象添加、移除等创新功能,大大提升了创作自由度。 另一边,百度Create AI开发者大会释放了三大重要信号:文心大模型4.0的发布、智能计算操作系统万源的推出,以及AgentBuilder、AppBuilder、ModelBuilder工具的诞生,降低了开发门槛。同时,GPT-4Turbo在Chatbot Arena中脱颖而出,重新证明了其作为...
GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%
本文讲述了关于人工智能模型GPT-4和Claude3在解决一个看似简单的脑筋急转弯推理题上的表现。一位开发者质疑GPT模型在训练集之外缺乏推理能力,认为它们无法实现人工智能(AGI),并悬赏1万美元发起挑战。然而,很快就有网友通过巧妙的提示让GPT-4和Claude3成功解决了这个问题,证明了模型的潜力。开发者Taelin承认了自己的错误,并支付了奖金。文章还讨论了模型的局限性,如无法进行长期逻辑推理,以及提示的重要性。尽管如此,人们还是对GPT模型的性能表示了赞赏,认为它们在很多领域已经展现出强大的应用价值。
15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型
OpenAI近期宣布,它已开始有限度地开放其创新Voice Engine的访问,这是一种能根据15秒语音片段创造合成语音的先进技术。这一举措旨在通过小规模的实操部署,逐步推动产品的成熟和完善,同时在实践中探索Voice Engine在各个行业中的广泛应用。OpenAI已经向几家领先公司,如教育科技领域的Age of Learning、视觉故事平台HeyGen、医疗健康软件制造商Dimagi、人工智能通讯应用开发商Livox和健康系统Lifespan,提供了初步的访问权限。 Age of Learning已经在使用这项技术制作预设的语音旁白,并利用GPT-4生成实时、个性化的学生...
马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4
特斯拉CEO马斯克近期推出了Grok模型的最新升级版——Grok 1.5,该模型在推理能力和上下文处理上实现了显著提升。新版本的Grok上下文长度增加至128k,与GPT-4相当,这意味着它可以更好地理解和处理复杂及长篇幅的输入。在推理性能上,Grok 1.5在数学和编程任务上的表现超过了GPT-4和其他一些知名大模型。在MATH和HumanEval基准测试中,Grok 1.5取得了优异的成绩。值得注意的是,Grok 1.5采用了独特的分布式训练架构,不依赖Python和Pytorch,而是利用Rust、JAX和Kubernetes进行构建,并拥有自定义训练协调器以提高训练效率和稳...
优于人类专家,GPT-4 准确注释单细胞类型,成本低且稳健
在最新的科研成果中,哥伦比亚大学和杜克大学的研究人员发现,大型语言模型GPT-4能够在单细胞RNA测序分析中有效进行细胞类型注释,极大地减少了传统方法中的人工工作量。这项研究发表在《Nature Methods》上,展示了GPT-4在生物医学领域的潜力。GPT-4通过使用标记基因信息,可以准确地识别细胞类型,与手动注释的一致性很高。研究人员为此开发了R软件包GPTCelltype,以支持自动化注释过程。 GPT-4在多个数据集和多种组织类型的测试中表现出色,尤其是在免疫细胞如粒细胞的识别上。然而,它在某些复杂情况下,如B淋巴瘤的识...
Claude 3再次登顶!化学专业一骑绝尘,全面碾压GPT-4
Claude3,全球领先的通用人工智能模型,再次引起轰动,尤其在化学任务上展现出超越GPT-4的强大能力。OSU团队创建的SMolInstruct数据集针对化学任务进行了指令微调,使得大型语言模型(LLM)能够胜任这些专业任务。通过对Galactica、Llama2、Code Llama和Mistral等四个开源LLM的微调,诞生了专门的LlaSMol模型,其在化学任务上的表现远超未微调的LLM,甚至在某些方面接近最先进的任务特定模型。在SMolInstruct基准测试中,尽管Claude3Opus不敌LlaSMol,但仍然在多数任务上优于GPT-4,证明了其在专业领域的学习优势。随着LLM的...
微软英伟达力挺,OpenAI强敌出手:训练计算量仅40%、性能直逼GPT-4!
近日,美国AI新秀Inflection AI发布Inflection-2.5大模型,其性能可媲美GPT-4,但训练成本仅为GPT-4的40%。这款智能聊天机器人Pi现可在多种平台上免费体验,为用户提供个性化AI服务。近一个月内,GPT-4已面临多个强劲对手,标志着大模型领域的竞争加剧。 Inflection AI由前DeepMind科学家和LinkedIn创始人共同创建,今年6月获得13亿美元融资,估值40亿美元,成为全球第四大生成式AI公司。公司致力于构建世界最大的AI计算集群,并推出了具备同理心和安全性的Pi聊天助手。 Inflection-2.5模型拥有高智商和独特个性,四大亮点...
击败GPT-4的那群人
Claude3,新一代AI大模型,由 Anthropic 公司推出,以其在多个领域的卓越性能超越了GPT-4。该模型分为三档,最高级的 Claude3Opus 在数学、编程、多语种理解和视觉任务上树立新标准,其知识相当于人类本科生水平。值得注意的是,Claude3在安全性上的独特优势,采用“宪法 AI”训练技术,遵循多元化的道德准则,以减少有害言论的产生。 Anthropic,由前OpenAI员工创立,专注于AI安全,其公益企业身份允许他们在追求利润的同时履行社会责任。公司得到了有效利他主义者的支持,包括富有的科技高管投资。尽管对安全的重视可能导致...