标签:大语言模型

GPT4单项仅7.1分,揭露大模型写代码三大短板,最新基准测试来了

随着AI技术的飞速进步,一款名为Devin的AI软件工程师横空出世,它在软件开发全周期中展现出卓越的能力,引发业界热议。在SWE-Bench基准测试中,Devin解决问题的能力远超GPT-4,展示了其在GitHub问题解决上的强大实力。然而,上海人工智能实验室、字节跳动SE Lab和SWE-Bench团队共同推出了新的测试基准DevBench,以揭示大模型在软件开发中的局限性。DevBench评估了从产品需求文档到项目开发各阶段,包括软件设计、环境设置、代码实现、集成测试和单元测试。实验表明,大模型在面向对象编程、复杂脚本编写和参数匹配等方面仍有...

高通推出第三代骁龙7+移动平台,支持广泛的AI模型

高通技术公司在近期的新闻中披露,他们已正式发布了创新性的第三代骁龙7+移动处理平台,将前沿的生成式人工智能技术带入了骁龙7系列。这个新平台具备对各种人工智能模型的强大支持,包括业界知名的Baichuan-7B、Gemini Nano、Llama 2以及智谱ChatGLM等大型语言模型。此举预示着移动设备的智能应用将迎来新的高度。 一加、真我realme和夏普等知名品牌已确认将成为首批采用这款新平台的制造商,预计搭载第三代骁龙7+移动平台的智能终端将会在不久的将来陆续上市,为消费者带来更为智能化和高效的使用体验。这一激动人心的进展...

马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI

马斯克近期做出了一个重大决定,开源了名为Grok-1的大型语言模型,使其成为目前参数量最大的开源模型,拥有3140亿参数,超过OpenAI的GPT-3.5。Grok-1的开源封面图由Midjourney生成,象征着“AI帮助AI”的理念。该模型遵循Apache 2.0协议,允许用户自由使用、修改和分发,无论个人还是商业。尽管使用Grok-1可能需要大量GPU内存,但其开源性质已吸引了大量关注,GitHub上的星标数量不断攀升。 Grok-1由马斯克的AI初创公司xAI在四个月内开发完成,先期的Grok-0模型在标准测试中表现接近Meta的Llama2。经过优化,Grok-1在HumanEva...

微软英伟达力挺,OpenAI强敌出手:训练计算量仅40%、性能直逼GPT-4!

近日,美国AI新秀Inflection AI发布Inflection-2.5大模型,其性能可媲美GPT-4,但训练成本仅为GPT-4的40%。这款智能聊天机器人Pi现可在多种平台上免费体验,为用户提供个性化AI服务。近一个月内,GPT-4已面临多个强劲对手,标志着大模型领域的竞争加剧。 Inflection AI由前DeepMind科学家和LinkedIn创始人共同创建,今年6月获得13亿美元融资,估值40亿美元,成为全球第四大生成式AI公司。公司致力于构建世界最大的AI计算集群,并推出了具备同理心和安全性的Pi聊天助手。 Inflection-2.5模型拥有高智商和独特个性,四大亮点...

OpenAI和谷歌,AI对线中的飞驰人生

在AI领域,OpenAI似乎始终领先谷歌一步,尽管两者拥有相似的目标和技术资源。谷歌,作为北美AI巨头之一,试图通过推出新产品来追赶,例如Gemini1.5,但每次都未能超越OpenAI的创新,如Sora和GPT系列。OpenAI的快速进展在某种程度上反映了其在技术路线上的专注,以Transformer为基础构建强大的语言模型。相比之下,谷歌的DeepMind虽然技术广泛,但分散的投资和缓慢的成果转化使其在AGI竞赛中落后。 谷歌已经意识到问题,采取了合并AI团队、调整战略等措施,Gemini1.5的优异表现证明了其追赶的决心。然而,OpenAI的高效研发团...
123