标签:大语言模型
最强开源大模型Llama 3来了!4000亿参数模型狙击GPT-4,训练数据量达Llama 2七倍
Meta公司最近发布了其最先进的开源大模型——Llama 3系列,包括8B和70B两个版本,这些模型在多项基准测试中超越了其他开源和闭源模型。Llama 3 8B在MMLU、GPQA等任务上优于谷歌的Gemma 7B和Mistral 7B Instruct,而70B版本则在相同基准上超过了闭源的谷歌Gemini Pro 1.5和Claude 3 Sonnet。Llama 3系列的最大模型规模预计将超过4000亿参数,标志着开源模型的一个重要里程碑。 Llama 3基于超过15T的公开数据进行预训练,数据量是前一代Llama 2的七倍,代码量也增加了四倍。训练效率相较于Llama 2提高了三倍。Meta的AI助手已经...
OpenAI举办推介会,阿尔特曼承诺不用API收集的数据训练未ChatGPT版本
OpenAI,一家领先的AI研发公司,最近举办了一系列的推广活动,其CEO山姆・阿尔特曼在多个重要城市进行了演讲,包括旧金山、纽约和伦敦,向各大行业,如金融、医疗保健和能源的高层管理人员保证,OpenAI将不会利用API收集的客户数据来增强其大语言模型(LLMs)。这些活动旨在向关键决策者展示OpenAI的一系列创新产品,如ChatGPT Enterprise和文本转视频模型。阿尔特曼亲自出席,并与其他高管,如首席运营官Brad Lightcap一起,详细阐述了公司的数据隐私政策,强调通过ChatGPT Enterprise获取的数据不会用于未来模型的改进。 ...
360 智脑 7B 参数大模型开源,支持 50 万字长文本输入
360公司最近在GitHub上公开了其创新项目——360智脑7B,这是一个具有70亿参数的大型模型,旨在推动人工智能技术的发展。该模型基于3.4万亿的Tokens语料库进行训练,涵盖了中文、英文和代码等多种语言类型。360公司强调,360K版本(约50万字)是目前中国国产开源模型中最长的文本长度。 在OpenCompass的一系列主流评估数据集中,360智脑7B表现出色,参与了C-Eval、AGIEval、MMLU、CMMLU、HellaSwag、MATH、GSM8K、HumanEval、MBPP、BBH、LAMBADA等任务,展示了其在自然语言理解、知识、数学计算推理、代码生成和逻辑推理等多个...
大模型做时序预测也很强!华人团队激活LLM新能力,超越一众传统模型实现SOTA
近日,一支由华人组成的团队揭示了大语言模型在时序预测领域的惊人潜力,无需额外训练即可超越传统时序模型,实现最新最优技术(SOTA)。该团队来自蒙纳士大学、蚂蚁集团和IBM研究院,他们提出了一种创新的通用框架,即“Time-LLM”,能够激活大语言模型处理跨模态时序数据的能力。 时序预测对于各类复杂系统的决策至关重要,如城市规划、能源管理、交通控制和遥感分析。借助Time-LLM,大模型有望革新时序数据的挖掘方法。该框架的核心技术包括时序输入重编程和提示做前缀,使得大语言模型能够理解和处理时序数据,同时增强了...
拒绝白人与亚洲人同框,Meta图像生成器的“歧视”,被人挖出来了
在当前的人工智能领域,AI系统的偏见问题日益凸显,尤其是在大语言模型和图像生成工具中。以谷歌的Gemini为例,该图像生成器曾因拒绝描绘白人并产生错误的性别、种族图像而引发争议。最近,Meta的AI图像生成器也暴露出类似的问题,无法准确地生成反映不同种族组合的图像,特别是涉及亚洲男性与白人女性或亚洲女性与白人男性的场景。The Verge进行了一系列测试,发现无论怎样调整提示词,Meta的图像生成器仍然倾向于生成亚洲人形象,甚至在某些情况下,南亚女性会被默认穿上纱丽。这一现象揭示了AI在处理多元文化图像时的局限...
GPT4单项仅7.1分,揭露大模型写代码三大短板,最新基准测试来了
随着AI技术的飞速进步,一款名为Devin的AI软件工程师横空出世,它在软件开发全周期中展现出卓越的能力,引发业界热议。在SWE-Bench基准测试中,Devin解决问题的能力远超GPT-4,展示了其在GitHub问题解决上的强大实力。然而,上海人工智能实验室、字节跳动SE Lab和SWE-Bench团队共同推出了新的测试基准DevBench,以揭示大模型在软件开发中的局限性。DevBench评估了从产品需求文档到项目开发各阶段,包括软件设计、环境设置、代码实现、集成测试和单元测试。实验表明,大模型在面向对象编程、复杂脚本编写和参数匹配等方面仍有...
高通推出第三代骁龙7+移动平台,支持广泛的AI模型
高通技术公司在近期的新闻中披露,他们已正式发布了创新性的第三代骁龙7+移动处理平台,将前沿的生成式人工智能技术带入了骁龙7系列。这个新平台具备对各种人工智能模型的强大支持,包括业界知名的Baichuan-7B、Gemini Nano、Llama 2以及智谱ChatGLM等大型语言模型。此举预示着移动设备的智能应用将迎来新的高度。 一加、真我realme和夏普等知名品牌已确认将成为首批采用这款新平台的制造商,预计搭载第三代骁龙7+移动平台的智能终端将会在不久的将来陆续上市,为消费者带来更为智能化和高效的使用体验。这一激动人心的进展...
马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI
马斯克近期做出了一个重大决定,开源了名为Grok-1的大型语言模型,使其成为目前参数量最大的开源模型,拥有3140亿参数,超过OpenAI的GPT-3.5。Grok-1的开源封面图由Midjourney生成,象征着“AI帮助AI”的理念。该模型遵循Apache 2.0协议,允许用户自由使用、修改和分发,无论个人还是商业。尽管使用Grok-1可能需要大量GPU内存,但其开源性质已吸引了大量关注,GitHub上的星标数量不断攀升。 Grok-1由马斯克的AI初创公司xAI在四个月内开发完成,先期的Grok-0模型在标准测试中表现接近Meta的Llama2。经过优化,Grok-1在HumanEva...
微软英伟达力挺,OpenAI强敌出手:训练计算量仅40%、性能直逼GPT-4!
近日,美国AI新秀Inflection AI发布Inflection-2.5大模型,其性能可媲美GPT-4,但训练成本仅为GPT-4的40%。这款智能聊天机器人Pi现可在多种平台上免费体验,为用户提供个性化AI服务。近一个月内,GPT-4已面临多个强劲对手,标志着大模型领域的竞争加剧。 Inflection AI由前DeepMind科学家和LinkedIn创始人共同创建,今年6月获得13亿美元融资,估值40亿美元,成为全球第四大生成式AI公司。公司致力于构建世界最大的AI计算集群,并推出了具备同理心和安全性的Pi聊天助手。 Inflection-2.5模型拥有高智商和独特个性,四大亮点...
OpenAI和谷歌,AI对线中的飞驰人生
在AI领域,OpenAI似乎始终领先谷歌一步,尽管两者拥有相似的目标和技术资源。谷歌,作为北美AI巨头之一,试图通过推出新产品来追赶,例如Gemini1.5,但每次都未能超越OpenAI的创新,如Sora和GPT系列。OpenAI的快速进展在某种程度上反映了其在技术路线上的专注,以Transformer为基础构建强大的语言模型。相比之下,谷歌的DeepMind虽然技术广泛,但分散的投资和缓慢的成果转化使其在AGI竞赛中落后。 谷歌已经意识到问题,采取了合并AI团队、调整战略等措施,Gemini1.5的优异表现证明了其追赶的决心。然而,OpenAI的高效研发团...