标签：大语言模型

AI日报：Model3模型重磅发布；阿里云全面支持Llama 3训练推理；Gorq推出iOS应用；批量去水印工具VSR来了

欢迎来到【每日AI探索】！在这个栏目中，我们将每日更新关于人工智能的精华资讯，带你领略AI的无限魅力。今天，我们一起来关注一下近期AI领域的重大进展和创新产品。 1. Blockade Labs推出了令人瞩目的Model3模型，它在生成效果上实现了显著提升，支持高达8192x4096的超高清分辨率，增强了文本提示生成世界的能力，让内容更加清晰细腻。不仅如此，Model3还提供了免费体验机会，并展望了未来可能的功能扩展。 2. 阿里云宣布全面支持Llama3大语言模型的训练和推理，为开发者提供一站式解决方案，包括免费计算资源、快速对比...

来源：

站长之家【阅读原文】
Tags：Model3 人工智能动态排版大语言模型新闻

8个月前

最强开源大模型Llama 3来了！4000亿参数模型狙击GPT-4，训练数据量达Llama 2七倍

Meta公司最近发布了其最先进的开源大模型——Llama 3系列，包括8B和70B两个版本，这些模型在多项基准测试中超越了其他开源和闭源模型。Llama 3 8B在MMLU、GPQA等任务上优于谷歌的Gemma 7B和Mistral 7B Instruct，而70B版本则在相同基准上超过了闭源的谷歌Gemini Pro 1.5和Claude 3 Sonnet。Llama 3系列的最大模型规模预计将超过4000亿参数，标志着开源模型的一个重要里程碑。 Llama 3基于超过15T的公开数据进行预训练，数据量是前一代Llama 2的七倍，代码量也增加了四倍。训练效率相较于Llama 2提高了三倍。Meta的AI助手已经...

来源：

智东西【阅读原文】
Tags：Llama 3 Meta 大语言模型开源预训练数据

8个月前

OpenAI举办推介会，阿尔特曼承诺不用API收集的数据训练未ChatGPT版本

OpenAI，一家领先的AI研发公司，最近举办了一系列的推广活动，其CEO山姆・阿尔特曼在多个重要城市进行了演讲，包括旧金山、纽约和伦敦，向各大行业，如金融、医疗保健和能源的高层管理人员保证，OpenAI将不会利用API收集的客户数据来增强其大语言模型（LLMs）。这些活动旨在向关键决策者展示OpenAI的一系列创新产品，如ChatGPT Enterprise和文本转视频模型。阿尔特曼亲自出席，并与其他高管，如首席运营官Brad Lightcap一起，详细阐述了公司的数据隐私政策，强调通过ChatGPT Enterprise获取的数据不会用于未来模型的改进。 ...

来源：

iFeng科技【阅读原文】
Tags：ChatGPT Enterprise OpenAI 大语言模型山姆・阿尔特曼微软 Azure

8个月前

360 智脑 7B 参数大模型开源，支持 50 万字长文本输入

360公司最近在GitHub上公开了其创新项目——360智脑7B，这是一个具有70亿参数的大型模型，旨在推动人工智能技术的发展。该模型基于3.4万亿的Tokens语料库进行训练，涵盖了中文、英文和代码等多种语言类型。360公司强调，360K版本（约50万字）是目前中国国产开源模型中最长的文本长度。在OpenCompass的一系列主流评估数据集中，360智脑7B表现出色，参与了C-Eval、AGIEval、MMLU、CMMLU、HellaSwag、MATH、GSM8K、HumanEval、MBPP、BBH、LAMBADA等任务，展示了其在自然语言理解、知识、数学计算推理、代码生成和逻辑推理等多个...

来源：

IT之家【阅读原文】
Tags：360智脑7B 大语言模型开源微调训练代码长文本理解

8个月前

大模型做时序预测也很强！华人团队激活LLM新能力，超越一众传统模型实现SOTA

近日，一支由华人组成的团队揭示了大语言模型在时序预测领域的惊人潜力，无需额外训练即可超越传统时序模型，实现最新最优技术（SOTA）。该团队来自蒙纳士大学、蚂蚁集团和IBM研究院，他们提出了一种创新的通用框架，即“Time-LLM”，能够激活大语言模型处理跨模态时序数据的能力。时序预测对于各类复杂系统的决策至关重要，如城市规划、能源管理、交通控制和遥感分析。借助Time-LLM，大模型有望革新时序数据的挖掘方法。该框架的核心技术包括时序输入重编程和提示做前缀，使得大语言模型能够理解和处理时序数据，同时增强了...

来源：

量子位【阅读原文】
Tags：Time-LLM 大语言模型提示做前缀时序预测跨模态处理

8个月前

拒绝白人与亚洲人同框，Meta图像生成器的“歧视”，被人挖出来了

在当前的人工智能领域，AI系统的偏见问题日益凸显，尤其是在大语言模型和图像生成工具中。以谷歌的Gemini为例，该图像生成器曾因拒绝描绘白人并产生错误的性别、种族图像而引发争议。最近，Meta的AI图像生成器也暴露出类似的问题，无法准确地生成反映不同种族组合的图像，特别是涉及亚洲男性与白人女性或亚洲女性与白人男性的场景。The Verge进行了一系列测试，发现无论怎样调整提示词，Meta的图像生成器仍然倾向于生成亚洲人形象，甚至在某些情况下，南亚女性会被默认穿上纱丽。这一现象揭示了AI在处理多元文化图像时的局限...

来源：

iFeng科技【阅读原文】
Tags：AI偏见 Meta 图像生成器大语言模型数据集多样性

9个月前

GPT4单项仅7.1分，揭露大模型写代码三大短板，最新基准测试来了

随着AI技术的飞速进步，一款名为Devin的AI软件工程师横空出世，它在软件开发全周期中展现出卓越的能力，引发业界热议。在SWE-Bench基准测试中，Devin解决问题的能力远超GPT-4，展示了其在GitHub问题解决上的强大实力。然而，上海人工智能实验室、字节跳动SE Lab和SWE-Bench团队共同推出了新的测试基准DevBench，以揭示大模型在软件开发中的局限性。DevBench评估了从产品需求文档到项目开发各阶段，包括软件设计、环境设置、代码实现、集成测试和单元测试。实验表明，大模型在面向对象编程、复杂脚本编写和参数匹配等方面仍有...

来源：

量子位【阅读原文】
Tags：AI软件工程师 DevBench Devin SWE-Bench 大语言模型

9个月前

高通推出第三代骁龙7+移动平台，支持广泛的AI模型

高通技术公司在近期的新闻中披露，他们已正式发布了创新性的第三代骁龙7+移动处理平台，将前沿的生成式人工智能技术带入了骁龙7系列。这个新平台具备对各种人工智能模型的强大支持，包括业界知名的Baichuan-7B、Gemini Nano、Llama 2以及智谱ChatGLM等大型语言模型。此举预示着移动设备的智能应用将迎来新的高度。一加、真我realme和夏普等知名品牌已确认将成为首批采用这款新平台的制造商，预计搭载第三代骁龙7+移动平台的智能终端将会在不久的将来陆续上市，为消费者带来更为智能化和高效的使用体验。这一激动人心的进展...

来源：

界面新闻【阅读原文】
Tags：大语言模型生成式AI 移动平台第三代骁龙7+ 高通

9个月前

马斯克用行动反击开源自家顶级大模型压力给到OpenAI

马斯克近期做出了一个重大决定，开源了名为Grok-1的大型语言模型，使其成为目前参数量最大的开源模型，拥有3140亿参数，超过OpenAI的GPT-3.5。Grok-1的开源封面图由Midjourney生成，象征着“AI帮助AI”的理念。该模型遵循Apache 2.0协议，允许用户自由使用、修改和分发，无论个人还是商业。尽管使用Grok-1可能需要大量GPU内存，但其开源性质已吸引了大量关注，GitHub上的星标数量不断攀升。 Grok-1由马斯克的AI初创公司xAI在四个月内开发完成，先期的Grok-0模型在标准测试中表现接近Meta的Llama2。经过优化，Grok-1在HumanEva...

来源：

财联社【阅读原文】
Tags：Grok-1 参数量大语言模型开源马斯克

9个月前

微软英伟达力挺，OpenAI强敌出手：训练计算量仅40%、性能直逼GPT-4！

近日，美国AI新秀Inflection AI发布Inflection-2.5大模型，其性能可媲美GPT-4，但训练成本仅为GPT-4的40%。这款智能聊天机器人Pi现可在多种平台上免费体验，为用户提供个性化AI服务。近一个月内，GPT-4已面临多个强劲对手，标志着大模型领域的竞争加剧。 Inflection AI由前DeepMind科学家和LinkedIn创始人共同创建，今年6月获得13亿美元融资，估值40亿美元，成为全球第四大生成式AI公司。公司致力于构建世界最大的AI计算集群，并推出了具备同理心和安全性的Pi聊天助手。 Inflection-2.5模型拥有高智商和独特个性，四大亮点...

来源：

智东西【阅读原文】
Tags：GPT-4 Inflection AI Pi聊天机器人大语言模型生成式AI

10个月前

1 234