标签:AI 模型
借助免费开源库,任何人都能在火山引擎上轻松开发DeepSeek AI模型应用
科技圈的开源热潮:从模型到应用的新时代 过去一周,科技圈可以用三个字概括:“开源周”。曾经各自为战的企业,在 DeepSeek 的推动下纷纷投身于开源浪潮。AI 领域的六小龙企业相继宣布加大模型开源力度,就连百度也加入了这一行列,承诺新一代模型将全面开源。最引人注目的是,远在大洋彼岸的 OpenAI 也不得不承认,自己可能站在了历史错误的一边。 火山引擎的独特入场方式 面对这股开源热潮,一向低调的火山引擎也坐不住了。与其他企业直接发布模型不同,火山引擎选择了一条不同的路径——推出“大模型应用实验室”。这个平台...
OpenAI首席研究官揭示:DeepSeek独立发现AI模型核心思路,英伟达助力降低推理成本,技术创新引发奥特曼和LeCun热议
深度解析:DeepSeek 引发的 AI 硬件需求变革与市场反应 春节期间,国内外 AI 圈被 DeepSeek 的新模型发布刷屏。英伟达市值蒸发近 6000 亿美元,引发了全球关注(参见《英伟达市值蒸发近 6000 亿美元,而 DeepSeek 刚刚又开源新模型》)。DeepSeek 最近发布的 DeepSeek-V3 和 DeepSeek-R1 模型以较低的成本实现了与 OpenAI 同类模型相当的性能,这引发了市场对高端 AI 硬件需求的担忧。 许多业内人士认为,DeepSeek 在硬件受限的情况下通过技术创新减少了对算力的需求,从而提升了性能。这种创新得到了包括 Sam Altman 在内...
揭秘GPT-5与Opus 3.5延迟发布背后:是否已通过蒸馏技术转化为成本效益更高的小模型?探索AI模型与AGI的未来发展
从基础模型到智慧传递:探索 AI 模型的隐藏秘密 近年来,AI 领域的发展日新月异,尤其是 OpenAI 和 Anthropic 等实验室的新一代大模型引发了广泛关注。本文将探讨这些实验室如何在幕后操作,通过内部使用高性能模型来优化其公开发布的产品,并揭示其中可能存在的策略和动机。 # GPT-5 的神秘面纱 OpenAI 的下一代大模型 GPT-5 引起了诸多猜测。尽管官方尚未正式发布,但有迹象表明它可能已经在内部运行并用于生成合成数据。这种做法不仅有助于提高现有模型的性能,还能有效控制成本。技术分析师 Alberto Romero 深入研究...
阶跃星辰推出 Step-1X-Medium AI 模型:图像生成提速30%,支持图生图垫图玩法,升级中国风创作工具
感谢IT之家网友 Skyraver 提供的线索!12月26日,据IT之家报道,“阶跃星辰”官方公众号于12月25日发布了一则重要消息,宣布推出全新的 Step-1X-Medium 增强 AI 模型。这款升级版模型在生成速度、理解能力、细节质感以及创作功能等方面都有显著提升,旨在成为创作者们更得力的助手。 Step-1X-Medium 的主要改进包括: 1. 生成速度提升:基于 MMDit 架构,新模型的生成速度提升了超过30%,大大缩短了等待时间。 2. 更强的理解能力:经过针对性训练,Step-1X-Medium 能更精准地理解用户指令,确保生成的与需求高度一致。 3. 自...
Claude 3.5 Haiku AI 模型:每百万 tokens 输入仅 1 美元,输出 5 美元,成本节省显著,API 定价优势明显
11月4日,Anthropic 发布了一篇博文,宣布开发者可以通过第一方API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 调用最新的 Claude 3.5 Haiku 模型。这款新模型在多个 AI 基准测试中超越了 Anthropic 上一代的最大模型 Claude 3 Opus,并且主要对标 OpenAI 的 GPT-4 Mini 和谷歌的 Gemini 1.5 Flash。 Claude 3.5 Haiku 目前仅支持文本模态,但未来将扩展到图像输入。最让开发者惊喜的是其定价策略:每百万 tokens 输入售价为 1 美元,每百万 tokens 输出售价为 5 美元。通过提示词缓存可以节省最多 90% 的成本,而使用 ...
苹果 AI 研究揭示:猕猴桃算术问题难倒 O1、Llama 等 20 多个顶级模型,逻辑推理能力受干扰项影响显著
11 月 2 日,据《洛杉矶时报》报道,苹果公司的研究团队对 20 个最先进的 AI 模型进行了测试,结果显示这些模型在处理包含干扰项的简单算术问题时表现不佳,甚至不如小学生。苹果团队设计了一道简单的算术题来测试这些 AI 模型,题目如下: Oliver 在星期五采摘了 44 个猕猴桃,星期六采摘了 58 个猕猴桃,星期日采摘的数量是星期五的两倍,但其中有 5 个猕猴桃比平均值要小。请问 Oliver 这三天共摘了多少个猕猴桃? 正确答案是 190 个,计算公式为:44(星期五)+ 58(星期六)+ 88(44 * 2,星期日)。然而,测试的 20 ...
面壁智能推出开源MiniCPM3-4B AI模型:端侧ChatGPT时代正式到来
近日,面壁智能在其官方公众号上宣布推出了全新的开源 MiniCPM3-4B AI 模型,并称这一模型标志着“端侧 ChatGPT 时代”的到来。这款新模型在性能方面超越了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,甚至可以与拥有 70 亿至 90 亿参数的其他 AI 模型相媲美。 相比于前两代产品 MiniCPM1.0 和 MiniCPM2.0,MiniCPM3-4B 在功能和应用范围上有了显著提升。它不仅支持函数调用和代码解释器,还具备更大的词汇量和更长的最大处理长度。以下是三个版本的主要区别: - 词汇量:123K → 73K → 73K - 模型层数:40 → 52 → 62 - ...
Meta 3D Gen AI 模型引领革命:1分钟快速创建基于物理的高质量3D内容,文本提示驱动创新渲染技术
在最新的技术突破中,Meta 公司推出了一项创新的人工智能模型——Meta 3D Gen(3DGen),这款模型能够迅速地根据用户的简单提示,在短短一分钟内创造出高分辨率的3D内容。Meta强调,3DGen生成的内容不仅拥有细腻的纹理和材质贴图,还支持基于物理的渲染技术,使用户可以对已生成的3D内容进行再创造,赋予它们全新的视觉效果。 Meta 3D Gen的核心包括两个主要部分:text-to-3D生成和text-to-texture生成。首先,当用户输入文本提示后,模型会利用AssetGen来构建初步的3D模型,这个过程大约需要30秒,产出带有纹理和PBR材质的3D...