百度文心大模型全新升级:深度思考模型免费体验,多模态能力更强,API定价优惠空前,强化学习技术引领未来发展趋势

百度文心大模型迎来重大更新,全新版本文心大模型4.5和文心大模型X1正式上线官网,并免费开放给用户使用。此次更新不仅带来了更强大的多模态能力,还优化了模型的理解、规划、反思与进化能力。

文心大模型4.5:原生多模态的全面升级
文心大模型4.5作为百度自主研发的新一代原生多模态基础大模型,通过多个模态联合建模实现了协同优化,其语言、理解、生成、逻辑和记忆能力均得到了全面提升。具体来看,该模型在多模态能力方面已接近GPT-4o水平,而在文本能力上更是超越了DeepSeek-V3和GPT-4.5,平均得分达到79.6分。

背后的关键技术包括:
– FlashMask动态注意力掩码:提升了长序列建模能力和训练效率;
– 多模态异构专家扩展技术:解决了不同模态梯度不均衡的问题;
– 时空维度表征压缩技术:大幅提高了多模态数据训练效率;
– 基于知识点的大规模数据构建技术:构建了高知识密度预训练数据,降低了模型幻觉;
– 基于自反馈的Post-training技术:增强了模型对齐人类意图的能力。

文心大模型X1:深度思考模型的突破
文心大模型X1是百度推出的深度思考模型,具备更强的理解、规划、反思和进化能力。这款模型不仅支持多模态,还在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理等方面表现出色。特别值得一提的是,文心大模型X1能够“自主运用工具”,例如高级搜索、文档问答、AI绘图等。

以《寒窑赋》为例,文心大模型X1能够利用中国各朝代历史人物典故替换原文中的事例,展现出清晰的思维链和行动链。背后的关键技术包括:
– 递进式强化学习训练方法:提升了模型在创作、搜索、工具调用等场景的综合应用能力;
– 基于思维链和行动链的端到端训练:显著提升了训练效果;
– 多元统一的奖励系统:为模型训练提供了更加鲁棒的反馈。

API定价优势明显
两款全新文心大模型的API调用价格也已公布:
– 文心大模型4.5 API:输入价格0.004元/千tokens,输出价格0.016元/千tokens;
– 文心大模型X1 API:输入价格0.002元/千tokens,输出价格0.008元/千tokens。

与DeepSeek R1相比,文心大模型X1的价格便宜了一半,进一步降低了企业的使用成本。此外,百度计划于6月30日正式开源文心大模型,并预计在下半年发布文心大模型5.0。

更多详细评测可关注量子位的后续报道。
[文心一言官网](https://yiyan.baidu.com)

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...