标签：Qwen2.5

Predibase发布全球首个端到端强化微调平台，支持Qwen2.5大模型训练与深度学习无服务器方法

随着人工智能技术的快速发展，大模型训练和开发平台的需求日益增加。近日，Predibase 推出了一款全新的端到端强化微调（RFT）平台，该平台完全托管且无需服务器支持，为用户提供了更加便捷高效的解决方案。 Predibase 表示，DeepSeek-R1 的开源引发了全球 AI 领域的高度关注，许多人开始意识到强化学习微调在大模型训练中的重要性。基于这一启发，Predibase 开发了这款无服务器的端到端强化微调平台。与传统的监督式微调相比，RFT 不需要大量标注数据，而是通过奖励机制和自定义函数实现持续强化学习，同时支持从数据管理、...

来源：

IT之家【阅读原文】
Tags：Predibase Qwen2.5 大模型训练强化微调深度学习

2周前

创造历史：阿里通义开源模型Qwen2.5在Chatbot Arena上超越Llama，引领大语言模型潮流

近日，基准测试平台Chatbot Arena公布了最新的大模型盲测排行榜，阿里巴巴的通义千问开源模型Qwen2.5再次成功跻身全球前十。具体而言，Qwen2.5-72B-Instruct在大语言模型（LLM）榜单中排名第10，成为唯一进入前十名的中国大模型。此外，Qwen系列中的视觉语言模型Qwen2-VL-72B-Instruct也在Vision榜单中排名第九，是当前得分最高的开源大模型。与此同时，Qwen系列在全球开源社区中的影响力显著提升，基于Qwen系列的衍生模型数量已突破7.43万个，超过了Llama系列的7.28万个。这标志着通义千问Qwen已经成为世界上最大的生成式...

来源：

量子位【阅读原文】
Tags：Chatbot Arena Qwen2.5 大语言模型开源模型通义千问

6个月前