标签:Colossal-AI

DeepSeek V3/R1搭配Colossal-AI,实现低成本构建与高效模型微调,强化学习性能提升,硬件要求直降10倍!

DeepSeek V3/R1 引领潮流,Colossal-AI 助力低成本高质量模型构建 DeepSeek V3/R1 正在全网掀起热潮,其基于原始模型的解决方案和 API 服务已广泛普及。面对低价和免费的竞争压力,如何通过后训练(post-training)结合专业领域数据,站在巨人的肩膀上,打造高质量私有模型,提升业务竞争力与价值?Colossal-AI 提供了强大的支持。 Colossal-AI 是一款开源大模型后训练工具箱,已获得近 4 万 GitHub Star。它为开发者提供了丰富的功能,包括: - 低成本微调:支持满血版 671B LoRA 的 DeepSeek V3/R1 模型进行低成本监督...

释放昇腾澎湃算力!潞晨联合华为推出ColossalAI Platform云平台,大模型时代的秘密武器

国内AI公司潞晨科技携手华为,推出创新算力解决方案,应对OpenAI的Sora模型带来的挑战和日益增长的算力需求。他们共同开发的Colossal-AI云平台和昇腾训推一体机,旨在降低大模型开发成本和提高性能。Colossal-AI是一套通用深度学习系统,与微软DeepSpeed和英伟达Megatron竞争,其开源版本Open-Sora能减少46%的复现成本。此外,ColossalAI Platform提供一体化开发部署环境,降低用户门槛,而潞晨昇腾训推一体机则实现与英伟达高端产品的性能对齐。这一合作为解决AI算力瓶颈提供了国产化选择,助力大模型产业快速发展。