标签：Deepseek-v3

阿里云PAI推出DeepSeek-V3与DeepSeek-R1模型部署服务，支持云上一键部署及高效推理框架

阿里云PAI Model Gallery支持一键部署DeepSeek-V3和DeepSeek-R1模型感谢IT之家网友的线索提供，阿里云计算有限公司近日宣布，其PAI Model Gallery平台已支持云上一键部署DeepSeek-V3和DeepSeek-R1模型。以下是详细的部署步骤：第一步：进入Model Gallery页面 1. 访问以下链接进入阿里云PAI控制台：[https：//pai.console.aliyun.com/#/quick-start/models](https：//pai.console.aliyun.com/#/quick-start/models)。 2. 登录后，在顶部左上角选择合适的地域。 3. 在左侧导航栏中选择“工作空间列表”，点击指定的工作空间...

来源：

IT之家【阅读原文】
Tags：DeepSeek-R1 Deepseek-v3 推理框架模型部署阿里云PAI

2个月前

阿里除夕新春发布Qwen2.5-Max，通义千问AI模型全面升级，轻松超越DeepSeek V3，助力开发者快速打造创意小游戏

阿里发布Qwen2.5-Max，性能超越DeepSeek V3及多个大模型农历除夕夜，阿里云旗下的通义千问（Qwen）团队发布了最新的Qwen2.5-Max模型，为新春佳节献上了一份特别的礼物。这款新模型在多个基准测试中表现优异，超越了当红炸子鸡DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o和Claude-3.5-Sonnet。多个基准测试中的卓越表现 Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等多个基准测试中均表现出色，尤其在MMLU-Pro等针对模型知识理解和推理能力的基准测试中，其表现尤为突出。该模型经过超过20万...

来源：

量子位【阅读原文】
Tags：AI模型 Deepseek-v3 Qwen2.5-Max 新春发布通义千问

2个月前

中信证券：DeepSeek-V3发布，大幅提升AI大模型的训练效率与推理速度，推动AI产业链快速发展

12月30日，中信证券发布研报指出，DeepSeek-V3的正式发布在AI行业内引起了广泛关注。这款新一代模型不仅保持了强大的模型能力，还在训练效率和推理速度上实现了显著提升。以下是整理后的文章 DeepSeek-V3引领AI普惠新时代近日，DeepSeek-V3的正式发布在AI行业掀起了新一轮热潮。作为一款备受瞩目的AI大模型，DeepSeek-V3不仅继承了前代产品的卓越性能，更在训练效率和推理速度方面取得了突破性进展。这一进步标志着AI技术正逐步迈向普惠化，为更多应用场景提供强有力的支持。高效训练与推理加速 DeepSeek-V3的发布不仅...

来源：

界面新闻【阅读原文】
Tags：AI产业链 AI大模型 Deepseek-v3 推理速度训练效率

3个月前

Deepseek-v3开源LLM新模型意外曝光！编程跑分在LiveBench上一举超越Claude 3.5 Sonnet，MoE架构助力性能飞跃

Deepseek新模型意外曝光，编程跑分超越Claude 3.5 Sonnet，登顶LiveBench最强开源LLM宝座近日，Deepseek-v3在未正式宣布的情况下意外曝光，并迅速引发广泛关注。据Reddit网友爆料，Deepseek-v3已在API和网页上发布，多个评测榜单也相继出炉。在Aider多语言编程测试排行榜中，Deepseek-v3一举超越了Claude 3.5 Sonnet，紧随o1之后位列第二，完成率从v2.5的17.8%大幅提升至48.4%。同时，在LiveBench测评中，Deepseek-v3成为当前最强的开源大语言模型（LLM），在非推理模型中仅次于gemini-exp-1206，排名第二。目前，Hugg...

来源：

量子位【阅读原文】
Tags：Deepseek-v3 LiveBench MOE架构开源LLM 编程跑分

3个月前