阿里云PAI Model Gallery支持一键部署DeepSeek-V3和DeepSeek-R1模型
感谢IT之家网友的线索提供,阿里云计算有限公司近日宣布,其PAI Model Gallery平台已支持云上一键部署DeepSeek-V3和DeepSeek-R1模型。以下是详细的部署步骤:
第一步:进入Model Gallery页面
1. 访问以下链接进入阿里云PAI控制台:[https://pai.console.aliyun.com/#/quick-start/models](https://pai.console.aliyun.com/#/quick-start/models)。
2. 登录后,在顶部左上角选择合适的地域。
3. 在左侧导航栏中选择“工作空间列表”,点击指定的工作空间名称,进入对应的工作空间。
4. 最后,在左侧导航栏中选择“快速开始 > Model Gallery”。
第二步:进入DeepSeek模型详情页
1. 在Model Gallery页面的模型列表中,找到并点击需要部署的模型卡片,例如“DeepSeek-R1-Distill-Qwen-7B”模型,进入模型详情页面。
第三步:一键部署DeepSeek模型生成服务
1. 在模型详情页面的右上角点击“部署”按钮。
2. 当前支持的部署方式:
– DeepSeek-R1:支持vLLM加速部署。
– DeepSeek-V3:支持vLLM加速部署和Web应用部署。
– DeepSeek-R1蒸馏小模型:支持BladeLLM(阿里云PAI自研高性能推理框架)和vLLM加速部署。
3. 选择部署方式和资源后,点击确认即可完成一键部署,生成一个PAI-EAS服务。
4. 部署成功后,可以在服务页面点击“查看调用信息”获取调用的Endpoint和Token。有关服务调用方式的详细说明,请返回模型介绍页查看。
需要注意的是,官方教程中部署的模型为蒸馏过后的DeepSeek-R1-Distill-Qwen-7B。通过蒸馏技术,将推理模式迁移到较小的Qwen模型上,提高了推理效率。此外,PAI Model Gallery还提供DeepSeek-R1和DeepSeek-V3原始模型的一键部署功能。
据此前报道,Gitee AI联合沐曦发布了全套DeepSeek R1千问蒸馏模型,支持全免费体验。秘塔AI也已接入满血版DeepSeek R1推理模型。同时,腾讯云也推出了DeepSeek-R1大模型,并宣称“一键部署、3分钟调用”。
广告声明:本文包含对外跳转链接(包括但不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。所有文章均包含此声明。
本文来源: