标签：DeepSeek-R1

NVIDIA Blackwell助力DeepSeek-R1模型，通过TensorRT-LLM优化GPU推理性能，树立AI行业新标杆

随着科技的飞速发展，人工智能领域不断迎来新的突破。近日，英伟达在 NVIDIA GTC 2025 大会上宣布了一项重大成果：其 NVIDIA Blackwell DGX 系统成功创下 DeepSeek-R1 大模型推理性能的世界纪录。这项成就不仅展示了硬件与软件结合的强大潜力，还为未来的高性能计算奠定了坚实的基础。具体来说，在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行的 DeepSeek-R1 模型（参数规模达到 6710 亿）实现了每用户每秒超 250 token 的响应速度，系统最高吞吐量更是突破了每秒 3 万 token。这一性能的提升得益于 NVIDIA 平台在最新...

来源：

1个月前

DeepSeek-R1引领AI图像生成革新，Krea图像编辑工具大幅提升用户体验

在R1推理模型的热潮之后，DeepSeek迅速被多个平台集成，包括硅基流动这样的大型模型云服务平台、腾讯元宝这样的聊天机器人，甚至微信这样的顶级流量平台。然而，AI图像类产品中接入DeepSeek R1的消息却寥寥无几。令人惊讶的是，从DeepSeek-R1发布到Krea宣布上线新功能，仅用了短短10天时间，这在图像产品中堪称最快反应。 Krea率先“吃螃蟹”，降低用户门槛在Krea之前，已有部分平台集成了聊天机器人的生图和改图功能，如ChatGPT，但用户体验并不理想。尽管这些平台通过聊天机器人理解用户意图，但在实际生成和修改图片时...

来源：

白鲸出海公众号【阅读原文】
Tags：AI图像生成 DeepSeek-R1 Krea 图像编辑用户体验

2个月前

标题：小红书AI搜索革新生活决策，DeepSeek-R1带来全新搜索体验，点点能否撑起小红书的未来？

小红书的AI搜索新篇章：点点与DeepSeek-R1的强强联合近日，小红书旗下的独立AI搜索应用“点点”推出了备受瞩目的“深度思考”功能。据《钛媒体》报道，该功能背后的技术支持很可能是来自开源模型DeepSeek-R1。在微信、抖音等超级App纷纷构建闭环生态的大背景下，小红书选择绑定DeepSeek-R1，无疑是为了快速补齐技术和用户体验上的短板，并在AI搜索领域占据一席之地。然而，从长远来看，这更像是一场“借力”与“自立”的平衡游戏。那么，小红书为何要推出独立的AI搜索应用？点点接入DeepSeek-R1后，搜索能力有何提升？实际使用体...

来源：

AI新榜公众号【阅读原文】
Tags：AI搜索 DeepSeek-R1 小红书搜索体验生活决策

2个月前

标题：火山引擎推出AI云原生解决方案，DeepSeek-R1实现500万TPM与20ms TPOT云端部署及GPU优化性能突破

部署 DeepSeek 模型的潮流与趋势 DeepSeek 系列模型，尤其是推理模型 DeepSeek-R1 的部署已经成为不可忽视的趋势。AI 和云服务商纷纷采用这些模型来提供先进的 AI 服务，而许多企业和组织也通过部署 DeepSeek 模型来提升自身业务能力，如支持员工工作或增强服务质量。此外，一些学校也在引入 DeepSeek-R1 来辅助教育，并帮助学生建立正确的 AI 使用价值观。例如，中国人民大学、北京交通大学、浙江大学和上海交通大学等高校已经采用了本地部署「满血版」DeepSeek-R1 的做法。本地部署 vs. 云端部署的选择虽然本地部署提...

来源：

机器之心【阅读原文】
Tags：AI云原生 DeepSeek-R1 GPU优化云端部署火山引擎

2个月前

DeepSeek官方推荐：如何通过Temperature设置、文件上传和模型绕过思维优化R1性能，提升中文查询效果

如何优化部署DeepSeek-R1以获得最佳体验家人们，如何才能让DeepSeek-R1发挥出最佳性能？DeepSeek官方给出了详细的设置建议。以下是我们整理的四个关键设置步骤，帮助你更好地使用DeepSeek-R1。一、不使用系统提示词根据DeepSeek官方推荐，所有的指令应直接包含在用户提示词中，而不是通过系统提示词来传达。这种做法的原因在于R1模型是按照这种方式训练的，确保了更自然和一致的交互效果。二、调整Temperature参数为了防止输出重复或不一致，DeepSeek建议将Temperature参数设置为0.6。具体来说，官方文档指出，将T...

来源：

量子位【阅读原文】
Tags：DeepSeek-R1 Temperature设置中文查询模型绕过思维

2个月前

DeepClaude结合DeepSeek R1实现卓越的 Claude Sonnet 效果，开源项目GitHub揽星3k，LLM推理API助力高效开发

DeepSeek与Claude结合：超越单一模型的效果最近，一个名为DeepClaude的开源项目在GitHub上引起了广泛关注，已获得超过3000颗星。该项目通过将DeepSeek R1和Claude Sonnet 3.5模型相结合，实现了比单独使用任一模型更出色的效果。视频与测试结果展示一段VCR展示了这种缝合模型的强大功能，视频链接为：[点击查看](https：//mp.weixin.qq.com/s/vhv4Eb5XoA2d4LKRqVRQag?token=1656933192&lang=zh_CN)。此外，在代码编辑基准Polyglot Benchmark上的测评结果显示，缝合模型的表现超过了单独使用的o1-high和R1。实...

来源：

量子位【阅读原文】
Tags：Claude Sonnet DeepClaude DeepSeek-R1 LLM推理API 开源项目

2个月前

借助腾讯ima.copilot和DeepSeek-R1，轻松实现微信公众号资源导入与知识库管理，AI写作让内容创作更高效！

AI助力工作新升级：腾讯ima.copilot引入DeepSeek-R1 近日，AI领域又迎来了新的突破。腾讯旗下的智能工作平台ima.copilot（简称ima）正式引入了DeepSeek-R1模型，实现了“双模双待”的强大功能。这意味着用户可以在PC端和移动端享受到更加智能、高效的工作体验。 ima.copilot：集搜、读、写于一体的生产力工具 ima.copilot是腾讯于去年10月推出的一款以知识库为核心的生产力工具，主要功能包括搜索、阅读和写作。通过AI技术的加持，用户的知识获取和管理效率得到了显著提升。尤其值得一提的是，ima与微信公众号深度整合，能...

来源：

机器之心【阅读原文】
Tags：AI写作 DeepSeek-R1 微信公众号资源导入知识库管理腾讯ima.copilot

2个月前

阿里云PAI推出DeepSeek-V3与DeepSeek-R1模型部署服务，支持云上一键部署及高效推理框架

阿里云PAI Model Gallery支持一键部署DeepSeek-V3和DeepSeek-R1模型感谢IT之家网友的线索提供，阿里云计算有限公司近日宣布，其PAI Model Gallery平台已支持云上一键部署DeepSeek-V3和DeepSeek-R1模型。以下是详细的部署步骤：第一步：进入Model Gallery页面 1. 访问以下链接进入阿里云PAI控制台：[https：//pai.console.aliyun.com/#/quick-start/models](https：//pai.console.aliyun.com/#/quick-start/models)。 2. 登录后，在顶部左上角选择合适的地域。 3. 在左侧导航栏中选择“工作空间列表”，点击指定的工作空间...

来源：

IT之家【阅读原文】
Tags：DeepSeek-R1 Deepseek-v3 推理框架模型部署阿里云PAI

3个月前

一键部署、3分钟快速调用

深圳腾讯推出DeepSeek-R1大模型，轻松部署至腾讯云HAI平台 2024年2月2日，深圳市腾讯计算机系统有限公司宣布，其最新的DeepSeek-R1大模型现已支持一键部署到腾讯云的「HAI」平台上。这一创新举措极大地简化了开发者的接入流程，使得开发者仅需3分钟即可完成调用。据腾讯云官方介绍，通过「HAI」平台，开发者可以省去繁琐的配置步骤，如购买显卡、安装驱动程序、配置网络和存储、设置环境和框架以及下载模型等。现在，只需简单的两步操作，即可快速调用DeepSeek-R1模型。 DeepSeek-R1应用创建与调用指南以下是详细的创...

来源：

IT之家【阅读原文】
Tags：DeepSeek-R1 人工智能开发者工具模型部署腾讯云HAI

3个月前

华为云携手硅基流动推出基于昇腾云服务的DeepSeek-R1&V3 AI推理服务，赋能开源模型应用创新

华为云DeepSeek-R1开源引发全球关注，昇腾云服务助力推理服务上线据财联社2月1日报道，华为云官方公众号宣布，自DeepSeek-R1开源以来，迅速吸引了全球用户和开发者的广泛关注。为了满足市场需求，硅基流动与华为云团队经过多日的紧密合作，终于联合发布了基于华为云昇腾云服务的DeepSeekR1/V3推理服务。这一新服务的推出，不仅展示了华为云在人工智能领域的技术实力，也进一步推动了AI技术的普及和发展。值得注意的是，DeepSeekR1是一款高性能的开源模型，适用于多种应用场景，包括自然语言处理、图像识别等。此次发布的...

来源：

iFeng科技【阅读原文】
Tags：AI推理服务 DeepSeek-R1 华为云开源模型昇腾云服务

3个月前