标签:高性能计算

中国银河证券分析:AI终端与高性能计算深度融合,重塑消费电子生态及推动具身智能与自动驾驶发展

整理后的 随着科技的不断进步,AI技术与终端硬件的结合正逐渐改变我们的生活。根据中国银河证券的研究报告指出,2025年第一季度,AI终端创新将展现出三大显著特点:高性能计算能力、轻量化设计趋势以及场景应用的多元化发展。这些创新成果将在CES 2025展会上得到集中展示,并成为推动AI技术从云端向设备端渗透的重要平台。 此外,这一趋势还将加速具身智能和自动驾驶等领域的商业化步伐。未来,AI与终端硬件的深度融合不仅会重塑消费电子行业的生态系统,还将进一步拓展人机协作的可能性,为用户带来更加智能化的体验。

标题:DeepGEMM结合Hopper架构优化矩阵乘法,即时编译助力高性能计算——DeepSeek开源第三弹V3/R1训练推理核心代码仅300行

DeepSeek开源第三弹:V3/R1训练推理关键秘籍,核心代码仅300行 2025-02-26 10:40:49 来源:量子位 作者:金磊 发自 凹非寺 在开源周的第三天,DeepSeek团队正式推出了其最新的训练推理优化工具——DeepGEMM。这款FP8 GEMM(通用矩阵乘法)库不仅支持密集矩阵和混合专家(MoE)矩阵运算,而且核心代码仅有约300行,却能实现卓越的性能。 深入了解GEMM GEMM(通用矩阵乘法)是线性代数中的基础运算,在科学计算、机器学习及深度学习领域中扮演着重要角色。由于其计算量巨大,GEMM的性能优化至关重要。DeepGEMM正是为...

C++技术大会圆满落幕:Bjarne Stroustrup领衔,聚焦高性能计算与系统软件,共话AI技术前沿

2024全球C++及系统软件技术大会圆满落幕 12月5日至6日,由CSDN与高端IT咨询与教育平台Boolan联合主办的「2024全球C++及系统软件技术大会」在上海虹桥万豪大酒店成功举行。在AI技术日益智能化的背景下,此次大会成为了行业了解C++和系统软件技术未来趋势的重要平台。 大会吸引了来自英伟达、Meta、SUSE、Adobe、英特尔、腾讯、阿里巴巴、字节跳动、百度、蚂蚁集团、网易、eBay、商汤、B站、快手、Qt Group、TiDB、OPPO、智元机器人、Zilliz等知名科技企业的40余位技术专家,以及中国科学院软件研究所、上海人工智能实验室、...

英伟达新一代 Blackwell GPU 出现过热问题,影响数据中心高性能计算交付进度

感谢IT之家网友 HH_KK 和华南吴彦祖提供的线索! 据《The Information》报道,英伟达新一代 Blackwell 处理器在高容量服务器机架中出现了严重的过热问题。这些问题导致设计调整和项目延期,使得谷歌、Meta 和微软等主要客户对是否能够按计划部署 Blackwell 服务器产生了担忧。知情人士透露,Blackwell GPU 主要用于人工智能(AI)和高性能计算(HPC),但在配置有 72 个处理器的服务器中出现了过热问题,每机架的功耗最高可达 120 千瓦。 过热问题迫使英伟达多次修改机架设计,这不仅限制了 GPU 的性能,还可能导致硬件损...