标签:GPU
NVIDIA Blackwell助力DeepSeek-R1模型,通过TensorRT-LLM优化GPU推理性能,树立AI行业新标杆
随着科技的飞速发展,人工智能领域不断迎来新的突破。近日,英伟达在 NVIDIA GTC 2025 大会上宣布了一项重大成果:其 NVIDIA Blackwell DGX 系统成功创下 DeepSeek-R1 大模型推理性能的世界纪录。这项成就不仅展示了硬件与软件结合的强大潜力,还为未来的高性能计算奠定了坚实的基础。 具体来说,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行的 DeepSeek-R1 模型(参数规模达到 6710 亿)实现了每用户每秒超 250 token 的响应速度,系统最高吞吐量更是突破了每秒 3 万 token。这一性能的提升得益于 NVIDIA 平台在最新...
全球AI算力报告发布:机器学习硬件大揭秘,NVIDIA A100成LLM首选,谷歌TPU助力超100万H100等效算力,GPU与AI加速器竞争激烈
机器学习硬件的快速发展与趋势 随着人工智能(AI)技术的迅猛发展,其物质基础——机器学习硬件也取得了显著进步。目前全球已有超过140款AI加速器问世,广泛应用于深度学习模型的开发和部署。据Epoch AI发布的全球算力估计报告,通过公开信息分析了当前机器学习硬件的现状和未来趋势。 除了传统的硬件厂商如英伟达(NVIDIA)和AMD推出高性能加速卡外,一些新兴企业也开始自主研发芯片(「造芯」),进一步提升了算力水平。从2008年到2024年,全球机器学习硬件的计算能力呈现出快速增长的趋势。 硬件类型多样化及性能提升 ...
英伟达股价暴跌,官方回应DeepSeek新模型受出口管制影响及AI芯片与GPU的未来展望
深度解析:英伟达对DeepSeek新模型的评价及市场反应 北京时间1月28日,据彭博社报道,AI芯片巨头英伟达公司针对DeepSeek发布的新模型发表声明,称其为“出色的AI进步”,并强调该模型完全符合美国技术出口管制规定。英伟达在一份电邮声明中表示:“DeepSeek的研究成果展示了如何利用测试时计算扩展技术创建新模型,并充分利用广泛可用的模型和合规的算力资源。” 此次声明暗示,DeepSeek并未违反美国对于英伟达芯片的出口管制规定。尽管如此,英伟达在过去两年股价增长了四倍多,但在周一却遭遇了史上最大规模抛售潮之一,暴跌...
Nvidia 在人工智能领域的布局:探索其投资的顶级GPU驱动型初创公司
Nvidia引领人工智能投资热潮,助力AI生态系统发展 在当今的人工智能(AI)革命中,Nvidia无疑是最耀眼的明星之一。自2021年推出ChatGPT以来,Nvidia不仅在收入、盈利能力和现金储备方面实现了显著增长,还推出了多个具有竞争力的生成式AI服务。其股价更是在短短两年内飙升了八倍多。作为全球领先的高性能GPU制造商,Nvidia充分利用其不断膨胀的财富,大幅增加了对各种初创企业的投资,尤其是AI领域。 根据PitchBook的数据,2024年Nvidia参与了49轮AI公司融资,较2023年的34轮有显著增加。与前四年的总和相比,这是一个巨大...
埃隆·马斯克旗下 xAI 成功完成 60 亿美元 C 轮融资,英伟达和 AMD 等知名企业参投,推动人工智能与 GPU 技术发展
xAI 完成 60 亿美元 C 轮融资,加速人工智能基础设施建设 近日,由埃隆·马斯克创立的生成式人工智能公司 xAI 宣布成功完成了一轮高达 60 亿美元(约合 438.2 亿元人民币)的 C 轮融资。此次融资吸引了众多知名投资机构和科技巨头的参与,包括 A16Z、贝莱德、富达管理与研究公司、王国控股、光速创投、MGX、摩根士丹利、OIA、卡塔尔投资局(QIA)、红杉资本、Valor Equity Partners 以及 Vy Capital 等。特别值得一提的是,GPU 巨头英伟达和 AMD 也加入了本轮投资。 这是 xAI 自今年 5 月完成上一轮 60 亿美元融资后的又一...
知情人士透露:美国芯片禁令下,中企通过第三国采购GPU及AI芯片面临新出口管制挑战
12月13日,根据国内媒体的报道,美国政府正计划在本月底之前出台一项新的规定,旨在进一步加强对中国芯片行业的限制,特别是针对中国公司从非限制性第三方国家获取先进的AI芯片的行为。这项新政策的核心是加强对用于AI模型训练的图形处理单元(GPU)的全球出货管控。 消息来源透露,新的出口管制措施将重点关注GPU的全球供应链管理,目的是防止美国技术的“扩散”,确保美国在全球AI领域的领导地位。新措施预计将包含多个具体条款,例如限制GPU的出货地点,以阻止中国企业通过第三方国家绕过限制获取这些关键硬件。 目前,这...
庆祝ChatGPT发布2周年,深入解析OpenAI的GPT-1到Transformer技术演进及GPU的应用影响
导语 尽管ChatGPT在全球范围内掀起了AI革命,但很少有人了解其背后的诞生故事。近日,湛庐文化推出了一本关于“ChatGPT之父”山姆·奥尔特曼的新传记《奥尔特曼传》。本书作者周恒星基于与奥尔特曼长达十年的交流,首次全面、近距离地揭秘了这位科技巨头的AI帝国、权力之路和未来蓝图。在ChatGPT发布两周年之际,让我们一起走进书中的世界,跟随奥尔特曼的脚步,探寻GPT模型“从零到一”的诞生历程,致敬那些在创新道路上勇往直前的探索者们! 01 西部世界 2016年初的硅谷,空气中弥漫着焦虑的气息。科技公司IPO比例跌至过去七...
AI产业泡沫待破:红杉资本揭示年均6000亿硬件投入,GPU数据中心驱动的经济挑战
在最新的研究报告中,知名投资机构红杉资本的分析师大卫・卡恩揭示了人工智能(AI)产业可能面临的严峻挑战。他认为,AI行业的繁荣背后隐藏着巨大的经济泡沫,需要每年至少6000亿美元的产值来支撑其基础设施的运行成本。这个估算包括数据中心、专门的GPU加速卡等关键硬件设施的投入。 以英伟达为例,2023年其数据中心硬件收入达到了475亿美元,主要用于AI和高性能计算(HPC)应用。同时,亚马逊AWS、谷歌、Meta和微软等科技巨头也在AI领域投入巨资,然而这些投资短期内难以实现回报。卡恩通过计算英伟达的预测收入,并将其...
Arm Cortex-X925: 探索14核CPU与GPU的革命,Kleidi驱动的AI游戏新体验
在深入解析了Arm新一代CPU和GPU架构后,我们了解到更多有关Arm消费级计算终端平台的细节。此次,Arm改变了其产品线的命名规则,从Cortex-X1至X4的传统,转为Cortex-X925,旨在强调与前代相比的巨大性能提升。尽管新命名可能削弱超大核的独特性,但Arm确认X925仍定位为旗舰级别,且不会应用于非旗舰平台。此外,Cortex-X925与Immortalis-G925 GPU的名称匹配,暗示着CPU和GPU的打包销售策略。 Arm挑战传统观念,指出智能手机不再局限于8核CPU设计,新一代产品组合提供更具创新性的核心配置,如14核CPU设计,鼓励SoC厂商增加大...
中信证券:算力基础设施快速建设发展,将成为中长期AI应用的基石
在中信证券最近的研究报告中,专家指出人工智能(AI)正展现出前所未有的投资潜力,预估在未来的十年内,AI市场将实现数万亿美元的宏伟增长。当前,大规模模型正处于不断演进的关键时期,计算能力基础设施的加速建设是推动中长期AI应用发展的核心驱动力。预计在接下来的两到三年,无论是中国市场还是全球,算力市场的年复合增长率都将维持在30%至50%之间。这将带动GPU、高带宽存储、服务器、高速光模块以及端侧AI等相关产业的繁荣。同时,液冷技术、电力设备和国产算力的发展也将孕育出独特的投资机会,为投资者提供多样化的...