标签：AI模型

Tomshardware探讨：DeepSeek基于NVIDIA GPU的AI模型并未带来预期的人工智能奇迹，技术创新仍有待观察

中国AI初创公司DeepSeek引发全球关注近日，快科技报道了中国AI初创公司DeepSeek的崛起，不仅在美国硅谷引起了广泛关注，也让许多原本对AI不感兴趣的人开始关注中国的AI技术发展。尽管如此，国外知名硬件网站Tomshardware发表文章指出，DeepSeek的实际表现可能并没有宣传得那么具有颠覆性，AI领域不存在奇迹。 DeepSeek的资源投入与成本分析 DeepSeek最近因其先进的AI模型R1而成为科技界的焦点，该模型的计算资源使用量令人印象深刻。根据DeepSeek的官方声明，其训练成本仅为600万美元，并使用了2048个GPU。然而，行业分...

来源：

快科技【阅读原文】
Tags：AI模型 DeepSeek NVIDIA GPU 人工智能技术创新

2个月前

华为与DeepSeek强强联手，硅基流动携手推出全国产API，AI模型部署迎来白菜价零门槛新时代

华为与DeepSeek强强联手，硅基流动全国产API震撼发布近日，华为与DeepSeek携手推出了一款全新的国产大模型云服务平台——SiliconCloud（硅基流动）。该平台首发上线了基于华为云昇腾云服务的DeepSeek-V3和DeepSeek-R1两个版本，旨在为用户提供高性能、低成本的AI模型服务。此次合作不仅标志着国内AI技术的重大突破，也意味着用户可以享受到前所未有的零门槛部署体验。价格实惠，春节期间限时优惠为了让更多开发者和用户受益，SiliconCloud在春节期间推出了大幅度的价格优惠活动。具体收费标准如下： - DeepSeek-V3：输...

来源：

量子位【阅读原文】
Tags：AI模型 DeepSeek SiliconCloud 华为国产API

2个月前

首个OpenAI免费推理模型o3-mini震撼发布！DeepSeek引领AI模型开源新潮流，奥特曼也来反思：不开源我们错了

OpenAI发布首个免费推理模型o3-mini，DeepSeek引发行业反思近日，OpenAI深夜紧急发布了最新的推理模型系列——o3-mini，其中包括low、medium和high三个版本。这一举措不仅标志着OpenAI首次向用户免费推出推理模型，也引发了业内对开源AI模型的广泛讨论。一、o3-mini系列的亮点 o3-mini系列旨在推动低成本推理的边界，特别针对STEM（科学、技术、工程、数学）领域进行了优化。从正式版发布来看，它在多个方面表现出色： - 性能提升：相比前一代o1-mini，o3-mini在数学编码上的表现更为出色，响应速度更快，平均响应时间缩...

来源：

量子位【阅读原文】
Tags：AI模型 DeepSeek o3-mini OpenAI 开源

2个月前

DeepSeek利用AI模型R1独立发现成本控制核心思路，OpenAI首席研究官亲自证实，引发业内广泛关注，连奥特曼都不得不发声评论这一突破性进展！

DeeSeek掀起全球AI革命，改变科技格局短短几天内，DeeSeek凭借其R1模型在Hugging Face中的like数飙升，迅速登顶美国App Store榜首，引发了全球科技股的集体重挫。这股来自东方的力量展示了其强大的影响力。甚至连OpenAI首席研究官Mark Chen也不得不承认，DeepSeek确实独立发现了一些关键的AI核心理念，并且未来将发布更多模型。 OpenAI的回应与技术突破面对外界的各种分析，Mark Chen表示现代AI系统采用了「预训练」和「推理」两大范式，提供了更灵活的优化空间，在降低成本的同时提升模型性能。Noam Brown也强调，算...

来源：

新智元公众号【阅读原文】
Tags：AI模型 DeepSeek R1 强化学习成本控制

2个月前

阿里除夕新春发布Qwen2.5-Max，通义千问AI模型全面升级，轻松超越DeepSeek V3，助力开发者快速打造创意小游戏

阿里发布Qwen2.5-Max，性能超越DeepSeek V3及多个大模型农历除夕夜，阿里云旗下的通义千问（Qwen）团队发布了最新的Qwen2.5-Max模型，为新春佳节献上了一份特别的礼物。这款新模型在多个基准测试中表现优异，超越了当红炸子鸡DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o和Claude-3.5-Sonnet。多个基准测试中的卓越表现 Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等多个基准测试中均表现出色，尤其在MMLU-Pro等针对模型知识理解和推理能力的基准测试中，其表现尤为突出。该模型经过超过20万...

来源：

量子位【阅读原文】
Tags：AI模型 Deepseek-v3 Qwen2.5-Max 新春发布通义千问

2个月前

DeepSeek引发科技股震荡，砍掉英伟达台积电5万亿市值！Janus-Pro与AI模型助力多模态理解，登五大外媒头版，OpenAI紧急发布预告

智东西报道：国产AI新星DeepSeek掀起全球科技股震荡近日，一家来自中国的AI公司——DeepSeek，在硅谷和华尔街掀起了巨大波澜。1月28日，这家公司发布了全新的开源多模态AI模型Janus-Pro，进一步巩固了其在全球AI领域的地位。 DeepSeek的崛起引发美股科技股震荡自DeepSeek发布高性能、低成本的新模型R1以来，这家中国AI公司迅速成为全球关注的焦点。新模型不仅在性能上超越了OpenAI的DALL-E 3和Stable Diffusion，还在成本效益方面表现出色，被誉为“国产AI价格屠夫”。这一事件导致美股科技股大幅下跌，特别是英伟达、台积...

来源：

智东西【阅读原文】
Tags：AI模型 DeepSeek Janus-Pro 多模态理解科技股震荡

2个月前

苹果AI团队2025年重点：重建Siri底层技术，提升用户体验

根据彭博社记者马克·古尔曼的报道，苹果公司的一份内部备忘录泄露，揭示了这家科技巨头在人工智能领域的未来规划。据备忘录显示，苹果AI负责人John Giannandrea强调，2025年AI团队的工作重点将放在改进Siri的底层基础设施上。这意味着苹果正在着手重建其语音助手Siri的核心技术，为未来的更强大功能和更流畅的用户体验打下坚实基础。改进现有AI模型，确保稳定性和准确性备忘录中还提到，另一个工作重点是改进现有的AI模型。这一举措与苹果一贯坚持的渐进式迭代和改进风格相吻合。例如，最近通知摘要功能出现的问题，凸显...

来源：

快科技【阅读原文】
Tags：AI模型 Siri 大型语言模型 (LLM) 苹果语音助手

2个月前

深度体验AI零食：无印良品味道测试揭示食品创新的未来，AI模型助力味觉革命

AI食品创新：探索未来的味觉体验近年来，AI技术在食品行业的应用逐渐增多。亿滋国际（奥利奥的母公司）宣布开发一款全新的AI工具，用于旗下品牌的口味创新。这并非AI与食品公司首次合作，此前无印良品和可口可乐等品牌也推出了由AI设计的新品。尽管早期的AI零食评价褒贬不一，但这一趋势无疑展示了AI在食品研发中的潜力。为了深入了解AI零食的表现，小雷购买了无印良品推出的AI薯条，并与三款经典口味进行对比测试。这次测试不仅揭示了AI在口味创新上的优势，也暴露出其局限性。口味PK：人类与AI的较量无印良品的AI...

来源：

界面新闻【阅读原文】
Tags：AI模型 AI零食 WordPress 食品创新

3个月前

苹果智能AI，在关键领域表现不佳

12月20日，财联社报道，当中国股民热议苹果公司与某些科技公司洽谈AI模型合作的同时，海外投资者却在关注另一个问题：全球市值最高的上市公司——苹果公司的AI技术，在关键领域表现不佳。最近的案例中，英国广播公司（BBC）连续报道指出，苹果公司在英国新推出的“苹果智能”功能，错误地总结了BBC的新闻推送。具体来说，苹果AI推送的摘要错误地表示，近期因枪杀联合健康保险公司CEO而引起全球关注的路易吉·曼乔内“对自己开枪”——这一说法显然不实。这一错误不仅让媒体机构感到不满，而且苹果AI在推送错误总结时，看起来像是BBC...

来源：

iFeng科技【阅读原文】
Tags：AI模型时事新闻英国广播公司苹果智能错误总结

3个月前

亚马逊携手Olympus推进AI视频分析，打造基于AWS的高效能、高性价比服务模型

亚马逊研发新多模态AI模型Olympus，强化视频处理能力近日，据《信息报》报道，亚马逊正秘密研发一款名为Olympus的新一代多模态AI模型。这款模型不仅具备强大的文字理解能力，还在图像和视频分析领域展现出卓越的性能，特别是在视频场景理解和精准运动分析方面具有显著优势。知情人士透露，尽管Olympus在文本生成和解决复杂问题方面可能不及OpenAI和美国AI巨头Anthropic的最新语言模型，但亚马逊看重的是其在视频处理上的巨大潜力。亚马逊计划以更具竞争力的价格推出这一服务，旨在降低对Anthropic技术的依赖。目前，An...

来源：

智东西【阅读原文】
Tags：AI模型 AWS Olympus 亚马逊视频分析

4个月前

123 4 5