标签:AI模型

AI模型遭遇常识挑战:数字比较出错,9.11与9.9大小分辨,tokenizer与角色扮演提示揭示问题所在

在人工智能的世界里,即使是最新最先进的模型也可能面临尴尬的挑战。近期,一些顶级大模型在面对“9.11 和 9.9 哪个大”的简单问题时,竟然给出了错误的答案。GPT-4o 和谷歌的 Gemini Advanced 付费版都认为 9.11 更大,而 Claude 3.5 Sonnet 提供了荒谬的计算方法。这个问题揭示了尽管AI在复杂数学问题上的能力日益增强,但在基本常识方面仍有不足。 一位名叫 Riley Goodside 的提示词工程师发现了这个问题,他在测试 GPT-4o 时发现模型错误地认为 9.11 更大。当他尝试改变提问方式或限定为实数比较时,结果并未改善。有趣的...

苏妈掷48亿现金吞下AI模型公司,英伟达有的AMD也要有

AMD近期宣布以48亿人民币的全现金交易收购AI模型公司Silo AI,旨在强化自身在AI领域的实力。Silo AI是欧洲最大的私营AI实验室,由多名业界知名人士共同创立,拥有300名AI专家。此次收购将加速AMD在AI解决方案的采用,扩展其开源AI软件能力。Silo AI专注于定制化AI模型和端到端解决方案,服务包括安联、飞利浦等知名企业。AMD的这一举措表明其正积极扩大AI生态系统,与英伟达展开竞争。AMD高级副总裁Boppana表示,尽管交易不会立即影响财务,但有可能释放未来商业潜力。 Silo AI的CEO Peter Sarlin将继续领导团队,成为AMD A...

Meta的LLM Compiler:AI模型驱动的代码优化利器,提升编译效率与生成质量

在近日,Meta 推出了一项创新技术——LLM Compiler,这是一款基于Code Llama构建的新型代码优化工具。这款模型已经在Hugging Face平台上发布,提供了70亿和130亿参数两种版本,供学术界和商业领域免费使用。欲了解更多详情,敬请访问该项目的官方链接(点此进入)。 Meta指出,虽然当前的多种语言模型在处理编程任务时表现出色,但在代码优化方面仍有提升空间。LLM Compiler应运而生,它是一个专门针对代码优化任务设计的预训练模型,能效仿编译器对代码进行智能优化,甚至可以将优化过的代码还原为原始语言形式。 为了实现...

高通骁龙X Elite平台赋能:AI模型开放,神经处理单元驱动开发者创新中心

在科技日新月异的今天,高通公司近期在Computex大会上推出的骁龙 X Elite平台备受关注。尽管在发布会上,高通主要突显了该平台的AI能力,但要充分利用其Hexagon神经处理单元(NPU)的45 TOPS强大性能,离不开配套的AI软件。现在,高通已经为开发者准备了针对Hexagon NPU的定制化、优化和验证过的AI模型,这些资源可在高通的AI Hub获取,助力快速创建AI应用程序。 高通AI Hub不仅提供多样化的边缘设备优化AI模型,覆盖图像识别、物体检测、语义分割及创新AI等多个领域,还配备工具和文档,使开发者能轻松将AI模型应用于视觉...

AI功能仅两款iPhone能用!苹果被存储卡了脖子

近期,苹果新推出的Apple Intelligence特性引发关注,但由于存储空间的局限,该功能无法在所有设备上运行,揭示了苹果在端侧人工智能(AI)发展的存储困境。据业内专家郭明錤分析,只有iPhone 15系列中的高端型号15 Pro和Pro Max才能享受到Apple Intelligence的支持,关键因素可能是这些型号搭载的DRAM内存大小。 虽然A16芯片的AI处理能力强大,可达到17TOPS,但其6GB的DRAM容量相对较小,相比之下,M1芯片设备的8GB内存可以支持Apple Intelligence运行。Apple Intelligence需要大约0.7-1.5GB的DRAM空间,如果苹果计划采用...

为什么斯坦福大学生要抄袭中国大模型?

斯坦福大学AI团队涉嫌抄袭中国面壁智能公司开源成果的事件引发了广泛关注。该团队发布的大模型Llama3V被指与面壁智能的MiniCPM-Llama3-V2.5高度相似,后者在5月中旬发布。尽管模型开源允许二次开发,但未标明基于面壁智能成果的行为被批评为不诚实。面壁智能团队证实,他们的模型曾用于识别战国古文字,而斯坦福团队的模型不仅识别出了同样的文字,连错误也一致,坐实了抄袭嫌疑。事件特别之处在于涉及的两方——斯坦福大学和清华大学,都在全球AI领域具有重要地位。斯坦福团队成员已道歉,指出是由于团队内一人为了快速成名而...

【解读】费电但极具潜力的“大脑”:如何理解AI耗能问题?

1. Meta推出了新AI模型Llama3,其训练使用了比前代模型Llama2多8倍的H100 GPU,加剧了AI训练对电力的依赖。 2. AI发展的电力需求引发关注,OpenAI CEO、马斯克和黄仁勋等业界领袖警告,电力短缺可能成为AI发展的瓶颈,而AI的能耗远超预期。 3. AI的能耗分为软件和硬件两部分,硬件中的芯片制造尤其耗水,如台积电每年耗水约8000万吨。软件和硬件的能耗对比,AI尚未在能耗和成本上优于人脑。 4. AI的能耗产出比需综合考虑,其在各行业的应用潜力巨大,能提高生产力。专家探讨了AI能耗的计算方法和降低能耗的途径,包括改进硬...

全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用

在AI领域,一项重大突破引发热议,被誉为“真·Open AI”的LLM项目推出了首个开源GPT-4级模型——Llama3。这款模型迅速登上Hugging Face排行榜首,Meta公司共开源了Llama3的8B和70B两个版本,预训练和指令微调双版本。Llama3在定制集群上使用15万亿个token训练而成,即使是最小的8B版本,其性能也超越了Llama2的某些大版本。未来,Llama3还将推出更多版本。Llama3400B作为性能野兽,预训练版本在ARC-Challenge上得分高达96,指令微调版在多任务语言理解等方面表现出色。与GPT-4和其他模型对比,Llama3400B在多语言推理和代码生成...

AI日报:天工SkyMusic开启公测;UP主用AI技术“复活”巨人族;通义千问开源代码模型CodeQwen1.5;免费AI音乐生成工具Sonauto

昆仑万维推出两款创新AI模型——「天工3.0」和「天工SkyMusic」,公测开启,展现公司在AI领域的技术领先地位。其中,「天工3.0」作为全球最大开源MoE模型,拥有超过4000亿参数,提供多轮搜索和图表绘制等功能;而「天工SkyMusic」是中国首个音乐SOTA模型,支持多种方言,能进行端到端音乐生成。此外,CodeQwen1.5是基于Qwen1.5的代码模型,具备7B参数和92种编程语言支持,显著提升开发者效率。Spline发布的3D生成工具AI3D Generation,提供了直观界面和AI辅助设计,推动3D设计进步。CTRL-F-VIDEO项目则实现了视频内搜索,通过O...

OpenAI再陷巨大争议?Sora训练数据被质疑非法,CTO采访疯狂翻车

OpenAI的首席技术官(CTO)Murati近期在接受华尔街日报(WSJ)采访时,对新AI模型Sora的训练数据来源含糊其辞,引发了网络上的广泛讨论和版权争议。当被问及Sora的具体训练数据时,Murati的回答显得不确定,她表示使用了公开数据和已获许可的数据,但在面对具体如YouTube、Facebook、Instagram等平台的视频是否被用于训练时,她无法给出明确答案。科技评论家和网友质疑Murati可能在说谎,认为这暴露出OpenAI在数据使用上的潜在法律问题。OpenAI目前正面临多起诉讼,指控其在未获许可的情况下使用受版权保护的内容训练ChatGPT...
123